LIDA - 数据可视化的AI助手 🎨
LIDA(Learning Intelligent Distribution Agent)是微软开发的一个开源库,用于自动生成数据可视化和信息图表。它利用大语言模型(LLM)的强大能力,将数据分析和可视化过程自动化,为用户提供便捷的数据探索和展示工具。
主要特性
LIDA具有以下核心功能:
- 数据摘要:自动生成数据集的摘要描述
- 目标生成:根据数据内容提出可视化目标
- 可视化生成:基于目标自动生成可视化代码
- 可视化编辑:通过自然语言指令修改可视化
- 可视化解释:生成可视化代码的自然语言解释
- 可视化评估与修复:评估可视化质量并提出改进建议
- 可视化推荐:推荐适合的可视化方案
- 信息图表生成:创建富有设计感的信息图表(Beta)
LIDA支持多种编程语言和可视化库(如matplotlib、seaborn等),可以与OpenAI、Azure OpenAI、PaLM等多个LLM提供商对接。
快速上手
-
安装LIDA:
pip install lida
-
设置API密钥:
export OPENAI_API_KEY=<your key>
-
基本使用:
from lida import Manager, llm lida = Manager(text_gen = llm("openai")) summary = lida.summarize("data/cars.csv") goals = lida.goals(summary, n=2) charts = lida.visualize(summary=summary, goal=goals[0])
学习资源
Web UI和API
LIDA提供了一个内置的Web UI和API,可以通过以下命令启动:
lida ui --port=8080 --docs
然后在浏览器中访问 http://localhost:8080/ 即可使用Web界面。
高级用法
-
使用本地LLM: LIDA可以与Hugging Face等本地LLM模型对接,详见文档。
-
生成信息图表:
infographics = lida.infographics(visualization = charts[0].raster, n=3, style_prompt="line art")
-
自定义可视化:
instructions = ["convert this to a bar chart", "change the color to red"] edited_charts = lida.edit(code=code, summary=summary, instructions=instructions)
LIDA为数据分析师和可视化开发者提供了一个强大的AI助手,极大地简化了数据可视化的流程。无论是快速探索数据,还是创建精美的信息图表,LIDA都能提供宝贵的帮助。现在就开始尝试LIDA,让AI为你的数据可视化工作赋能吧! 🚀