#数据可视化
tensorwatch - 数据科学和机器学习的实时可视化与调试工具
TensorWatchMicrosoft机器学习数据可视化Jupyter NotebookGithub开源项目
TensorWatch是由微软研究院开发的调试和可视化工具,专为数据科学、深度学习和强化学习设计。它运行在Jupyter Notebook中,提供实时的机器学习训练可视化和分析功能。其灵活的架构允许创建自定义的可视化、界面和仪表板,并支持独特的Lazy Logging模式进行实时查询和流式数据处理。TensorWatch支持多种图表类型和并行流可视化,是一个易于使用且可扩展的调试平台。
DeepBI - 多数据源支持的AI数据分析平台,实现数据查询与可视化
DeepBI数据分析平台人工智能数据可视化多平台支持Github开源项目
DeepBI是一款AI驱动的数据分析平台,利用大语言模型进行数据探索、查询、可视化和共享。平台支持对话获取数据结果,生成持久化查询与可视化,兼容MySQL、PostgreSQL、Doris、StarRocks等多种数据源,并支持Windows、Linux、Mac等操作系统。
pandas-ai - 高效数据处理与自然语言交互平台
PandasAIPython数据可视化自然语言处理数据分析Github开源项目热门
PandasAI是一个强大的Python平台,专为非技术用户设计,通过自然语言轻松查询数据。它不仅帮助技术用户节省时间,还通过Jupyter notebooks或借助FastAPI和Flask轻松部署为REST API。想要了解更多PandasAI Cloud或企业版服务,欢迎联系我们获取详细信息。
mage-ai - 现代化的数据管道工具,替代传统工作流程控制系统
Mage数据管道Airflow替代数据集成数据可视化Github开源项目热门
Mage 提供了一种现代化的数据管道工具,旨在替代 Airflow,简化开发体验,支持 Python、SQL 和 R,实现数据的实时和批量处理。Mage 让您的数据团队可以在不牺牲监控和可观测性的情况下,轻松构建、预览和启动数据管道,甚至在小团队中也能高效管理数千个管道。
ChainForge - 开源视觉编程环境,用于测试和评估大型语言模型的提示效果
ChainForgeLLMPrompt Engineering数据可视化开源Github开源项目
ChainForge是一个开源视觉编程环境,适用于大型语言模型(LLMs)。它支持同时查询多个模型、对比不同提示和模型设置下的响应质量,提供评估指标设置与结果可视化,助力用户选择最适合的提示和模型。适合于快速探索提示及评估聊天响应。目前处于开放beta阶段,支持多家知名模型提供商,包括OpenAI、HuggingFace及Google PaLM2等。
dataline - 通过自然语言完成数据分析与可视化
DataLine数据分析数据可视化AI开源Github开源项目
DataLine通过自然语言功能,让用户无需编写代码即可进行数据分析和可视化。该工具支持多种数据源连接,如Postgres、Snowflake、MySQL、Azure SQL Server、Microsoft SQL Server、Excel、SQLite、CSV等,并且十分注重隐私保护和安全性。DataLine的开放源码特性及多平台支持(Windows、Mac、Linux和Docker)使其成为技术人员和非技术人员的理想选择,特别适合企业使用。
phospho - 用于 LLM 应用程序的文本分析平台
phospho文本分析LLM应用数据可视化自动评估Github开源项目
Phospho 是为LLM应用设计的文本分析平台,提供灵活的日志记录、自动评估、洞察提取和数据可视化等功能,帮助开发者发现问题和提取用户反馈,从而评估应用的效果。借助phospho,开发者可以安心地在生产环境中部署LLM应用,并通过用户反馈不断优化对话体验。该平台支持Python和JavaScript客户端,方便快速集成和自动处理批量信息事件。用户还可以在注册托管版本后,在协作平台上管理phospho实验室的评估工作。
wandb - 专注于机器学习流程优化的工具
Weights & Biases机器学习模型训练数据可视化模型管理Github开源项目
Weights & Biases(简称W&B)是一个专注于机器学习流程优化的工具,它通过追踪和可视化机器学习的各个阶段——从数据集处理到模型部署——以提高开发效率。W&B 允许用户在一处平台上管理和比较多个实验,便捷地监控实验的运行效果及进度。
machine_learning_complete - 机器学习综合教程,涵盖数据处理至深度学习全流程
机器学习深度学习数据分析人工智能数据可视化Github开源项目
machine_learning_complete是一个全面的机器学习资源库,包含35个详细的笔记本教程,覆盖了从Python编程到数据分析、机器学习和深度学习的全面技能。项目自2021年起不断更新,加入了最新的MLOps指南,适合各级别学者和开发人员。
viz-gpt - 使用聊天界面从表格数据集进行上下文数据可视化的工具
VizGPT数据可视化自然语言处理交互式聊天界面图表生成Github开源项目
VizGPT结合人工智能与自然语言处理,可生成图表并让用户通过聊天界面编辑,使数据可视化更灵活和互动。与当前市场上的其他视觉产品如Tableau相比,VizGPT的聊天界面交互提供了无需先行专业知识即可构建和调整可视化的便利。
chatgpt-history-export-to-md - 将ChatGPT历史记录转换为格式化的Markdown文件的工具
Convoviz数据可视化ChatGPT历史Markdown文件PythonGithub开源项目
chatgpt-history-export-to-md工具将ChatGPT历史记录转换为格式化的Markdown文件,并能通过词云和图表进行数据可视化。该工具支持YAML头文件、消息版本跟踪、代码解释器和自定义指令等功能,并提供详细的安装和使用说明,帮助轻松导出和查看ChatGPT数据。适用于Python 3.8.7及以上版本,能无缝集成到其他项目中。
rl-plotter - 绘制强化学习训练曲线的工具
rl-plotter强化学习学习曲线日志记录器数据可视化Github开源项目
rl-plotter 是一个简单的工具,可以轻松绘制强化学习训练曲线。支持自定义记录器、多实验绘图和多种绘图样式,兼容 OpenAI-baseline 和 OpenAI-spinningup。用户可以通过命令行方式绘制结果,并对图表进行个性化设置,如平均分组和阴影标准偏差。适用于研究人员和开发者追踪和可视化强化学习训练过程,提升工作效率和结果质量。
meerkat - 专为可视化、探索和注释各类数据集而设计的开源Python库
Meerkat数据可视化未结构化数据机器学习模型开源库Github开源项目
Meerkat是一个开源的Python库,专为可视化、探索和注释各类数据集而设计,特别适合处理非结构化数据类型(如文本、PDF、图像和视频)。Meerkat支持与Pandas、Arrow和HF Datasets无缝整合,无需数据移动。用户能够使用简洁的Python代码嵌入机器学习模型,实现搜索、分组和自动完成等功能。借助Meerkat的高度定制化可视化组件,适用于探索性数据分析和快速验证数据标注等多种应用场景。
Streamline-Analyst - AI数据分析工具,自动化处理全流程数据
Streamline Analyst数据分析模型选择数据可视化自动化工作流程Github开源项目
Streamline Analyst 是一个基于大型语言模型的开源数据分析应用,旨在提高数据分析效率。它自动执行数据清洗、预处理和其他复杂任务,如识别目标对象、划分测试集以及选择最佳模型。用户只需进行简单的操作,即可快速得到高质量的视觉化结果和模型。此工具确保数据隐私和安全,同时未来将增加自然语言处理、神经网络和对象检测等更多高级功能。
highcharts - 基于SVG和Canvas/WebGL的JavaScript交互式图表库
HighchartsJavaScript图表库SVG数据可视化开源软件Github开源项目
Highcharts JS是一个基于SVG和Canvas/WebGL的JavaScript图表库,支持多种安装方式如CDN、npm和ES6模块。它允许创建自定义构建以优化性能,并为开发者提供修改和调试工具。作为source available软件,Highcharts需要适当许可。该库以其灵活性和丰富的图表选项而著称,适用于各种数据可视化需求。
echarts - 开源JavaScript数据可视化解决方案
Apache ECharts数据可视化JavaScript库图表制作开源项目Github
Apache ECharts是一个开源的JavaScript数据可视化库,提供直观、交互式和可定制的图表功能。基于轻量级画布库zrender开发,ECharts支持多种图表类型,具有简单易用的API和丰富的文档示例。该库还提供3D绘图、地球可视化和WebGL加速等扩展功能,适用于多样化的数据可视化需求。ECharts以其强大的功能和灵活性成为数据可视化领域的重要工具。
chart-gpt - AI驱动的文本转图表工具,快速生成精美图表
Chart-GPT数据可视化AI生成图表开源项目开发工具Github
Chart-GPT是一款AI驱动的开源工具,能够快速将文本转化为精美的图表。它利用先进的自然语言处理技术和PaLM API,自动解析输入内容,并生成适合的数据可视化效果。无论是商业报告、学术研究还是日常数据分析,Chart-GPT都能帮助使用者快速创建专业、美观的图表,提高工作效率和数据展示质量。作为一个开源项目,Chart-GPT为数据可视化领域带来了创新的解决方案。
visidata - 终端界面的多功能表格数据处理工具
VisiData数据可视化终端工具表格数据处理开源软件Github开源项目
VisiData是一款基于终端界面的表格数据处理工具,支持tsv、csv、sqlite、json、xlsx等多种格式。它提供直观的操作界面,便于快速浏览、筛选和分析大量数据。VisiData支持数据排序、过滤、统计等常用操作,适用于日志分析、数据清洗等任务。该工具适用于Linux、OS/X和Windows(WSL)平台,运行环境为Python 3.8+。VisiData通过高效的数据处理能力和灵活的命令系统,为数据分析和开发工作提供便利。
grist-core - 结合数据库健壮性和电子表格灵活性的开源协作工具
Grist关系型电子表格开源软件数据可视化Python公式Github开源项目
Grist-core是一款开源的电子表格托管服务器,融合了电子表格的灵活性和数据库的健壮性。它支持Python公式、可移植格式、拖放式仪表板等功能,可自行部署并提供沙箱选项。Grist-core适合需要高度定制和安全性的电子表格解决方案,为用户提供了强大的数据管理和分析工具。
great-tables - 强大而简便的Python表格生成库
Great TablesPython表格生成数据可视化DataFrameGithub开源项目
Great Tables是一个功能丰富的Python库,用于创建和自定义表格。该库支持灵活组合各种表格元素,包括表头、表尾和行标签等,并提供多样的单元格格式化选项。Great Tables可处理Pandas或Polars DataFrame数据,支持在多种环境中渲染表格。其设计注重简洁性和实用性,适用于各类表格展示场景。
data-science - 数据科学初学者实践教程集合
数据科学PythonJavaScript数据分析数据可视化Github开源项目
Data Science for Beginners项目提供了一系列Jupyter Notebooks和网页开发代码,涵盖数据科学完整工作流程。项目使用Python、HTML5和JavaScript(特别是D3.js),展示了scikit-learn和PyCaret等工具的应用。内容包括数据收集、预处理、分析、文本分析和可视化,适合数据科学初学者学习实践。项目还包含数据叙事部分,指导如何改进数据可视化,以及提供了作者Medium博客和Observable个人资料的链接,供进一步学习。
mplcyberpunk - Matplotlib 图表赛博朋克风格增强库
mplcyberpunk数据可视化Python库Matplotlibcyberpunk风格Github开源项目
mplcyberpunk 是一个 Matplotlib 扩展库,能够快速为图表添加赛博朋克风格效果。该库提供暗色背景主题,支持线条发光、底部光晕等视觉特效,适用于折线图、散点图和柱状图。mplcyberpunk 还支持自定义渐变填充,可创建富有未来感的数据可视化图表。
datacap - 多源数据管理与分析可视化平台
DataCap数据集成数据可视化数据转换数据库连接器Github开源项目
DataCap是一个开源的数据管理与分析平台,支持多种数据源和数据库类型。该平台集成了数据转换、集成和可视化功能,能够高效处理大数据、关系型和NoSQL数据库。DataCap提供丰富的数据库连接器,包括ClickHouse、MySQL和PostgreSQL等主流数据库,方便用户进行多源数据管理、转换、图表制作和监控。
SciencePlots - 专业科学图表样式库 助力学术数据可视化
SciencePlotsMatplotlib数据可视化科学绘图PythonGithub开源项目
SciencePlots是一个基于Matplotlib的科学图表样式库,提供多种预设样式用于生成适合学术论文和演示的专业图表。它支持IEEE、Nature等期刊格式,包含丰富的颜色方案,并兼容中文等多种语言。通过简单的配置,研究人员可以快速创建美观的数据可视化,有效提升科研成果的展示质量。该库还具备灵活的自定义功能,满足不同学科的图表需求。
panel - Python数据探索和Web应用开发框架
PanelPython数据可视化交互式应用仪表板Github开源项目
Panel是一个开源Python库,专注于数据探索和Web应用开发。它整合了PyData生态系统和数据表格功能,提供了高级响应式API和低级回调API,适用于快速构建探索性应用和复杂的交互式多页面应用。作为HoloViz生态系统的组成部分,Panel为开发者提供了连接各种数据可视化和分析工具的统一接口。
deepdataspace - 开源计算机视觉数据集工具 提供可视化 标注和分析功能
DeepDataSpace数据可视化数据标注模型分析开源数据集工具Github开源项目
DeepDataSpace是一个开源计算机视觉数据集工具,提供交互式数据可视化、探索和智能标注功能。支持多平台和协作工作流,易于安装使用。通过直观界面帮助用户高效管理和分析大规模图像数据集,适用于CV项目开发和研究。
scatter-gl - WebGL驱动的交互式3D/2D散点图渲染库
ScatterGL3D绘图数据可视化WebGL交互式图表Github开源项目
scatter-gl是一个基于WebGL的开源3D/2D散点图渲染库,源自TensorFlow的嵌入投影仪。它能高效渲染和交互处理数万个数据点,支持多种渲染模式和自定义样式。scatter-gl适用于大规模数据可视化,开发者可通过npm或CDN轻松集成,实现高性能的交互式数据展示。
plotly.py - Python交互式数据可视化库 支持多种科学与统计图表
plotly.py数据可视化Python库交互式图表开源Github开源项目
plotly.py是基于plotly.js的开源Python数据可视化库,提供超过30种科学、统计和金融图表类型。它支持在Jupyter、HTML文件和Dash应用中创建交互式图表。该库采用声明式API,简单易用且灵活。plotly.py具备静态图像导出功能,并有详细文档和活跃的社区支持。基于MIT许可发布,适用于各类数据分析和可视化需求。
plot_demo - Python数据可视化示例集合 为论文插图绘制提供参考
Python画图matplotlib数据可视化图表类型画图示例Github开源项目
该项目提供多样化的Python数据可视化示例,包括折线图、柱状图、散点图等基础图表,以及3D图像和组合图等高级图表。项目为研究人员和数据分析师提供了实用的代码示例,便于创建论文插图。此外,项目还涵盖了patchworklib和t-SNE等高级可视化技术的应用,并提供了matplotlib进阶使用和可视化技巧的相关资源链接。
gif_your_nifti - NIfTI脑部影像数据转换GIF动画工具
NIfTIGIF生成脑成像数据可视化Python工具Github开源项目
gif_your_nifti是一个将NIfTI格式脑部影像数据转换为GIF动画的开源工具。支持灰度、伪彩色、深度和RGB等多种模式,提供大小调整等选项。用户可通过命令行或Python脚本使用,适用于科研展示和医学影像分析。工具依赖常用Python库,安装简便,支持Docker部署。
chart-fx - 高性能科学图表库 实现25Hz实时数据可视化
ChartFx图表库数据可视化JavaFX实时渲染Github开源项目
ChartFx是一款高性能科学图表库,专注于实时数据可视化。基于JavaFX开发,支持25Hz更新率,可处理大规模数据集。提供多种科学信号处理绘图类型、插件系统和参数测量功能,兼具功能丰富性和性能优化。适用于需要高速数据处理和展示的科研应用场景。
umap - 先进的流形学习和数据降维算法
UMAP降维数据可视化机器学习聚类Github开源项目
UMAP是一种高效的非线性降维和数据可视化算法。它能处理大规模高维数据,支持多种距离度量,可用于监督和半监督学习。UMAP在保持数据全局结构方面表现优异,运行速度快,理论基础扎实。该项目还包含densMAP功能,可在降维同时保留局部密度信息。作为t-SNE的有力替代,UMAP适用于多种机器学习场景。
arckit - Python工具包简化抽象推理语料库数据处理
ARC数据集Python工具数据可视化机器学习命令行工具Github开源项目
arckit是一个处理抽象推理语料库(ARC-AGI)数据集的Python工具包。它提供数据加载接口、矢量图形可视化和模型评估功能。支持数据加载、任务交互和可视化创建,并通过命令行工具实现任务图像的快速查看与保存。arckit兼容多个数据集版本,为ARC数据处理提供了便捷解决方案。
wttr.in - 终端便捷查询全球实时天气和预报
天气查询命令行工具wttr.in多语言支持数据可视化Github开源项目
wttr.in是一个面向终端的天气预报服务,支持多种信息展示方式。用户可通过curl等命令行工具获取ANSI格式的天气信息,也支持HTML和PNG输出。该服务提供全球任意地点的实时天气和预报,包括温度、湿度、风速等详细数据。wttr.in还具备一行简洁输出、地图视图等功能,支持多语言。作为一个功能丰富的开源项目,wttr.in为开发者和终端用户提供了便捷的天气查询方案。
drawdata - 交互式数据可视化工具 轻松绘制分析机器学习数据集
drawdataJupyter数据可视化机器学习Python库Github开源项目
drawdata是一个Python库,为Jupyter notebook提供交互式数据绘制工具。基于anywidget构建,兼容Jupyter、VSCode和Colab环境,支持ipywidgets集成。可绘制散点图并导出为pandas或polars数据框,方便用于scikit-learn机器学习任务。适用于教学和快速数据分析场景,简化数据集创建和操作过程。
smile - Java与Scala的高性能机器学习引擎
Smile机器学习数据可视化自然语言处理分类算法Github开源项目
Smile是一个高效且全面的机器学习系统,支持Java和Scala,包含自然语言处理、线性代数、图形、插值和可视化功能。其先进的数据结构和算法提供卓越性能,涵盖分类、回归、聚类、关联规则挖掘、特征选择、多维缩放、遗传算法、缺失值插补和高效近邻搜索等领域。用户可以通过Maven中央库使用,并在Smile网站找到编程指南和详细信息。
相关文章
TensorWatch: 微软开源的机器学习调试与可视化工具
2024年08月30日
Mage AI: 开源数据管道工具的魔法力量
2024年08月30日
TensorWatch:微软开源的机器学习调试与可视化工具
2024年08月30日
DeepBI:基于大语言模型的AI原生数据分析平台
2024年08月30日
TensorWatch:微软开源的机器学习调试与可视化工具
2024年08月30日
DeepBI:基于大语言模型的新一代智能数据分析平台
2024年08月30日
Smile: 强大的机器学习和数据科学库
2024年08月30日
ChainForge:开源可视化提示工程和LLM假设测试工具包
2024年08月30日
Mage-AI: 打造魔法般的数据管道
2024年08月30日