Logo

#数据管道

instill-core学习资料汇总 - 全栈AI基础设施工具

1 个月前
Cover of instill-core学习资料汇总 - 全栈AI基础设施工具

mage-ai学习资源汇总 - 现代化的Airflow替代方案

1 个月前
Cover of mage-ai学习资源汇总 - 现代化的Airflow替代方案

Prefect: 简化工作流程编排的Python框架

2 个月前
Cover of Prefect: 简化工作流程编排的Python框架

Ploomber:打造高效数据流水线的利器

2 个月前
Cover of Ploomber:打造高效数据流水线的利器

Apache Airflow: 强大的工作流调度与管理工具

2 个月前
Cover of Apache Airflow: 强大的工作流调度与管理工具

GraphRAG学习资料汇总 - 基于图的检索增强生成系统

1 个月前
Cover of GraphRAG学习资料汇总 - 基于图的检索增强生成系统

Pachyderm: 数据驱动的自动化数据转换与版本控制平台

2 个月前
Cover of Pachyderm: 数据驱动的自动化数据转换与版本控制平台

DUD: 一个用于数据版本控制和管理的创新工具

2 个月前
Cover of DUD: 一个用于数据版本控制和管理的创新工具

Murex: 智能化的新一代 Shell 和脚本环境

2 个月前
Cover of Murex: 智能化的新一代 Shell 和脚本环境

LineaPy: 从数据科学原型到生产级流水线的快速转换工具

2 个月前
Cover of LineaPy: 从数据科学原型到生产级流水线的快速转换工具

相关项目

Project Cover
mage-ai
Mage 提供了一种现代化的数据管道工具,旨在替代 Airflow,简化开发体验,支持 Python、SQL 和 R,实现数据的实时和批量处理。Mage 让您的数据团队可以在不牺牲监控和可观测性的情况下,轻松构建、预览和启动数据管道,甚至在小团队中也能高效管理数千个管道。
Project Cover
graphrag
GraphRAG是一个革新的数据管道和转换套件,旨在利用大型语言模型(LLMs)的力量从非结构化文本中提取有意义的结构化数据。该项目通过加快索引过程并优化提示调整,提供在Azure上的端到端用户体验,有效增强LLMs处理私有数据的能力。此外,GraphRAG的研究和开发还专注于推动负责任的AI使用,确保用户能够最大限度地发挥系统的潜力并减少限制的影响。
Project Cover
instill-core
探索instill-core,该全栈AI基础架构工具旨在简化AI驱动应用的数据、模型及数据流水线编排。了解更多详情,请参阅官方文档。
Project Cover
webdataset
WebDataset是一种高性能的数据管理工具,专为大规模深度学习任务设计。它支持从本地存储和云对象存储读取数据,兼容PyTorch、TensorFlow和JAX。WebDataset能高效处理和读取多种格式的数据集,如图像、音频和视频,极大地提升I/O性能并简化数据预处理。其优势包括低延迟、无需本地存储及并行数据访问,适用于不同规模的深度学习任务。
Project Cover
bento
Bento是一个高性能的流处理工具,可连接多种数据源和目标。它支持多种中介模式,能对数据进行处理和转换。Bento提供强大的映射语言,易于部署和监控。它可作为二进制文件、Docker镜像或无服务器函数使用,适配多种云服务和数据系统。Bento保证至少一次的数据传输,并提供健康检查、指标监控和分布式追踪功能。
Project Cover
alloy
Grafana Alloy是开源的OpenTelemetry收集器分发版,支持指标、日志、跟踪和配置文件。它具有可编程管道、多种遥测生态系统支持、Kubernetes原生集成、可共享管道和集群功能。Alloy提供集中式配置管理和内置UI,便于可观测性管道的调试和可视化。
Project Cover
klio
Klio是基于Apache Beam构建的数据管道生态系统,专门用于处理音频和二进制文件。该系统支持批处理和流式处理,主要应用于大规模音频智能系统。Klio源自Spotify,用于开发和部署新一代音频算法。它为工程师和研究人员提供了一个简化音频处理任务的平台。
Project Cover
lineapy
LineaPy是一个开源Python工具,用于捕获、分析和转换数据科学工作流程。通过跟踪代码执行序列,LineaPy能够理解代码及其上下文,提供一套工具来清理混乱的笔记本、追溯以往工作和构建数据管道。只需两行代码,就可将复杂的工作流程转化为整洁的数据管道,帮助数据科学家更高效地将工作投入生产。
Project Cover
rags
RAGs是一个基于Streamlit的应用程序,使用自然语言从数据源创建RAG管道。用户可以描述任务和参数,查看和修改生成的参数,并通过RAG代理查询数据。项目支持多种LLM和嵌入模型,默认使用OpenAI构建代理。该应用程序提供了一个标准的聊天界面,能够通过Top-K向量搜索或总结功能满足查询需求。了解更多关于安装和配置的信息,请访问GitHub页面或加入Discord社区。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号