#数据管道

Klio: Spotify的智能音频数据处理利器

3 个月前
Cover of Klio: Spotify的智能音频数据处理利器

Indexify:为结构化和非结构化数据打造的实时提取和索引引擎

3 个月前
Cover of Indexify:为结构化和非结构化数据打造的实时提取和索引引擎

Indexify: 革新LLM应用的实时数据处理框架

3 个月前
Cover of Indexify: 革新LLM应用的实时数据处理框架

WebDataset:高性能的大规模深度学习数据处理库

3 个月前
Cover of WebDataset:高性能的大规模深度学习数据处理库

Instill Core: 全栈AI基础设施工具助力构建AI应用

3 个月前
Cover of Instill Core: 全栈AI基础设施工具助力构建AI应用

Mage AI: 开源数据管道工具的魔法力量

3 个月前
Cover of Mage AI: 开源数据管道工具的魔法力量

Mage-AI: 打造魔法般的数据管道

3 个月前
Cover of Mage-AI: 打造魔法般的数据管道
相关项目
Project Cover

mage-ai

Mage 提供了一种现代化的数据管道工具,旨在替代 Airflow,简化开发体验,支持 Python、SQL 和 R,实现数据的实时和批量处理。Mage 让您的数据团队可以在不牺牲监控和可观测性的情况下,轻松构建、预览和启动数据管道,甚至在小团队中也能高效管理数千个管道。

Project Cover

graphrag

GraphRAG是一个革新的数据管道和转换套件,旨在利用大型语言模型(LLMs)的力量从非结构化文本中提取有意义的结构化数据。该项目通过加快索引过程并优化提示调整,提供在Azure上的端到端用户体验,有效增强LLMs处理私有数据的能力。此外,GraphRAG的研究和开发还专注于推动负责任的AI使用,确保用户能够最大限度地发挥系统的潜力并减少限制的影响。

Project Cover

instill-core

探索instill-core,该全栈AI基础架构工具旨在简化AI驱动应用的数据、模型及数据流水线编排。了解更多详情,请参阅官方文档。

Project Cover

webdataset

WebDataset是一种高性能的数据管理工具,专为大规模深度学习任务设计。它支持从本地存储和云对象存储读取数据,兼容PyTorch、TensorFlow和JAX。WebDataset能高效处理和读取多种格式的数据集,如图像、音频和视频,极大地提升I/O性能并简化数据预处理。其优势包括低延迟、无需本地存储及并行数据访问,适用于不同规模的深度学习任务。

Project Cover

bento

Bento是一个高性能的流处理工具,可连接多种数据源和目标。它支持多种中介模式,能对数据进行处理和转换。Bento提供强大的映射语言,易于部署和监控。它可作为二进制文件、Docker镜像或无服务器函数使用,适配多种云服务和数据系统。Bento保证至少一次的数据传输,并提供健康检查、指标监控和分布式追踪功能。

Project Cover

dlt

dlt是一个开源Python库,旨在简化数据加载过程。它具备自动模式生成、数据规范化和增量加载功能,可集成到多种环境中。支持从快速数据探索到复杂生产环境的应用,并提供多种验证源和目标。dlt的灵活性和可扩展性使其能够有效处理不断增长的数据需求,适合各类数据处理任务。

Project Cover

alloy

Grafana Alloy是开源的OpenTelemetry收集器分发版,支持指标、日志、跟踪和配置文件。它具有可编程管道、多种遥测生态系统支持、Kubernetes原生集成、可共享管道和集群功能。Alloy提供集中式配置管理和内置UI,便于可观测性管道的调试和可视化。

Project Cover

klio

Klio是基于Apache Beam构建的数据管道生态系统,专门用于处理音频和二进制文件。该系统支持批处理和流式处理,主要应用于大规模音频智能系统。Klio源自Spotify,用于开发和部署新一代音频算法。它为工程师和研究人员提供了一个简化音频处理任务的平台。

Project Cover

rags

RAGs是一个基于Streamlit的应用程序,使用自然语言从数据源创建RAG管道。用户可以描述任务和参数,查看和修改生成的参数,并通过RAG代理查询数据。项目支持多种LLM和嵌入模型,默认使用OpenAI构建代理。该应用程序提供了一个标准的聊天界面,能够通过Top-K向量搜索或总结功能满足查询需求。了解更多关于安装和配置的信息,请访问GitHub页面或加入Discord社区。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号