Project Icon

venice

全球工作负载的衍生数据存储平台

Venice是一个衍生数据存储平台,提供高吞吐量的批处理和流处理数据异步摄取,低延迟的在线读取,基于CRDT的区域间主动主动复制,多集群支持和多租户水平伸缩能力。适用于Feathr等特征存储,支持离线、近线和在线工作负载的多种写操作和读取API,具有分片感知和本地缓存功能的客户端模式,满足不同性能和成本需求。

datahub - 现代数据栈的开源元数据管理平台
DataHubGithub元数据管理开源项目数据发现平台数据目录
DataHub是一款开源数据目录平台,为现代数据栈提供全面的元数据管理。它支持数据发现、治理、血缘分析,集成多种数据源,并具备实时更新能力。DataHub采用灵活的元数据模型,支持GraphQL API,易于扩展和集成。通过提升数据资产的可见性和可用性,DataHub为数据团队创造价值。
LakeSail - 统一批处理、流处理和AI工作负载的开源框架
AI工作负载AI工具Sail大数据处理开源框架性能优化
LakeSail是一个统一批处理、流处理和AI工作负载的开源框架。基于Rust开发,相比Spark,它提供4倍处理速度和94%硬件成本节省,无需代码修改即可迁移。该平台具有高互操作性和可观察性,为开发者提供高性能、安全和并发的编程环境,适合大数据和AI应用开发。
lancedb - 高效管理与检索嵌入的开源多模态向量数据库
GPU支持GithubLanceDB多模态数据嵌入管理开源项目矢量搜索
LanceDB 是一款开源的多模态向量数据库,具备持久存储功能,能够简化嵌入的管理与检索。它支持生产级别的向量搜索,无需管理服务器,可存储、查询和过滤向量、元数据以及多模态数据(包括文本、图片、视频、点云等)。它还支持向量相似性搜索、全文搜索和SQL查询,并提供原生的Python和JavaScript/TypeScript支持,同时实现零拷贝和自动版本管理。LanceDB 与 LangChain、LlamaIndex、Apache-Arrow、Pandas、Polars、DuckDB 等多个生态系统集成。其核心由Rust编写,基于Lance构建,专为高性能机器学习工作负载而设计。
ambry - 企业级分布式对象存储系统
AmbryGithub低延迟分布式对象存储可扩展性开源项目高可用性
Ambry是一个分布式对象存储系统,可高效管理海量小型和大型对象。系统具备高可用性、可扩展性、低延迟和高吞吐量等特性。除了适用于Web公司的媒体对象存储,Ambry还可用于数据库备份、搜索索引和业务报告等多种场景。其易用性和成本效益使其成为企业级存储的理想选择。
vector-io - 多平台向量数据集迁移工具 支持主流向量数据库
GithubVector IO向量数据库向量数据集开源项目数据导入导出
Vector IO是一个向量数据集迁移工具,采用通用格式实现多种向量数据库间的数据转换。目前支持Pinecone、Qdrant、Milvus等主流数据库,提供命令行接口进行数据导入导出和重新嵌入。该开源项目正不断扩展兼容的数据库类型,欢迎社区参与贡献。
papaya - Papaya 并发哈希表优化读取密集型工作负载
Githubpapaya原子操作并发哈希表开源项目异步编程无锁API
Papaya是一个并发哈希表,专为读取密集型工作负载优化。它提供无锁API、原子操作和异步支持,具有高可扩展性和低延迟读取性能。Papaya保证所有操作的延迟可预测,采用高效内存管理和垃圾回收,适合需要高吞吐量和一致性能的应用场景。
warp10-platform - 专为物联网打造的时间序列数据分析平台
GithubWarp10开源项目数据分析数据存储时间序列平台物联网
Warp10是一个专为物联网设计的开源平台,集成时间序列数据库和分析环境。它能高效收集、存储和分析传感器数据,提升历史数据存储能力,支持实时数据库扩展,并强化现有分析工具。Warp10简化了KPI和数据可视化过程,便于业务应用与系统数据交互。平台提供Standalone、Standalone+和Distributed三个版本,满足不同规模的部署需求。平台整合了先进的存储引擎、历史文件管理、分析引擎和动态仪表盘功能。它支持高吞吐量数据摄取,提供WarpScript编程语言和超过1300个专用函数,助力高效数据分析。Warp10可无缝集成现有数据湖基础设施,为时间序列数据提供定制化存储和分析解决方案。
sparkey - 高性能键值存储库 专为读密集型系统设计
GithubSparkey哈希表开源项目数据库读取优化键值存储
Sparkey是一款高性能键值存储库,专为读密集型系统优化。支持最大2^63 - 1字节数据,提供迭代、读写和删除功能。采用不可变哈希表,支持并发读取和块级压缩。Sparkey适用于高吞吐低延迟场景,尤其适合定期数据重建。提供C库和命令行工具,易于集成。其特点包括批量写入优化、跨平台存储文件、低开销和快速随机访问。
hop - 开源数据和元数据编排平台
Apache HopGithubJava开源软件开源项目数据处理数据编排平台
Apache Hop是一个开源的数据和元数据编排平台,致力于简化数据处理任务。该平台提供直观界面和丰富功能,包括数据转换、工作流编排和元数据管理。Hop支持多种数据源和插件,适用于数据集成和ETL场景。项目由活跃的社区维护,持续进行开发和改进。
weaviate - 高性能、扩展性强、多模块支持的开源向量数据库
GithubWeaviate向量数据库开源开源项目快速搜索机器学习
Weaviate 是一个云原生的开源向量数据库,采用先进的机器学习模型将文本、图片等数据转化为可搜索的向量。它不仅速度快,还具备高度灵活性,支持在导入数据时进行向量化或上传现成的向量。此外,Weaviate 可通过多种模块与 OpenAI、Cohere、HuggingFace 等热门服务和模型库集成。其设计从快速原型开发到大规模生产部署均能应对,并具备推荐、摘要和神经搜索等功能。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号