Project Icon

venice

全球工作负载的衍生数据存储平台

Venice是一个衍生数据存储平台,提供高吞吐量的批处理和流处理数据异步摄取,低延迟的在线读取,基于CRDT的区域间主动主动复制,多集群支持和多租户水平伸缩能力。适用于Feathr等特征存储,支持离线、近线和在线工作负载的多种写操作和读取API,具有分片感知和本地缓存功能的客户端模式,满足不同性能和成本需求。

brooklin - 高可靠性多源异构数据流处理系统
BrooklinGithubKafka集群镜像分布式系统多租户开源项目数据流系统
Brooklin是一个分布式系统,用于在异构源系统和目标系统之间进行高可靠、高吞吐量的大规模数据流传输。它支持多租户,能同时处理数百个跨系统数据管道,并易于扩展以适配新的数据源和目标。Brooklin具备优秀的可扩展性和易操作性,支持变更数据捕获和数据引导功能。该系统已在Kafka集群镜像等实际场景中得到大规模验证。
feathr - 企业级统一数据和AI工程开源平台
AI模型FeathrGithub开源项目数据处理特征工程平台
Feathr是LinkedIn开源的数据和AI工程平台,经过多年生产环境验证。该平台支持数据转换的定义、注册和共享,尤其适合AI建模场景。Feathr采用原生云集成和可扩展架构,提供丰富的转换API,能够处理大规模数据,并在离线批处理、流处理和在线环境中保持统一的数据转换接口。
VictoriaMetrics - 高效灵活的时序数据管理平台
GithubVictoriaMetrics开源项目性能优化数据压缩时间序列数据监控系统
VictoriaMetrics是一款高性能的时序数据管理平台,专为大规模数据监控而设计。它支持多种协议,提供长期存储、流式聚合和全局查询等功能。该系统部署简单,资源占用低,可满足不同规模企业的需求。与传统解决方案相比,VictoriaMetrics在内存占用和数据压缩方面表现出色,能够处理数百万个唯一时间序列。多家知名企业如Grammarly和Wix已成功应用该系统,显著降低了监控成本。企业版还提供异常检测等增强功能。
vespa - 大规模数据集搜索与推荐的高性能解决方案
GithubVespa开源项目性能搜索机器学习模型高可用性
Vespa 是一个高性能平台,专为大规模数据集的搜索、推荐和个性化任务设计。它支持向量、张量、文本和结构化数据的实时组织和推断,具备高可用性和可扩展性。Vespa 被广泛应用于大规模互联网服务,每秒处理数十万次查询。用户可以选择在云端或本地部署应用,平台提供详尽的文档和不断更新的博客,帮助用户开发和集成。
Flyte - 灵活高效的数据和机器学习工作流编排解决方案
AI工具Flyte可扩展性工作流编排数据科学机器学习
Flyte是一个高度可扩展和灵活的工作流编排平台,可无缝整合数据、机器学习和分析工具链。它支持数据科学家和工程师轻松构建和管理生产级工作流,实现从本地开发到大规模部署的流畅过渡。Flyte提供强大的扩展性、数据血缘追踪和缓存机制,能处理从简单ETL到复杂机器学习训练等多样化工作流。该平台致力于简化工作流开发,使用户能专注于核心业务逻辑。
vearch - 云原生分布式向量数据库,支持高效相似性搜索
GithubVearch云原生分布式数据库向量搜索开源项目相似度搜索
Vearch是一个提供云原生分布式向量数据库的开源项目,专注于实现嵌入向量的高效相似性搜索。支持混合搜索与标量过滤,具备从百万对象中毫秒级别检索的高性能。同时,Vearch还具备复制和弹性扩展的能力。提供的文档资源包括Restful API、OpenAPI和多语言SDK,适用于构建可视化搜索系统和作为AI内存后端。
kafka - 开源分布式事件流平台
Apache KafkaGithubJavaScala分布式消息系统开源项目构建测试
Apache Kafka是一个开源的分布式事件流平台,为数据管道、流分析、数据集成和关键任务应用提供支持。它采用发布/订阅模式,具有高吞吐量、可扩展性和容错能力。Kafka支持多种编程语言,提供完整的开发工具链。开发者可在本地或集群环境中运行Kafka,进行各类测试。该项目致力于社区建设,欢迎各方贡献。
feast - 旨在为机器学习平台团队提供可靠的特征管理工具的开源的特征存储系统
FeastGithub开源项目数据基础设施机器学习模型训练特征存储
Feast是一个开源的特征存储系统,旨在为机器学习平台团队提供可靠的特征管理工具。它通过管理离线存储和低延迟的在线存储,确保特征在训练和服务中的一致性,避免数据泄漏。Feast提供了一个单一的数据访问层,将特征存储与特征检索分离,使模型在不同数据基础设施之间保持可移植性。用户可以通过详细的文档和指南,轻松上手并运行Feast。
statshouse - 高可用可扩展的多租户监控系统
GithubStatsHouse可扩展性多租户开源项目监控系统高可用性
StatsHouse是一款高性能的多租户监控系统,具有高可用性和可扩展性。它提供1秒高分辨率和5秒低延迟的数据处理能力,支持长期指标存储和自动降采样。系统易于操作,具有内置UI和Grafana插件,适用于大规模分布式环境的实时监控。StatsHouse在VK.com的生产环境中每秒处理12亿个指标,使用ClickHouse作为主要数据存储,并支持多种编程语言的客户端集成。
talaria - 分布式高可用时序数据库与事件摄取平台
GithubTalaria事件摄取大数据实时查询开源项目数据库
Talaria是为大数据系统设计的分布式时序数据库。它既可作为事件摄取平台,又可用作热数据存储,每小时可查询2-3TB数据,具有低延迟和低成本特点。Talaria支持SQL查询,兼容多种工具生态系统,并提供多种存储接口。通过Presto Thrift连接器,可与Presto无缝集成。作为开源项目,Talaria为用户提供了灵活的部署选项和自定义可能性,特别适合需要快速处理和查询大量时序数据的场景。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号