热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#DeltaCAT
deltacat - 基于Ray的分布式数据目录管理系统
DeltaCAT
数据目录
Ray
分布式计算
数据湖
Github
开源项目
DeltaCAT是一个基于Ray的Python数据目录系统,采用类Git的stage/commit API实现快速、可扩展、ACID兼容的数据目录管理。结合Ray分布式计算框架和Apache Arrow,DeltaCAT支持PB级数据变更捕获、一致性检查和表修复。该系统已在EB级企业数据湖中得到应用,为大规模数据管理提供解决方案。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号