#数据仓库

dataherald - 企业级自然语言到SQL查询解决方案
Dataherald自然语言SQL引擎数据仓库APIGithub开源项目
Dataherald 提供企业级自然语言到SQL的查询解决方案,允许用户直接用英语查询数据仓库,获取洞察,无需数据分析师。Dataherald 支持在SaaS应用中实现生产数据库的问答功能,并能基于专有数据创建 ChatGPT 插件。该项目包含核心引擎、应用API层、前端管理控制台及Slackbot组件,支持完整的端到端部署。用户可通过Docker轻松本地运行和设置各服务,适合多种需求的企业用户。
zillion - 多数据源整合与自然语言查询的智能数据建模和分析工具
Zillion数据分析数据仓库SQLAlchemy自然语言处理Github开源项目
Zillion是一款通过简洁API整合并分析多个数据源的数据建模与分析工具。它支持智能SQL生成、自然语言查询和数据库基础设施的无缝集成。功能包括定义仓库、多维数据聚合、多级汇总、表格透视、公式定制及技术性转换,适用于复杂数据模型管理和报告生成。同时,Zillion还实验性支持自然语言查询和仓库配置。
Perpetual ML - 现代数据仓库的高效机器学习解决方案
AI工具机器学习套件数据仓库加速训练持续学习模型监控
Perpetual ML Suite是为现代数据仓库设计的全面机器学习解决方案。这个端到端的低代码/无代码应用提供了显著的性能提升,支持表格分类、回归、时间序列和文本分类等多种ML任务。其特点包括持续学习、模型监控和地理数据优化,无需专用硬件即可实现高效并行计算。该套件旨在加速数据分析过程,提高决策质量,简化机器学习工作流程。
Keebo - Snowflake自动化优化方案 实现性能提升和成本控制
AI工具KeeboSnowflake优化自动化成本节省数据仓库
Keebo为Snowflake提供自动化优化解决方案。通过实时调整仓库参数,实现性能提升和成本控制。该工具快速部署,能在24小时内显示成效。采用专利技术,自动适应工作负载变化,无需人工干预。提供详细报告,支持安全连接,并可自定义优化策略。Keebo采用基于节省的收费模式,确保与客户利益一致。
covid19za - 南非COVID-19数据存储和分析开源项目
COVID-19南非数据仓库开源协作流行病学Github开源项目
由南非比勒陀利亚大学研究团队维护的开源项目,整合了南非COVID-19疫情相关数据。包括各省确诊、康复、死亡和检测数据,以及疫苗接种信息。提供数据可视化仪表板和分析工具,供研究人员和开发者进行疫情研究与应用开发。
transfer - 实时数据复制工具 支持OLTP和OLAP数据库
数据复制实时同步数据仓库Artie Transfer数据库Github开源项目
Artie Transfer是一个开源的实时数据复制工具,专注于OLTP和OLAP数据库之间的数据同步。它采用变更数据捕获(CDC)和流处理技术,实现数据延迟低于1分钟。该工具具有自动表创建、模式检测、高可靠性和可扩展性等特点,支持多种消息队列和数据库系统,能够处理1GB至100+TB的数据量。Artie Transfer为企业提供了一个高效的大数据同步解决方案。
dozer - 实时多源数据同步工具 支持CDC技术和多目标存储
Dozer实时数据移动CDC数据仓库数据转换Github开源项目
Dozer是一款实时数据同步工具,利用CDC技术从多种数据源同步到多个目标存储。该工具性能优于Debezium+Kafka组合,支持无状态转换。Dozer主要用于数据仓库同步,如Clickhouse,并可用于构建数据API和LLM集成。通过单一配置文件运行,Dozer支持Postgres、MySQL、Snowflake等多种数据源和目标存储,为数据同步提供灵活高效的解决方案。