Logo

#数据仓库

Logo of dataherald
dataherald
Dataherald 提供企业级自然语言到SQL的查询解决方案,允许用户直接用英语查询数据仓库,获取洞察,无需数据分析师。Dataherald 支持在SaaS应用中实现生产数据库的问答功能,并能基于专有数据创建 ChatGPT 插件。该项目包含核心引擎、应用API层、前端管理控制台及Slackbot组件,支持完整的端到端部署。用户可通过Docker轻松本地运行和设置各服务,适合多种需求的企业用户。
Logo of covid19za
covid19za
由南非比勒陀利亚大学研究团队维护的开源项目,整合了南非COVID-19疫情相关数据。包括各省确诊、康复、死亡和检测数据,以及疫苗接种信息。提供数据可视化仪表板和分析工具,供研究人员和开发者进行疫情研究与应用开发。
Logo of zillion
zillion
Zillion是一款通过简洁API整合并分析多个数据源的数据建模与分析工具。它支持智能SQL生成、自然语言查询和数据库基础设施的无缝集成。功能包括定义仓库、多维数据聚合、多级汇总、表格透视、公式定制及技术性转换,适用于复杂数据模型管理和报告生成。同时,Zillion还实验性支持自然语言查询和仓库配置。
Logo of transfer
transfer
Artie Transfer是一个开源的实时数据复制工具,专注于OLTP和OLAP数据库之间的数据同步。它采用变更数据捕获(CDC)和流处理技术,实现数据延迟低于1分钟。该工具具有自动表创建、模式检测、高可靠性和可扩展性等特点,支持多种消息队列和数据库系统,能够处理1GB至100+TB的数据量。Artie Transfer为企业提供了一个高效的大数据同步解决方案。
Logo of Perpetual ML
Perpetual ML
Perpetual ML Suite是为现代数据仓库设计的全面机器学习解决方案。这个端到端的低代码/无代码应用提供了显著的性能提升,支持表格分类、回归、时间序列和文本分类等多种ML任务。其特点包括持续学习、模型监控和地理数据优化,无需专用硬件即可实现高效并行计算。该套件旨在加速数据分析过程,提高决策质量,简化机器学习工作流程。
Logo of dozer
dozer
Dozer是一款实时数据同步工具,利用CDC技术从多种数据源同步到多个目标存储。该工具性能优于Debezium+Kafka组合,支持无状态转换。Dozer主要用于数据仓库同步,如Clickhouse,并可用于构建数据API和LLM集成。通过单一配置文件运行,Dozer支持Postgres、MySQL、Snowflake等多种数据源和目标存储,为数据同步提供灵活高效的解决方案。