Project Icon

datahub-gma

DataHub通用元数据架构的开源实现

datahub-gma是LinkedIn开源的通用元数据架构(GMA)实现,为DataHub提供后端支持。该项目提供元数据搜索和发现功能,支持可扩展的元数据管理。GMA架构设计灵活,有助于企业高效管理元数据资源。项目托管于GitHub,欢迎社区参与贡献。

h2ogpt - 私密的文件查询与总结工具
Githubh2oGPT开源项目文档查询本地私有GPT LLM热门用户界面
h2oGPT是一个基于Apache V2协议的开源项目,支持用户通过高效的本地私有GPT语言模型查询、总结文档或进行交流。该项目提供多种模型支持,包括LLaMa2、Mistral等,并具备包括PDF、Excel、Word在内的多种文件类型处理能力。用户可以通过UI或CLI界面使用该系统,并利用GPU或CPU进行操作。h2oGPT还可以作为OpenAI服务器的替代品,支持文本完成、音频转写和图像生成等功能。
haupt - 多功能元数据API及数据管理工具
APIGithubHauptPolyaxonmetadatasandbox开源项目
Haupt提供Polyaxon的元数据API、工件流、沙盒和空间管理,简化数据管理和追踪。强大的API功能使集成数据处理管道变得轻松,并支持实时数据监控。Haupt支持多种数据流模式和高效空间分配,适用于各种数据驱动应用。与Polyaxon生态系统无缝衔接,提高生产力和数据准确性。
cmdb - 全面高效的IT资产配置管理系统
APICMDBGithub开源项目自动发现资产管理运维配置
CMDB是一个开源的运维配置管理数据库系统,专注于IT资产管理。该系统提供灵活的配置选项,支持自动发现和资产入库,实现细粒度权限控制和全面操作日志记录。CMDB具备多维度资产展示功能,提供强大的API接口,支持属性触发器和计算属性定义。系统设计通用性强,适用于各类运维场景,为IT基础设施管理提供有力支持。
OpenHuFu - 开源数据联邦系统实现安全高效查询处理
GithubOpenHuFu多方安全计算安全查询开源项目数据联邦系统空间数据
OpenHuFu是一个开源数据联邦系统,旨在解决数据孤岛问题,实现跨数据所有者的安全高效查询处理。系统采用安全多方计算技术,包括秘密共享、混淆电路和不经意传输,为研究人员提供灵活平台,用于快速实现和评估联邦查询处理算法。OpenHuFu支持关系查询和空间查询等多种类型,并提供通信成本和运行时间等评估指标。该系统为数据联邦和联邦学习研究提供了重要工具。
dataherald - 企业级自然语言到SQL查询解决方案
APIDataheraldGithubSQL引擎开源项目数据仓库自然语言
Dataherald 提供企业级自然语言到SQL的查询解决方案,允许用户直接用英语查询数据仓库,获取洞察,无需数据分析师。Dataherald 支持在SaaS应用中实现生产数据库的问答功能,并能基于专有数据创建 ChatGPT 插件。该项目包含核心引擎、应用API层、前端管理控制台及Slackbot组件,支持完整的端到端部署。用户可通过Docker轻松本地运行和设置各服务,适合多种需求的企业用户。
cdap - 为Hadoop生态系统提供应用开发抽象的集成平台
CDAPGithubHadoop生态系统企业级应用应用开发平台开源项目数据抽象
CDAP是一个开源应用开发平台,为Hadoop生态系统提供数据和应用抽象层。该平台简化应用开发流程,支持实时和批处理场景,并满足企业级需求。CDAP部署于Apache Hadoop之上,提供数据抽象、应用可移植性、开发工具、生态系统集成、元数据管理、可视化pipeline和生产环境控制等功能。开发者可借助CDAP API构建各类应用,从简单MapReduce任务到复杂的数据密集型系统。
meltano - 代码优先的数据集成引擎 解锁多种API和数据库
API集成GithubMeltano开源项目数据工作流数据集成
Meltano是一个代码优先的数据集成引擎,提供600多个API和数据库的访问。它帮助用户简化API集成的编写、维护和扩展过程,支持实现数据和机器学习驱动的产品创意。通过简化跨多个工具的数据工作流程,Meltano为构建理想的数据平台提供了强大支持。
upgini - 免费且低代码的自动化数据丰富工具
GithubUpgini外部数据开源项目数据增强机器学习特征生成
提供免费且低代码的自动化数据丰富工具,帮助机器学习和AI模型从众多公开、社区和高质量外部数据源中轻松查找并添加相关特征。通过大语言模型(LLM)、GraphNN和循环神经网络(RNN)等技术优化数据源,提高模型精度。Upgini简化了特征搜索与丰富过程,支持多种监督学习任务,包括二分类、多分类、回归和时间序列预测,确保外部数据在机器学习流程中的稳定性。
incubator-devlake - 整合分析开发工具数据的开源平台
Apache DevLakeDevOpsGithub开源开源项目数据平台软件开发
Apache DevLake是一个开源开发数据平台,整合并分析来自DevOps工具的分散数据。该平台为工程管理、开源项目维护和开发团队提供软件开发生命周期的全面视图,支持DORA等指标框架,并配备预置仪表板。DevLake可扩展性强,支持GitHub、GitLab和Jira等多种开发工具,有助于团队实现基于数据的工程优化。
data-engineering-roadmap - 数据工程师职业发展路线图
DataBurstGithub协作开源开源项目数据工程路线图
data-engineering-roadmap是一个开源项目,为数据工程师提供全面的职业发展路线图。该项目涵盖从初级到高级的所有层次,提供行业指导和最佳实践。作为一个动态文档,项目欢迎社区贡献,持续优化以服务整个数据工程领域。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号