Project Icon

datahub-gma

DataHub通用元数据架构的开源实现

datahub-gma是LinkedIn开源的通用元数据架构(GMA)实现,为DataHub提供后端支持。该项目提供元数据搜索和发现功能,支持可扩展的元数据管理。GMA架构设计灵活,有助于企业高效管理元数据资源。项目托管于GitHub,欢迎社区参与贡献。

marquez - 数据生态系统元数据的收集、聚合和可视化
GithubMarquezOpenLineage元数据服务开源项目数据谱系
Marquez是一个开源元数据服务项目,专注于数据生态系统的元数据处理。该项目提供数据集消费和生产的溯源、作业运行时间和数据集访问频率的可视化,以及数据集生命周期的集中管理。作为LF AI & Data Foundation的毕业项目,Marquez集成了OpenLineage,简化了数据集、作业和运行元数据的收集与查看过程,有助于探索数据依赖关系并优化元数据管理。
iglu - 开源JSON Schema管理工具 优化数据架构
GithubIgluJSON SchemaSnowplow开源开源项目数据架构
Iglu是一个开源的JSON Schema管理工具,由Snowplow团队开发。它提供了存储、检索和管理JSON Schema的功能,有助于实现数据标准化和一致性。Iglu支持多种客户端、存储库类型,并提供基础设施工具,可用于嵌入式和远程schema存储。该工具为数据驱动型应用提供了灵活可靠的架构管理基础,适用于各类数据管理需求。
graphql-hive - GraphQL架构可视化与管理工具 支持多类型API
GithubGraphQL HiveSchema Registry开源开源项目监控集成
作为开源的GraphQL架构管理工具,GraphQL Hive为开发团队提供全面的可视化和监控功能。它支持多种API类型,包括Federation、Stitching和独立API。该工具的主要特点包括Schema注册、性能监控、破坏性变更预防和数据驱动的定义。GraphQL Hive还提供了与Slack、GitHub和CI/CD系统的集成,以及详细的监控指标。采用MIT许可证,允许用户自由部署和使用。
awesome-data-engineering - 数据工程全面技术资源指南
Github大数据开源项目数据处理数据存储数据工程数据库
本资源列表全面覆盖数据工程领域,包括数据库、数据摄取、文件系统和序列化格式等核心技术。汇集Kafka、Hadoop、Spark等主流开源项目和创新解决方案,为数据工程实践提供系统性参考。内容涵盖从基础设施到前沿技术,是数据工程师深入学习和技术选型的重要指南。
EDA-GPT - 全方位数据分析工具 支持结构化与非结构化数据探索
EDA GPTGithub大语言模型开源项目数据分析结构化数据非结构化数据
EDA-GPT是一款开源数据分析工具,支持结构化和非结构化数据处理。该工具可分析CSV、XLSX、SQLite等格式的结构化数据,以及PDF和图像等非结构化数据。EDA-GPT提供直观界面,集成多种LLM模型,具备图表生成、数据清理和多模态搜索功能。它简化了数据分析流程,有助于用户快速探索数据并获取洞察。
geospatial-data-catalogs - 地理空间数据集目录汇总工具
GithubSTAC云计算平台地理空间数据开放数据开源项目数据目录
本项目整合了主流云平台的地理空间数据目录,支持CSV和JSON格式输出,方便开发者快速检索和使用数据。通过每日更新和提供相关资源链接,确保用户能够获取最新、最全面的地理空间数据信息。
WeDataSphere - 综合开源大数据开发和管理平台
GithubWeDataSphere大数据平台开源组件开源项目数据应用开发计算中间件
WeDataSphere是一个综合性开源大数据平台,提供从数据处理到应用开发的全套解决方案。它整合了多个开源组件,支持跨引擎协作和统一管理,满足企业在数据分析、质量控制和机器学习等方面的需求,同时保证高级别的安全性和多租户隔离。
langchain-hub - LangChain原语资源共享平台
GithubLLM应用LangChainHub代理开源项目提示词
LangChain-Hub是一个面向LangChain开发者的开源资源库,汇集了优质的提示、链和代理等LLM应用组件。作为一个中心化平台,它促进了资源共享和发现。该项目支持多种贡献方式,包括GitHub PR、issues和在线表单。开发者可以方便地调用这些资源,加速LLM应用的开发进程。
datachain - 帮助机器学习和AI工程师进行数据分析的数据框架库
AIDataChainGithubPython元数据开源项目数据处理
DataChain是一个为AI特定场景设计的数据框架库。它通过在非结构化文件上构建的元数据层,帮助机器学习和AI工程师进行数据分析。支持处理各种存储中的原始文件并实现数据集版本控制。用户可以使用Python接口进行数据转换和元数据丰富。项目特色包括功能链式数据处理方法和数据版本控制,并区分CPU和GPU负载, 适用于分布式计算。
data-engineer-handbook - 数据工程学习资源与行业洞察的综合指南
Github公司博客开源项目数据工程社区资源
该项目汇集了数据工程领域的丰富资源,包括推荐书籍、社区平台、公司简介、技术博客、白皮书、视频频道、播客和新闻通讯等。内容涵盖数据工程的方方面面,从入门基础到高阶主题,为数据工程从业者和学习者提供了全面的学习材料和行业洞察。无论是初学者还是资深专业人士,都能在此找到提升技能和把握行业动态的有价值信息。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号