Project Icon

cdap

为Hadoop生态系统提供应用开发抽象的集成平台

CDAP是一个开源应用开发平台,为Hadoop生态系统提供数据和应用抽象层。该平台简化应用开发流程,支持实时和批处理场景,并满足企业级需求。CDAP部署于Apache Hadoop之上,提供数据抽象、应用可移植性、开发工具、生态系统集成、元数据管理、可视化pipeline和生产环境控制等功能。开发者可借助CDAP API构建各类应用,从简单MapReduce任务到复杂的数据密集型系统。

datacap - 多源数据管理与分析可视化平台
DataCapGithub开源项目数据可视化数据库连接器数据转换数据集成
DataCap是一个开源的数据管理与分析平台,支持多种数据源和数据库类型。该平台集成了数据转换、集成和可视化功能,能够高效处理大数据、关系型和NoSQL数据库。DataCap提供丰富的数据库连接器,包括ClickHouse、MySQL和PostgreSQL等主流数据库,方便用户进行多源数据管理、转换、图表制作和监控。
hop - 开源数据和元数据编排平台
Apache HopGithubJava开源软件开源项目数据处理数据编排平台
Apache Hop是一个开源的数据和元数据编排平台,致力于简化数据处理任务。该平台提供直观界面和丰富功能,包括数据转换、工作流编排和元数据管理。Hop支持多种数据源和插件,适用于数据集成和ETL场景。项目由活跃的社区维护,持续进行开发和改进。
WeDataSphere - 综合开源大数据开发和管理平台
GithubWeDataSphere大数据平台开源组件开源项目数据应用开发计算中间件
WeDataSphere是一个综合性开源大数据平台,提供从数据处理到应用开发的全套解决方案。它整合了多个开源组件,支持跨引擎协作和统一管理,满足企业在数据分析、质量控制和机器学习等方面的需求,同时保证高级别的安全性和多租户隔离。
datahub - 现代数据栈的开源元数据管理平台
DataHubGithub元数据管理开源项目数据发现平台数据目录
DataHub是一款开源数据目录平台,为现代数据栈提供全面的元数据管理。它支持数据发现、治理、血缘分析,集成多种数据源,并具备实时更新能力。DataHub采用灵活的元数据模型,支持GraphQL API,易于扩展和集成。通过提升数据资产的可见性和可用性,DataHub为数据团队创造价值。
pachyderm - 自动化数据处理与版本控制平台
GithubKubernetesPachyderm开源项目数据版本控制数据管道数据血统
Pachyderm是一个开源的数据工程平台,提供自动化的数据处理流水线和版本控制功能。该平台支持复杂的数据转换,并具备数据血缘跟踪能力。基于Kubernetes构建,Pachyderm实现了自动扩展和并行处理,可部署在主流云平台和本地环境。它为数据工程团队提供了一个高效的CI/CD引擎,适用于各类数据处理场景。
incubator-devlake - 整合分析开发工具数据的开源平台
Apache DevLakeDevOpsGithub开源开源项目数据平台软件开发
Apache DevLake是一个开源开发数据平台,整合并分析来自DevOps工具的分散数据。该平台为工程管理、开源项目维护和开发团队提供软件开发生命周期的全面视图,支持DORA等指标框架,并配备预置仪表板。DevLake可扩展性强,支持GitHub、GitLab和Jira等多种开发工具,有助于团队实现基于数据的工程优化。
dagster - 全生命周期数据管道编排工具 支持云原生部署
DagsterGithubPython开源开源项目数据管道编排资产管理
Dagster是一款支持云原生部署的数据管道编排工具,覆盖全生命周期开发。该工具集成了数据血缘追踪和可观察性功能,采用声明式编程模型,并提供出色的可测试性。Dagster能够帮助开发和维护各类数据资产,包括数据表、数据集、机器学习模型和报告等。开发者可通过Python函数声明数据资产的构建方式,Dagster会自动管理函数执行时机并保持资产更新。这一工具适用于从本地开发到生产环境的全过程,并与现代数据技术栈广泛集成。
h2o-3 - 支持多编程语言的高性能内存中分布式机器学习平台
GithubH2O-3分布式机器学习开源资源开源项目模型部署算法
H2O-3是一个支持多编程语言的高性能内存中分布式机器学习平台,提供广泛的算法如GLM、随机森林、深度神经网络等,并可扩展以添加自定义算法。平台与Hadoop和Spark等大数据技术完美整合,可通过POJO或MOJO格式轻松导出模型至生产环境,适合各类数据科学家在大数据场景下进行机器学习开发。
cadence - 功能强大的开源分布式工作流平台
CadenceGithub分布式系统工作流系统开源项目微服务架构
Cadence是一个开源的分布式工作流平台,为微服务架构提供可靠的解决方案。该平台支持Go、Java等多种编程语言,并配备CLI和Web UI等实用工具。Cadence专注于长时间运行和容错的业务流程,有效简化了复杂分布式系统的开发难度。
kafka - 开源分布式事件流平台
Apache KafkaGithubJavaScala分布式消息系统开源项目构建测试
Apache Kafka是一个开源的分布式事件流平台,为数据管道、流分析、数据集成和关键任务应用提供支持。它采用发布/订阅模式,具有高吞吐量、可扩展性和容错能力。Kafka支持多种编程语言,提供完整的开发工具链。开发者可在本地或集群环境中运行Kafka,进行各类测试。该项目致力于社区建设,欢迎各方贡献。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号