Project Icon

AGEIPort

阿里巴巴开源的高性能数据导入导出框架

AGEIPort是阿里巴巴开源的数据导入导出框架,采用事件驱动架构设计。它支持集群和单机执行模式,提供实时任务进度反馈,并针对toB业务场景提供灵活定制。该框架在阿里巴巴集团内部广泛应用,月处理数据量达300-400亿条。AGEIPort通过标准化流程和接口设计,提高了开发效率和代码可维护性,适用于各类数据处理需求。

brooklin - 高可靠性多源异构数据流处理系统
BrooklinGithubKafka集群镜像分布式系统多租户开源项目数据流系统
Brooklin是一个分布式系统,用于在异构源系统和目标系统之间进行高可靠、高吞吐量的大规模数据流传输。它支持多租户,能同时处理数百个跨系统数据管道,并易于扩展以适配新的数据源和目标。Brooklin具备优秀的可扩展性和易操作性,支持变更数据捕获和数据引导功能。该系统已在Kafka集群镜像等实际场景中得到大规模验证。
beam - 统一批处理和流处理的数据并行处理模型
Apache BeamGithub分布式计算开源项目批处理数据处理流处理
Apache Beam是一个统一的数据处理模型,用于定义批处理和流处理的并行数据处理管道。它提供多语言SDK构建管道,并可在Apache Flink、Spark等分布式处理后端上执行。Beam支持Java、Python和Go等语言,为各类开发者提供灵活的开发环境。该项目采用统一模型处理批处理和流处理数据,支持多种编程语言,并可在多个分布式处理平台上运行。它为不同类型的开发者提供了灵活的工具,简化了大规模数据处理的复杂性。
stargate - 灵活可扩展的数据库API网关
APICassandraGithubStargate开源项目微服务架构数据网关
Stargate是一个创新的数据网关,部署于客户端应用和Cassandra数据库之间。它通过可扩展的插件系统支持多种API、数据类型和访问方法,简化了Cassandra在各类应用场景中的使用。采用微服务架构的Stargate允许独立扩展Cassandra集群中的存储、API和协调器节点。支持HTTP API、gRPC和CQL等多种接口,Stargate为开发者提供了灵活而强大的数据访问方案。
awesome-data-engineering - 数据工程全面技术资源指南
Github大数据开源项目数据处理数据存储数据工程数据库
本资源列表全面覆盖数据工程领域,包括数据库、数据摄取、文件系统和序列化格式等核心技术。汇集Kafka、Hadoop、Spark等主流开源项目和创新解决方案,为数据工程实践提供系统性参考。内容涵盖从基础设施到前沿技术,是数据工程师深入学习和技术选型的重要指南。
grafbase - 数据源整合与高性能API图构建平台
APIGithubGrafbase开源项目数据源统一图谱边缘计算
Grafbase是一个API开发平台,专注于将多个数据源整合到单一图中。该平台可部署在靠近用户的边缘或企业自有基础设施上,以优化API性能。Grafbase提供上手指南、示例、模板、文档和CLI工具,便于开发者构建和管理现代API。适用于快速原型开发和复杂数据图构建,Grafbase旨在满足多样化的API开发需求。
gpt-migrate - 自动化代码迁移工具实现跨框架和语言转换
AI编程GPT-MigrateGithub代码迁移开源项目自动化转换
GPT-Migrate是一款基于AI的代码迁移工具,可将代码库在不同框架或语言间转换。它结合Docker环境和大型语言模型,实现源代码评估、依赖选择、目标代码重建、测试和调试的自动化。该工具旨在降低代码迁移成本和时间,但仍处于开发阶段。GPT-Migrate支持多种编程语言,提供灵活配置,并针对复杂迁移任务提供专家支持。
api-gateway - 高性能高并发的开源API网关系统
API网关ETCDGithubNetty开源项目高并发高性能
API-Gateway是一个开源的高性能API网关系统,适用于生产环境。它采用轻量级、异步化的架构设计,基于Netty实现高并发网络通信,使用Disruptor和MPMC构建异步队列。项目特性包括分布式集群注册中心、负载均衡和灰度发布。核心代码通过责任链和抽象模板等设计模式实现。在阿里云SLB环境下,支持十万并发的压测与调优,为API管理提供可靠解决方案。
awesome-apache-airflow - Apache Airflow资源大全 工作流管理平台指南
Apache AirflowGithub工作流管理开源软件开源项目数据管道调度系统
本项目汇集了Apache Airflow的综合资源,包括部署方案、教程、最佳实践和工具库等。内容涵盖重要链接、视频教程和商业服务,为Airflow用户提供全面指南。项目持续更新,致力于成为Airflow社区的权威参考。
arrow - 高效内存分析引擎 加速大数据处理
Apache ArrowGithub内存分析列式存储开源项目数据处理
Apache Arrow 是一个开源的内存分析开发平台,旨在提高大数据系统的数据处理和传输速度。它提供高效的列式内存格式、IPC格式和Flight RPC协议,并支持多种编程语言。Arrow 的核心技术包括高性能的数据结构、跨语言兼容性和零拷贝数据共享,为现代数据分析应用提供了强大的基础架构支持。
Alink - 阿里巴巴开源的Flink机器学习算法平台
AlinkFlinkGithub开源项目机器学习算法平台阿里巴巴
Alink是阿里巴巴开发的基于Flink的开源算法平台,提供丰富的机器学习算法和工具。该平台支持Java和Python接口,具有高性能和可扩展性。Alink包含完整的教程、组件列表和算法库,适用于数据分析和机器学习领域。用户可在本地或集群环境中使用Alink进行数据处理和模型训练,满足不同应用场景的需求。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号