Project Icon

HugeCTR

GPU加速的大规模深度学习推荐系统框架

HugeCTR是专为大规模深度学习模型设计的GPU加速推荐系统框架,支持高效训练和推理。框架在MLPerf等基准测试中性能卓越,提供直观的API接口,并具备大规模嵌入等核心功能。HugeCTR实现了模型并行训练、混合精度计算、嵌入缓存等先进特性,可高效部署超大规模嵌入的推荐模型。

efficient-dl-systems - 从GPU架构到模型部署的全面课程
GPU架构Github分布式训练开源项目推理优化模型优化深度学习系统
本项目是一门全面的高效深度学习系统课程,内容涵盖GPU架构、CUDA编程、实验管理、分布式训练、大模型处理、模型部署及推理优化等核心主题。课程结合理论讲座和实践研讨,旨在培养学生掌握深度学习系统的效率优化技能。课程还提供多个实践作业和往年教学资料,适合希望深入了解深度学习系统效率提升的学习者。
torchrec - 旨在提供大规模推荐系统所需的常见稀疏性和并行性原语的PyTorch库
CUDAFBGEMMGithubPyTorchTorchRec开源项目推荐系统
TorchRec是一个专为大规模推荐系统设计的PyTorch库,提供稀疏性和并行性解决方案。它支持多种嵌入表分片策略,并能自动优化分片计划。通过流水线训练和优化内核,提高模型性能。还支持量化训练和推理,包含多个验证的模型架构和数据集示例,适用于需要高性能和扩展性的推荐系统项目。
hbox - 高效的AI和大数据调度平台,支持多种深度学习框架
GithubHadoop YarnHbox人工智能大数据开源项目深度学习框架
Hbox是一个高效的调度平台,结合了大数据和人工智能技术。支持多种机器学习和深度学习框架,如TensorFlow、MXNet、PyTorch等,并运行在Hadoop Yarn上。平台支持GPU资源调度、Docker容器化和RESTful API接口管理,具备良好的扩展性和兼容性。Hbox还提供统一的数据管理和可视化界面,适用于分布式计算和模型训练。
awesome-huge-models - 大型AI模型最新动态与开源资源汇总
AI训练GithubLLMdeep learning模型大模型开源开源项目
详尽介绍大型AI语言模型最新进展及开源资源,包括训练代码、数据集和预训练权重。收录Baichuan、Falcon、OpenLLaMA等模型,并关注开源与分布式训练框架如PyTorch和XLA生态。提供全面资源链接,帮助研究人员和开发者了解当前AI模型的最前沿动态。
graph-learn - 大规模分布式图神经网络框架,兼容PyTorch和TensorFlow
GithubGraph-Learn分布式框架图神经网络大规模图数据实时推理开源项目
Graph-Learn是一款分布式框架,专为开发和应用大规模图神经网络(GNN)而设计,已成功应用于阿里巴巴的搜索推荐、网络安全和知识图谱等场景。框架包括GraphLearn-Training和Dynamic-Graph-Service模块,支持批量图采样、在线推理及流图更新功能,兼容PyTorch和TensorFlow,提供完整的GNN模型开发解决方案。
higgsfield - 高容错且可扩展的GPU调度与机器学习框架
GPU管理GithubHiggsfield分布式计算大模型训练开源项目深度学习
Higgsfield是一款开源、高容错、可扩展的GPU调度与机器学习框架,适用于数十亿到数万亿参数的模型(如大型语言模型)。它的主要功能包括分配计算资源、支持高效分片、启动和监控大规模神经网络训练、管理资源竞争,并通过与GitHub的集成实现持续集成。Higgsfield简化了大规模模型训练的流程,提供了多样且强大的开发工具。
rtp-llm - 大型语言模型推理加速引擎
CUDAGithubrtp-llm多模态输入大语言模型开源项目量化
rtp-llm是阿里巴巴基础模型推理团队开发的大型语言模型推理加速引擎,广泛应用于支持淘宝问答、天猫、菜鸟网络等业务,并显著提升处理效率。该项目基于高性能CUDA技术,支持多种权重格式和多模态输入处理,跨多个硬件后端。新版本增强了GPU内存管理和设备后端,优化了动态批处理功能,提高了用户的使用和体验效率。
ColossalAI - 提升大型AI模型训练的效率和可访问性
AI加速Colossal-AIGithub人工智能分布式训练大模型并行训练开源项目热门
Colossal-AI致力于使大型AI模型的训练更加经济、快速且易于获取。通过支持多种并行策略,包括数据并行、流水线并行、张量并行和序列并行,Colossal-AI可以大幅提高大规模模型训练的速度。此外,还集成了异构训练和零冗余优化器技术,使得在多GPU集群上的训练过程更加高效和灵活。Colossal-AI通过这些先进的功能,已被广泛应用于生产和研究场景,显著推动了AI技术的进步和应用。
models - 推荐系统深度学习模型库
GPU加速GithubMerlin ModelsTensorFlow开源项目推荐系统深度学习
Merlin Models是专为推荐系统设计的深度学习库,提供从经典机器学习到前沿深度学习的多种高质量模型实现。该库简化了模型训练和部署流程,内置行业最佳实践,并支持GPU加速。Merlin Models主要提供TensorFlow API,包含矩阵分解、双塔模型等经典和最新推荐模型架构。此外,它还提供可重用的构建块,便于自定义模型,并与Merlin平台其他组件无缝集成,支持构建完整的推荐系统流程。
min-max-gpt - 为大规模GPT模型训练优化的开源框架
GPU训练GithubminGPT分布式训练大规模模型开源项目深度学习
min-max-gpt是一个针对大规模GPT模型训练优化的开源项目。该框架集成了muP初始化、混合精度训练、FSDP和DeepSpeed Zero-3等技术,并提供了不依赖Hugging Face的训练选项。这使得研究人员和开发者能够更灵活地控制训练过程。项目已在8块80GB A100 GPU上成功训练20B参数模型,展现了其在大规模语言模型训练方面的能力。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号