热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#Megatron-Core
Megatron-LM - 优化GPU训练技术 加速大规模Transformer模型
Megatron-LM
Megatron-Core
大语言模型
GPU优化
分布式训练
Github
开源项目
Megatron-LM框架利用GPU优化技术实现Transformer模型的大规模训练。其Megatron-Core组件提供模块化API和系统优化,支持自定义模型训练。该项目可进行BERT、GPT、T5等模型预训练,支持数千GPU分布式训练百亿参数级模型,并提供数据预处理、模型评估和下游任务功能。
1
1
相关文章
Megatron-LM: 大规模训练Transformer模型的开源框架
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号