#minGPT

min-max-gpt: 极简实现的大规模GPT训练框架

3 个月前

minGPT GPU训练深度学习分布式训练大规模模型 Github 开源项目

3 个月前

相关项目

min-max-gpt

min-max-gpt是一个针对大规模GPT模型训练优化的开源项目。该框架集成了muP初始化、混合精度训练、FSDP和DeepSpeed Zero-3等技术，并提供了不依赖Hugging Face的训练选项。这使得研究人员和开发者能够更灵活地控制训练过程。项目已在8块80GB A100 GPU上成功训练20B参数模型，展现了其在大规模语言模型训练方面的能力。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com