热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#GPT训练
nanoGPT - 简洁高效的中型GPT模型训练框架
Github
开源项目
PyTorch
深度学习
语言模型
nanoGPT
GPT训练
nanoGPT是一个针对中型GPT模型的训练框架,重写自minGPT项目并注重性能优化。其核心由约300行代码组成,包括训练循环和模型定义,能够轻松复现GPT-2(124M)。该框架支持从零开始训练新模型或微调预训练检查点,并提供了详细的入门指南,涵盖了从Shakespeare作品上的字符级模型训练到在OpenWebText数据集上复现GPT-2结果的完整流程。
1
1
相关文章
探索nanoGPT:构建和训练小型GPT模型的简单方法
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号