热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#Levanter
levanter - 专注可读性与可扩展性的大语言模型训练框架
Github
开源项目
分布式训练
大语言模型
JAX
机器学习框架
Levanter
Levanter是一个用于训练大型语言模型和基础模型的框架。该框架使用Haliax命名张量库编写易读的深度学习代码,同时保持高性能。Levanter支持大型模型训练,兼容GPU和TPU等硬件。框架具有比特级确定性,保证配置一致性。其功能包括分布式训练、Hugging Face生态系统兼容、在线数据预处理缓存、Sophia优化器支持和多种日志后端。
1
1
相关文章
Levanter: 开源高性能大规模语言模型训练框架
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号