#AdaLomo

LOMO: 突破内存限制的大语言模型全参数微调优化器

2024年09月05日

LOMO AdaLomo 大语言模型优化器低内存优化 Github 开源项目

2024年09月05日

相关项目

LOMO

LOMO和AdaLomo是为大规模语言模型训练设计的低内存优化算法。通过融合梯度计算和参数更新，这些技术显著减少内存使用，使单GPU设备能实现全参数微调。AdaLomo提供自适应学习率和分组更新归一化，在内存效率和性能上与AdamW相当。这些算法已集成至多个主流深度学习框架，为资源受限环境中的大模型训练提供高效方案。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com