热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#Maximal Update Parametrization
mup - 大规模神经网络的稳定超参数优化方法
Github
开源项目
深度学习
Maximal Update Parametrization
MuTransfer
超参数稳定
大规模神经网络
Maximal Update Parametrization (μP) 提供了一种适用于大规模神经网络的稳定超参数优化方法,例如预训练的Transformer等。利用μP,模型的超参数在不同大小的网络中可保持稳定,减少了在探索和扩展过程中的不确定性和脆弱性。该工具包简化了在PyTorch模型中实现μP的流程,是优化和调优深度学习模型的强大工具。
1
1
相关文章
深入解析 μP: 改变神经网络超参数调优的革命性技术
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号