#Adan

Adan:一种更快速优化深度模型的自适应Nesterov动量算法

3 个月前
Cover of Adan:一种更快速优化深度模型的自适应Nesterov动量算法