#Nanotron

Nanotron: 简化大型语言模型的3D并行训练

3 个月前
Cover of Nanotron: 简化大型语言模型的3D并行训练