Logo

#模型预训练

Nanotron: 简化大型语言模型的3D并行训练

2 个月前
Cover of Nanotron: 简化大型语言模型的3D并行训练

GPT-2模型在TensorFlow 2.0中的实现与应用

2 个月前
Cover of GPT-2模型在TensorFlow 2.0中的实现与应用