热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#TPU支持
gpt-neo - 使用 mesh-tensorflow 库的模型并行 GPT-2 和 GPT-3 样式模型的实现
GPT-Neo
模型训练
预训练模型
TPU支持
GPT-3
Github
开源项目
GPT-Neo项目在mesh-tensorflow库的支持下,开发出了类似于GPT-3的高级模型与数据并行技术。项目支持在TPU及GPU上进行高效训练与推理,并集成了局部注意力、线性注意力和多专家系统等先进技术,能有效处理大规模参数模型。GPT-Neo还提供了多项模型评估功能,专注于语言和科学推理,拓宽了其在自然语言处理应用中的领域。
1
1
相关文章
GPT-Neo:开源大规模语言模型的突破性进展
3 个月前
GPT-Neo学习资料汇总 - 开源GPT-3级别大型语言模型
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号