热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#日语预训练
japanese-gpt-neox-3.6b - 基于GPT-NeoX架构的36亿参数日语大语言模型
GPT-NeoX
日语预训练
语言模型
Github
深度学习
模型
自然语言处理
Huggingface
开源项目
japanese-gpt-neox-3.6b是一个基于GPT-NeoX架构的日语大语言模型,拥有36亿参数。该模型在超过3125亿个日语语料库tokens上训练,包括CC-100、C4和维基百科数据。模型采用36层、2816隐藏层的transformer架构,验证困惑度为8.68。使用sentencepiece分词器,词表大小32,000,支持UTF-8字节分解。模型已开源并提供训练数据和使用文档。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号