热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#结果评估
bitnet_b1_58-3B - 开源的RedPajama语言模型再现
Huggingface
结果评估
RedPajama
开源项目
模型
Github
BitNet
开源
模型训练
该项目再现了BitNet b1.58的研究,通过使用RedPajama数据集训练100B个token,实现了两阶段学习率和权重衰减。模型代码可在开源平台获取。初步结果表明,模型在PPL和零样本准确率方面表现优异,计划在资源允许时进一步扩大训练规模和模型容量。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号