热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#1比特量化
bitnet_b1_58-large - BitNet b1.58复现项目展示1比特量化语言模型的效能
语言模型
Github
1比特量化
开源项目
BitNet
Huggingface
模型评估
模型
本项目复现了BitNet b1.58的1比特量化语言模型,采用RedPajama数据集进行了1000亿token的训练。通过实施论文中提出的训练策略,项目成功重现了700M、1.3B和3B规模模型的性能。评估结果显示,在困惑度(PPL)和多项零样本任务中,复现模型与原论文报告的数据高度一致,证实了该方法在模型压缩和维持性能方面的有效性。项目还提供了详细的评估流程和命令,方便研究者进行复现和进一步探索。通过比较不同规模模型在各项任务上的表现,该研究为大规模语言模型的高效压缩和部署提供了valuable的实践参考。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号