热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#Llama3-8B-1.58
Llama3-8B-1.58-100B-tokens - 基于BitNet架构的Llama3 8B量化版本
BitNet
Llama3-8B-1.58
语言模型
量化
模型
Github
模型训练
开源项目
Huggingface
这是一个基于BitNet 1.58b架构的语言模型,通过对Llama-3-8B-Instruct进行微调开发。模型在FineWeb-edu数据集上完成了1000亿token的训练,采用1e-5学习率。测评显示其部分性能指标接近原版Llama3 8B,体现了极限量化在大型语言模型领域的应用潜力。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号