热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#无强化学习
Infinity-Instruct-3M-0625-Yi-1.5-9B - 大规模指令调优模型无需人类反馈的创新
无强化学习
模型训练
Infinity Instruct
北京智源人工智能研究院
深度学习
Github
模型
开源项目
Huggingface
Infinity-Instruct-3M-0625-Yi-1.5-9B是一个开放源码的指导调优模型,不依赖于人类反馈强化学习。模型通过在Infinity-Instruct-3M上的微调展现了优异的性能,特别是在AlpacaEval 2.0和MT-Bench评估中表现突出。近期发布的InfInstruct-Mistral-7B 0625等模型权重优化了训练效率。借助FlagScale等创新训练技术,该模型大幅降低了训练成本,擅长处理数学和代码指令,并具备强大的聊天功能。该模型仅限于学术研究使用,不适用于商业用途。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号