热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#自我博弈偏好优化
Gemma-2-9B-It-SPPO-Iter3 - 通过自我游戏偏好优化增强语言模型 alignment
自我博弈偏好优化
Gemma-2-9B-It-SPPO-Iter3
语言模型
开源项目
合成数据集
模型
Github
Huggingface
超参数
Gemma-2-9B-It-SPPO-Iter3以google/gemma-2-9b-it为基础,经过第三次自我游戏偏好优化迭代开发,结合openbmb/UltraFeedback数据集微调。在合成数据集中展现了出色的性能,LC.获胜率达到53.27%,在AlpacaEval排行榜上表现优良。项目主要使用英语,遵循Apache-2.0许可,适用于多种自然语言处理场景。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号