#自我博弈偏好优化

Gemma-2-9B-It-SPPO-Iter3 - 通过自我游戏偏好优化增强语言模型 alignment

自我博弈偏好优化Gemma-2-9B-It-SPPO-Iter3语言模型开源项目合成数据集模型GithubHuggingface超参数

Gemma-2-9B-It-SPPO-Iter3以google/gemma-2-9b-it为基础，经过第三次自我游戏偏好优化迭代开发，结合openbmb/UltraFeedback数据集微调。在合成数据集中展现了出色的性能，LC.获胜率达到53.27%，在AlpacaEval排行榜上表现优良。项目主要使用英语，遵循Apache-2.0许可，适用于多种自然语言处理场景。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号