#Gemma-2-9B-It-SPPO-Iter3

SPPO: 自对弈偏好优化方法推动大语言模型对齐新突破

2 个月前
Cover of SPPO: 自对弈偏好优化方法推动大语言模型对齐新突破