#SPPO

SPPO: 自对弈偏好优化方法推动大语言模型对齐新突破

2 个月前
Cover of SPPO: 自对弈偏好优化方法推动大语言模型对齐新突破