#Self-Rewarding Language Model

Self-Rewarding Language Model: 突破性的自我奖励语言模型训练框架

2 个月前

2 个月前

相关项目

self-rewarding-lm-pytorch

self-rewarding-lm-pytorch是一个开源项目，实现了MetaAI提出的自我奖励语言模型训练框架。该项目包含SPIN算法实现，提供灵活的微调配置选项，支持自定义奖励提示、任意顺序的微调策略和批量采样。这个工具能帮助研究人员探索和改进语言模型的自我学习能力。

投诉举报邮箱: service@vectorlightyear.com