#行为对齐

RLHF-V: 通过细粒度纠正性人类反馈对齐多模态大语言模型行为

3 个月前

3 个月前

相关项目

RLHF-V

RLHF-V框架通过细粒度的人类纠正反馈来优化多模态大语言模型的行为。该项目收集高效的纠正反馈数据,让标注者修正模型回答中的幻觉片段。实验表明,仅需1小时训练即可将基础模型的幻觉率降低34.8%。RLHF-V在Muffin模型上的验证展示了显著的性能提升,有效提高了模型的可信度。

投诉举报邮箱: service@vectorlightyear.com