#行为对齐

RLHF-V: 通过细粒度纠正性人类反馈对齐多模态大语言模型行为

3 个月前
Cover of RLHF-V: 通过细粒度纠正性人类反馈对齐多模态大语言模型行为