#pair-preference model

RLHF-Reward-Modeling 学习资料汇总 - 训练RLHF奖励模型的开源工具包

2024年09月10日

RLHF ArmoRM RewardBench Bradley-Terry Reward Model pair-preference model Github 开源项目

2024年09月10日

RLHF:人类反馈强化学习的原理与应用

2024年08月30日

RLHF ArmoRM RewardBench Bradley-Terry Reward Model pair-preference model Github 开源项目

2024年08月30日

相关项目

RLHF-Reward-Modeling

该项目专注于通过顺序拒绝采样微调和迭代DPO方法进行奖励和偏好模型训练，提供包括ArmoRM、Pair Preference Model和Bradley-Terry Reward Model在内的多种开源模型，并在RewardBench排行榜中表现显著。项目内容涵盖奖励建模、模型架构、数据集准备和评估结果，适用于基于DRL的RLHF及多项学术研究。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com