#人类反馈

RLHF-V: 通过细粒度纠正性人类反馈对齐多模态大语言模型行为

3 个月前

Cover of RLHF-V: 通过细粒度纠正性人类反馈对齐多模态大语言模型行为

RLHF-V 多模态大语言模型行为对齐人类反馈幻觉减少 Github 开源项目

3 个月前

Cover of RLHF-V: 通过细粒度纠正性人类反馈对齐多模态大语言模型行为

HH-RLHF项目：通过人类反馈强化学习训练有帮助且无害的AI助手

3 个月前

Cover of HH-RLHF项目：通过人类反馈强化学习训练有帮助且无害的AI助手

人工智能数据集红队测试 AI助手人类反馈 Github 开源项目

3 个月前

Cover of HH-RLHF项目：通过人类反馈强化学习训练有帮助且无害的AI助手

基于人类反馈的强化学习(RLHF): 从概念到实践的全面解析

3 个月前

Cover of 基于人类反馈的强化学习(RLHF): 从概念到实践的全面解析

RLHF Reinforcement Learning 人类反馈大型语言模型奖励模型 Github 开源项目

3 个月前

Cover of 基于人类反馈的强化学习(RLHF): 从概念到实践的全面解析

PaLM-rlhf-pytorch:基于PaLM架构实现的RLHF模型

3 个月前

Cover of PaLM-rlhf-pytorch:基于PaLM架构实现的RLHF模型

PaLM RLHF 人工智能强化学习人类反馈 Github 开源项目

3 个月前

Cover of PaLM-rlhf-pytorch:基于PaLM架构实现的RLHF模型

相关项目

Project Cover

PaLM-rlhf-pytorch

本项目实现了基于PaLM架构的强化学习与人类反馈（RLHF），适用于开放环境下的ChatGPT复现。结合了LoRA微调和Flash Attention技术，提供详细的安装和使用指南。加入社区，探索最新的PPO和RL技术进展。

Project Cover

awesome-RLHF

此页面汇集了关于强化学习与人类反馈（RLHF）的最新研究论文，涵盖从基础概念到高级技术，包括大语言模型、视频游戏、机器人和个性化推荐系统等应用。页面将持续更新，跟踪此领域的前沿进展。

Project Cover

hh-rlhf

hh-rlhf项目开源两类数据集:AI助手有用性和安全性的人类偏好数据,以及人工生成的红队测试数据。这些数据集旨在改进AI助手的性能和安全性。数据包含敏感话题,仅供研究使用。项目提供数据格式说明和使用指南,支持AI安全研究。

Project Cover

RLHF-V

RLHF-V框架通过细粒度的人类纠正反馈来优化多模态大语言模型的行为。该项目收集高效的纠正反馈数据,让标注者修正模型回答中的幻觉片段。实验表明,仅需1小时训练即可将基础模型的幻觉率降低34.8%。RLHF-V在Muffin模型上的验证展示了显著的性能提升,有效提高了模型的可信度。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号