热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#RLHF框架
OpenRLHF - 高性能强化学习框架助力大规模语言模型优化
Github
开源项目
分布式训练
模型微调
强化学习
OpenRLHF
RLHF框架
OpenRLHF是一款基于Ray、DeepSpeed和Hugging Face Transformers构建的高性能强化学习框架。该框架简单易用,兼容Hugging Face模型和数据集,性能优于优化后的DeepSpeedChat。它支持分布式RLHF,能够在多GPU环境下进行70B+参数模型的全规模微调。OpenRLHF集成了多项PPO实现技巧以提升训练稳定性,同时支持vLLM生成加速和多奖励模型等先进特性,为大规模语言模型优化提供了强大支持。
1
1
相关文章
OpenRLHF: 一个易用、可扩展且高性能的RLHF框架
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号