#RLHF框架

OpenRLHF: 一个易用、可扩展且高性能的RLHF框架

2 个月前

OpenRLHF RLHF框架强化学习分布式训练模型微调 Github 开源项目

2 个月前

相关项目

OpenRLHF

OpenRLHF是一款基于Ray、DeepSpeed和Hugging Face Transformers构建的高性能强化学习框架。该框架简单易用，兼容Hugging Face模型和数据集，性能优于优化后的DeepSpeedChat。它支持分布式RLHF，能够在多GPU环境下进行70B+参数模型的全规模微调。OpenRLHF集成了多项PPO实现技巧以提升训练稳定性，同时支持vLLM生成加速和多奖励模型等先进特性，为大规模语言模型优化提供了强大支持。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com