#TRL

TRL: 全栈式语言模型微调与对齐框架

2 个月前

Cover of TRL: 全栈式语言模型微调与对齐框架

TRL是一个专门用于微调和对齐大型语言模型的全栈工具库,支持监督微调、奖励建模、PPO等多种方法,为开发者提供了高效、灵活的模型训练解决方案。

TRL 微调大语言模型强化学习 Transformer Github 开源项目

2 个月前

Cover of TRL: 全栈式语言模型微调与对齐框架

相关项目

Project Cover

TRL是一个开源的全栈工具库，专用于大型语言模型的微调和对齐。它支持监督式微调、奖励建模和近端策略优化等方法，适用于多种模型架构。该库基于Transformers构建，提供灵活的训练器和自动模型类，并集成Accelerate、PEFT等工具实现高效扩展。TRL还提供命令行界面，方便用户进行模型微调和交互。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号