热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#TRL
trl
TRL是一个开源的全栈工具库,专用于大型语言模型的微调和对齐。它支持监督式微调、奖励建模和近端策略优化等方法,适用于多种模型架构。该库基于Transformers构建,提供灵活的训练器和自动模型类,并集成Accelerate、PEFT等工具实现高效扩展。TRL还提供命令行界面,方便用户进行模型微调和交互。
相关文章
TRL: 全栈式语言模型微调与对齐框架
1 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号