#Vicuna-LoRA-RLHF-PyTorch

Vicuna-LoRA-RLHF-PyTorch: 一套完整的大规模语言模型微调流程

3 个月前

Cover of Vicuna-LoRA-RLHF-PyTorch: 一套完整的大规模语言模型微调流程

Vicuna-LoRA-RLHF-PyTorch Vicuna LoRA RLHF PyTorch Github 开源项目

3 个月前

Cover of Vicuna-LoRA-RLHF-PyTorch: 一套完整的大规模语言模型微调流程

相关项目

Project Cover

Vicuna-LoRA-RLHF-PyTorch

本文详述如何在普通硬件上优化Vicuna语言模型，包括环境配置、监督微调、合并PEFT适配器、训练奖励模型和PPO微调等步骤，适合中文技术人员使用。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号