ChatGLM-LoRA-RLHF-PyTorch
该项目详细介绍了如何在消费者硬件上使用LoRA和RLHF微调ChatGLM LLM,包括环境配置、数据处理、监督微调及奖励模型的训练等步骤,帮助开发者轻松实现模型优化。