#LLaMA3-SFT

Llama-3-8b-sft-mixture - 基于多样化高质量数据集训练的大语言模型微调检查点

语言模型RLHFHuggingface人工智能LLaMA3-SFT模型Github开源项目机器学习

Llama-3-8b-sft-mixture是基于Meta-Llama-3-8B模型训练的SFT检查点，通过对ShareGPT、Evol-Instruct等九个高质量数据集进行混合训练而成。该模型经过1个epoch的训练，尚未经过RLHF，可作为RLHF研究的理想起点。模型适用于强化学习研究，详细参数可参考相关技术报告。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号