热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#日英双语
llama-3-youko-8b-instruct - Llama 3架构日英双语指令模型集成多种优化技术
语言模型
日英双语
神经网络训练
Llama3
模型
Github
开源项目
自然语言处理
Huggingface
Llama-3架构的8B参数指令模型通过监督微调(SFT)、Chat Vector与直接偏好优化(DPO)技术训练而成。模型整合OpenAssistant、MetaMathQA等数据集,支持日英双语交互,采用32层4096隐藏层transformer架构。通过参数合并和DPO优化增强了指令理解能力,可应用于自然语言交互场景。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号