#数据集

suzume-llama-3-8B-multilingual-orpo-borda-top75 - 多语言模型的ORPO方法微调及性能评估

Suzume ORPO数据集开源项目模型GithubHuggingface训练评估

该项目采用ORPO方法对多语言模型进行微调，使用lightblue/mitsu数据集进行训练，取得了显著的性能提升。推荐的最佳模型版本在多种语言的评测得分均超过基础模型和其他对比模型。研究团队正在开发新的商用版本，旨在未来为商业应用提供支持。

Llama-3.1-Swallow-70B-Instruct-v0.1 - 强化日语和英语能力的多语言大型模型

日本语言能力开源项目指令微调模型HuggingfaceLlama 3.1 SwallowGithub大语言模型数据集

Llama 3.1 Swallow系列在增强日语和英语能力方面表现出色。基于Llama 3.1的模型结构，它不仅改进了对日语的处理能力，还保留了对英语的支持。利用包括日本网络、维基百科在内的语料，以2000亿个令牌进行训练，该模型在多个领域表现优异，包括文本生成、日英翻译和学术考试。不同的模型变体支持多种语言处理需求，提供灵活选择。

相关文章

Article Cover

Character-LLM: 可训练的角色扮演AI代理 - trainable-agents项目学习资源汇总

Article Cover

alpaca-chinese-dataset入门学习资料汇总 - 中文指令微调数据集

Article Cover

Voice-Cloning-App 学习资料汇总 - 一款易用的人声合成Python/Pytorch应用

Article Cover

bocoel入门指南 - 高效评估大语言模型的贝叶斯优化工具

Article Cover

LLMDataHub入门指南 - 大型语言模型训练数据集汇总

Article Cover

CareGPT学习资料汇总 - 开源驱动的医疗大语言模型

Article Cover

DB-GPT-Hub学习资料汇总 - 基于大语言模型的开放文本到SQL基准平台

Article Cover

deep-text-recognition-benchmark入门学习资料 - 场景文本识别框架

Article Cover

Fashion-MNIST学习资料汇总 - 替代MNIST的时尚产品图像数据集

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号