#数据集
suzume-llama-3-8B-multilingual-orpo-borda-top75 - 多语言模型的ORPO方法微调及性能评估
Suzume ORPO数据集开源项目模型GithubHuggingface训练评估
该项目采用ORPO方法对多语言模型进行微调,使用lightblue/mitsu数据集进行训练,取得了显著的性能提升。推荐的最佳模型版本在多种语言的评测得分均超过基础模型和其他对比模型。研究团队正在开发新的商用版本,旨在未来为商业应用提供支持。
Llama-3.1-Swallow-70B-Instruct-v0.1 - 强化日语和英语能力的多语言大型模型
日本语言能力开源项目指令微调模型HuggingfaceLlama 3.1 SwallowGithub大语言模型数据集
Llama 3.1 Swallow系列在增强日语和英语能力方面表现出色。基于Llama 3.1的模型结构,它不仅改进了对日语的处理能力,还保留了对英语的支持。利用包括日本网络、维基百科在内的语料,以2000亿个令牌进行训练,该模型在多个领域表现优异,包括文本生成、日英翻译和学术考试。不同的模型变体支持多种语言处理需求,提供灵活选择。
相关文章
Character-LLM: 可训练的角色扮演AI代理 - trainable-agents项目学习资源汇总
2 个月前
alpaca-chinese-dataset入门学习资料汇总 - 中文指令微调数据集
2 个月前
Voice-Cloning-App 学习资料汇总 - 一款易用的人声合成Python/Pytorch应用
2 个月前
bocoel入门指南 - 高效评估大语言模型的贝叶斯优化工具
2 个月前
LLMDataHub入门指南 - 大型语言模型训练数据集汇总
2 个月前
CareGPT学习资料汇总 - 开源驱动的医疗大语言模型
2 个月前
DB-GPT-Hub学习资料汇总 - 基于大语言模型的开放文本到SQL基准平台
2 个月前
deep-text-recognition-benchmark入门学习资料 - 场景文本识别框架
2 个月前
Fashion-MNIST学习资料汇总 - 替代MNIST的时尚产品图像数据集
2 个月前