项目简介
Mistral-Large-Instruct-2407是一个具有1230亿参数的先进大型语言模型,它在推理能力、知识储备和代码编写方面都达到了领先水平。这个模型由Mistral AI公司开发,专门针对多语言处理和指令理解进行了优化。
核心特点
-
多语言支持:模型原生支持多种语言,包括英语、法语、德语、西班牙语、意大利语、中文、日语、韩语、葡萄牙语、荷兰语和波兰语等数十种语言。
-
卓越的编程能力:模型经过80多种编程语言的训练,包括Python、Java、C、C++、JavaScript和Bash等主流语言,同时也支持Swift和Fortran等特定领域的编程语言。
-
智能代理特性:具备一流的智能代理功能,支持原生函数调用和JSON输出,使其能够更好地完成复杂任务。
-
强大的推理能力:在数学和逻辑推理方面表现出色,达到了业界领先水平。
-
大规模上下文处理:支持128k的上下文窗口,可以处理更长的输入文本。
性能表现
该模型在多个基准测试中展现出优异的性能:
- 在MMLU测试中达到84.0%的准确率
- 在多语言能力评估中,大多数语言的MMLU得分都在80%左右
- 在MT Bench测试中获得8.63的高分
- 在代码生成测试中,Human Eval达到92%的成功率
- 在数学问题解决方面,GSM8K测试达到93%的准确率
使用授权
模型采用Mistral研究许可证,允许用于研究和非商业用途。使用者需要遵守相关许可条款,包括:
- 仅限于个人、科学或学术研究目的使用
- 禁止用于商业活动或商业运营
- 分发时必须包含Mistral研究许可证
使用方式
模型支持两种主要的使用框架:
- 使用Mistral官方的mistral_inference框架
- 使用广泛流行的transformers库
开发者可以根据具体需求选择合适的框架进行模型部署和使用,支持多种功能如聊天、指令跟随、函数调用等高级特性。