项目介绍:Qwen2.5-Math-1.5B
项目背景
Qwen2.5-Math-1.5B是Qwen家族中一个专注于数学问题解决的模型系列,于2024年8月首次发布。这个系列的模型旨在通过链式思维(Chain of Thought, CoT)和工具整合推理(Tool-integrated Reasoning, TIR)来解决英语和汉语的数学问题。
主要功能
与之前的Qwen2-Math系列相比,Qwen2.5-Math具备了更广泛的能力,不仅能够通过链式思维解决英语数学问题,还支持使用工具整合推理来处理中英双语的数学难题。这样的改进让Qwen2.5-Math系列在中文和英文数学基准测试中的表现相比Qwen2-Math系列有了显著的提升。
技术优势
Qwen2.5-Math-1.5B模型在使用TIR解决数学问题时,取得了Math基准测试上的优异成绩,其评分分别为79.7、85.3和87.8。链式思维虽然增强了大语言模型的推理能力,但在复杂数学或算法任务(如求解二次方程的根或计算矩阵的特征值)上仍有局限,而工具整合推理可以进一步提升模型在精确计算、符号操作和算法处理方面的能力。
模型详情
Qwen2.5-Math系列包括基础模型(如Qwen2.5-Math-1.5B/7B/72B)和经过指令调优的模型(如Qwen2.5-Math-1.5B/7B/72B-Instruct),以及数学奖励模型Qwen2.5-Math-RM-72B。更多详细信息可以参考我们的博客和GitHub仓库。
使用要求
使用Qwen2.5-Math模型需要transformers
库版本不低于4.37.0,建议使用最新版。因为从4.37.0版本开始,transformers
库集成了Qwen2代码。
快速开始
Qwen2.5-Math-1.5B-Instruct是一个用于对话的指令模型,而Qwen2.5-Math-1.5B是一个基础模型,通常用于文本生成和少样本推理,是进一步微调的良好起点。
引用
如果您认为我们的工作对您有帮助,欢迎通过以下引用支持我们:
@article{yang2024qwen25mathtechnicalreportmathematical,
title={Qwen2.5-Math Technical Report: Toward Mathematical Expert Model via Self-Improvement},
author={An Yang and Beichen Zhang and Binyuan Hui and Bofei Gao and Bowen Yu and Chengpeng Li and Dayiheng Liu and Jianhong Tu and Jingren Zhou and Junyang Lin and Keming Lu and Mingfeng Xue and Runji Lin and Tianyu Liu and Xingzhang Ren and Zhenru Zhang},
journal={arXiv preprint arXiv:2409.12122},
year={2024}
}