Qwen2.5-Math-7B项目介绍
Qwen2.5-Math-7B 是一个专注于解决中英文数学问题的模型系列,于2024年8月首次发布,随后在一个月后进行了升级和开源。该系列模型包括基础模型(如Qwen2.5-Math-1.5B/7B/72B)、经过指令微调的模型(如Qwen2.5-Math-1.5B/7B/72B-Instruct)以及数学奖励模型(如Qwen2.5-Math-RM-72B)。
背景和目标
Qwen2.5-Math系列与之前的Qwen2-Math系列相比,最大的进步在于支持使用链式思维(CoT)和工具整合推理(TIR)同时解决中英文数学问题。这些模型在中英文数学基准测试上的表现相对于前一系列有了显著提升,尤其是在链式思维(CoT)方面。
技术特点
链式思维(CoT)在增强模型的推理能力上起到了重要作用,但在精确计算和复杂数学或算法推理任务上仍然面临挑战。工具整合推理(TIR)可以进一步提升模型在精确计算、符号运算以及算法推理上的能力。在数学基准测试中的表现中,Qwen2.5-Math-1.5B/7B/72B-Instruct 分别达到了79.7、85.3 和 87.8的分数。
模型详情和使用要求
为了使用Qwen2.5-Math模型,需要transformers
库的版本至少是4.37.0。推荐使用最新版本的transformers
库,因为Qwen2代码自此版本起被集成。此外,具体的GPU内存需求和处理速度等也可以通过类似结果获取更多信息。
快速开始
Qwen2.5-Math-7B-Instruct 模型专用于互动交流,而Qwen2.5-Math-7B则是基础模型,通常用于文本生成和少样本推理,是进一步调优的良好基础。
引用
如果您觉得我们的工作对您有帮助,欢迎对我们的工作进行引用:
@article{yang2024qwen25mathtechnicalreportmathematical,
title={Qwen2.5-Math Technical Report: Toward Mathematical Expert Model via Self-Improvement},
author={An Yang and Beichen Zhang and Binyuan Hui and Bofei Gao and Bowen Yu and Chengpeng Li and Dayiheng Liu and Jianhong Tu and Jingren Zhou and Junyang Lin and Keming Lu and Mingfeng Xue and Runji Lin and Tianyu Liu and Xingzhang Ren and Zhenru Zhang},
journal={arXiv preprint arXiv:2409.12122},
year={2024}
}
Qwen2.5-Math-7B项目旨在通过自我改进开发出更加精通数学问题处理的专家级模型,实现中英文数学问题的高效解决。