#数学语言模型

Llemma: 开创数学领域的开源语言模型

3 个月前
Cover of Llemma: 开创数学领域的开源语言模型
相关项目
Project Cover

math-lm

Llemma是一个专为数学领域开发的开源语言模型。该项目基于Proof-Pile-2数据集训练,提供7B和34B两种规模的模型版本。Llemma在数学问题解决和定理证明等任务中表现优异,为数学研究和教育领域提供了有力的AI支持。项目不仅开源了模型,还包括数据集和相关代码,促进了数学AI技术的进步。

Project Cover

Qwen2-Math

Qwen2-Math是基于Qwen2大语言模型开发的专业数学语言模型系列。该项目提供多种规模的指令模型和基础模型,支持多语言,并在数学推理和解题能力方面表现优异。在多个数学基准测试中,Qwen2-Math展现出优于其他开源和闭源模型的性能。这些模型专注于解决需要复杂多步逻辑推理的数学问题,为科研社区提供有力支持。

Project Cover

Qwen2.5-Math-7B-Instruct

Qwen2.5-Math-7B-Instruct是一个专注于数学问题求解的大型语言模型。该模型支持链式思考(CoT)和工具集成推理(TIR)方法,可解决中英文数学问题。相较于前代模型,它在多项数学基准测试中表现出色。模型擅长精确计算、符号操作和算法推理,在MATH基准测试中使用TIR方法获得85.3分。作为Qwen2.5-Math系列的指令微调版本,该模型适用于数学问题解答场景。

Project Cover

Qwen2-Math-7B-Instruct

Qwen2-Math-7B-Instruct是一款专注于数学和算术问题推理的大型语言模型。它在处理复杂多步逻辑推理方面表现优异,性能超越多数开源及部分闭源模型。该模型基于Qwen2系列开发,目前主要支持英语输入。研究人员和开发者可借助此模型解决高级数学问题,为数学和科学研究领域提供有力支持。

Project Cover

Qwen2.5-Math-72B-Instruct

Qwen2.5-Math-72B-Instruct是一款专门针对数学问题的大型语言模型。该模型支持思维链(CoT)和工具集成推理(TIR)技术,能够处理中英文数学题。在MATH基准测试中,模型达到了87.8的高分,展现了其在复杂计算、符号操作和算法推理方面的卓越能力。作为Qwen2.5-Math系列的重要组成部分,这个模型为数学问题提供了高效的解决方案。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号