#数学推理

Abel - 数学推理开源大模型学习资料汇总

1 个月前

Abel是一个专注于数学推理的开源大语言模型,在GSM8K和MATH等数学推理基准上取得了SOTA成绩。本文汇总了Abel项目的相关学习资料,包括模型介绍、性能评测、方法论、代码等,帮助读者快速了解和使用这一强大的数学AI模型。

Abel GAIR 数学推理生成性AI 模型性能 Github 开源项目

1 个月前

MathVista：突破视觉数学推理的新基准

2 个月前

MathVista是一个创新的基准测试项目，旨在评估人工智能模型在视觉环境下的数学推理能力。它结合了多模态数据集和全新任务，为人工智能在数学领域的发展提供了新的挑战和机遇。

MathVista 数学推理视觉理解大语言模型多模态模型 Github 开源项目

2 个月前

DeepSeek-Math: 推动开放语言模型数学推理能力的极限

2 个月前

DeepSeek-Math是一个基于DeepSeek-Coder-v1.5 7B模型初始化,并在数学相关数据上进行了5000亿个token的预训练的开源大语言模型,在数学推理能力方面取得了突破性进展。

DeepSeekMath 大语言模型数学推理开源模型人工智能 Github 开源项目

2 个月前

ToRA: 革命性的工具集成推理智能体

2 个月前

探索微软开发的ToRA系列模型，这是一种创新的工具集成推理智能体，专门设计用于解决复杂的数学推理问题。本文深入介绍ToRA的核心特性、训练流程、性能表现以及其在人工智能领域的重要意义。

ToRA 数学推理工具集成模型发布开源 Github 开源项目

2 个月前

ToRA 入门指南 - 一款全新的数学推理工具学习代理

1 个月前

ToRA是微软开发的一系列集成外部工具的推理语言模型代理,专门用于解决具有挑战性的数学推理问题。本文介绍了ToRA的核心功能、使用方法和相关资源,帮助读者快速了解和上手这一创新型AI工具。

ToRA 数学推理工具集成模型发布开源 Github 开源项目

1 个月前

InternLM-Math: 开创数学推理新纪元的开源大语言模型

2 个月前

InternLM-Math是一个突破性的开源数学推理大语言模型,在形式化和非形式化数学推理方面都展现出卓越性能,为人工智能在数学领域的应用开辟了新的可能。

InternLM-Math 数学推理大语言模型开源模型人工智能 Github 开源项目

2 个月前

Abel: 从圣经人物到数学突破的传奇之名

2 个月前

探索Abel这个名字背后的丰富内涵,从圣经故事中的人物到数学界的传奇,以及当代人工智能领域的创新应用。

Abel GAIR 数学推理生成性AI 模型性能 Github 开源项目

2 个月前

最强开源模型Llama3.1只坚持了一天，就被Mistral新模型踢馆了

3 个月前

最强开源模型Llama3.1只坚持了一天，就被Mistral新模型踢馆了

Llama 3.1 Mistral Large 2 代码编写数学推理多语言支持热门

3 个月前

相关项目

ToRA

ToRA是一款工具集成推理代理，能够通过与外部工具互动解决复杂的数学推理问题。ToRA模型结合了自然语言推理和计算工具的优势，在多个数学任务中表现优异，尤其是ToRA-Code-34B和ToRA-70B，显著提升了数学数据集的准确率。此项目的开源代码和模型为进一步研究数学问题的解决提供了强大的资源。

abel

Abel项目通过优化数学推理模型，在GSM8K和MATH数据集上取得了显著进展。特别是其7B模型达到了超过80%的准确率，并在多个数学数据集上展示了优秀的泛化能力。该项目采用独特的Parental Oversight策略和SFT（监督微调），显著提升了模型性能，无需依赖外部工具和奖励模型。

MathPile

本页面介绍了MathPile，这是一个专注于数学领域的高质量大规模预训练数据集，包含约95亿个标记。MathPile整合了来自教科书、arXiv、Wikipedia等多种来源的数据，确保了内容的多样性和覆盖面。项目注重数据质量，采用严格的预处理和过滤，并提供详细的数据文档和质量注释。MathPile旨在提升语言模型在数学推理方面的能力，同时页面也提供了项目的最新动态、技术报告、使用限制和许可证信息。

DeepSeek-Math

DeepSeek-Math是基于DeepSeek-Coder-v1.5 7B预训练的开源数学推理模型。在MATH基准测试中，它达到51.7%的成绩，接近Gemini-Ultra和GPT-4的水平。项目提供基础、指令微调和强化学习三个7B模型版本，支持数学问题求解、工具使用和定理证明。DeepSeek-Math在保持通用能力的同时提升了数学推理能力，为数学研究提供了新的AI工具。

InternLM-Math

InternLM-Math是一个开源的双语数学推理大模型，在形式化和非形式化数学推理方面表现优异。它集成了数学问题求解、证明、验证和增强等功能。该模型在MiniF2F、MATH和GSM8K等基准测试中展现出领先性能，并支持使用Lean语言进行可验证的数学推理。InternLM-Math还可作为奖励模型和数学问题增强助手，为数学研究和应用提供有力支持。

MathVista

MathVista是一个评估AI模型视觉数学推理能力的基准测试。该数据集包含6,141个样本，涵盖31个多模态数据集。任务要求模型具备深度视觉理解和复合推理能力,对当前顶尖AI模型构成挑战。MathVista为研究人员提供了一个衡量AI模型在视觉数学任务中表现的标准化工具。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com