#数学问题解决
aimo-progress-prize
aimo-progress-prize项目提供了一套AI数学奥林匹克解决方案,包含DeepSeekMath-Base 7B模型微调方法、数据集和自一致性解码算法。项目使用TRL、PyTorch等库,在8个H100 GPU上10小时内完成训练。仓库包括安装指南、训练方法和代码结构说明,为AI数学研究提供参考资源。
Progressive-Hint
Progressive-Hint项目开发了一种名为PHP的新方法,通过渐进式提示增强大型语言模型的推理能力。这种方法简单有效,可与Chain-of-Thought和Self-Consistency等现有技术结合。PHP在AQuA、SVAMP、GSM8K和MATH等多个推理数据集上展现出卓越性能,尤其在GSM8K数据集上结合Self-Consistency达到96.5%的最佳成绩。项目提供开源PyTorch实现,为研究人员和开发者提供了实用工具。
MyMathSolver.ai
MyMathSolver.ai提供免费在线AI数学求解服务,支持多种输入方式,包括文本和图片。平台运用GPT-4o技术,为用户提供代数、微积分和几何等领域的复杂数学问题的详细解答。配备交互式AI辅导功能,实时解答疑问。该工具适用于学生和专业人士,旨在提升数学学习效率和问题解决能力。
Math.bot
Math.bot是一个基于GPT-4o技术的在线数学解题平台,提供免费服务解决代数、微积分和几何等问题。该平台支持多种数学领域的问题解答,包括基础代数、高等微积分和空间几何等。用户可通过上传图片或输入文字获取详细解答,系统会生成详细的解题步骤和说明。平台集成交互式ChatGPT求解器,支持动态学习,为用户提供更加个性化和深入的学习体验。Math.bot致力于帮助用户理解数学概念,提升解题能力。
cumulative-reasoning
Cumulative Reasoning项目开发了新型累积推理方法,显著提升大语言模型在复杂任务中的表现。该方法在24点游戏中达到98%准确率,在MATH数据集上实现72.2%准确率。项目还基于元提示技术开发CR Agent Assistant,为解决数学问题提供高效工具。研究表明,累积推理方法在各类数学问题上优于现有方法,尤其在高难度问题上表现出色。
NuminaMath-7B-TIR
NuminaMath 7B TIR是一种使用工具集成推理技术训练的语言模型,专门为数学问题解决而设计,在AI数学奥林匹克测试中取得了29/50的得分。经过深度微调,该模型能够处理从基础到高阶数学的复杂问题,尤其是在GSM8k和MATH等基准测试中表现优异。模型基于DeepSeek基础版优化,利用大规模数据集,通过逐步解题和工具推理增强问题解决能力,适合用于数学问题解决和教育场景。
neural-chat-7b-v3-3
neural-chat-7b-v3-3是Intel基于Mistral-7B模型微调的大语言模型,专注提升数学推理能力。模型在多个基准测试中表现优异,支持8192个token上下文长度,提供多种精度推理选项。适用于多种语言任务,但建议部署前进行安全评估。