#NuminaMath
aimo-progress-prize - 开源AI数学奥林匹克解决方案
NuminaMathAI数学奥林匹克数学问题解决大语言模型工具集成推理Github开源项目
aimo-progress-prize项目提供了一套AI数学奥林匹克解决方案,包含DeepSeekMath-Base 7B模型微调方法、数据集和自一致性解码算法。项目使用TRL、PyTorch等库,在8个H100 GPU上10小时内完成训练。仓库包括安装指南、训练方法和代码结构说明,为AI数学研究提供参考资源。
NuminaMath-7B-TIR - 采用工具集成推理技术的数学问题解决语言模型
模型性能工具集成推理开源项目模型NuminaMath数学问题解决训练程序HuggingfaceGithub
NuminaMath 7B TIR是一种使用工具集成推理技术训练的语言模型,专门为数学问题解决而设计,在AI数学奥林匹克测试中取得了29/50的得分。经过深度微调,该模型能够处理从基础到高阶数学的复杂问题,尤其是在GSM8k和MATH等基准测试中表现优异。模型基于DeepSeek基础版优化,利用大规模数据集,通过逐步解题和工具推理增强问题解决能力,适合用于数学问题解决和教育场景。