Logo

#数学问题解决

Logo of aimo-progress-prize
aimo-progress-prize
aimo-progress-prize项目提供了一套AI数学奥林匹克解决方案,包含DeepSeekMath-Base 7B模型微调方法、数据集和自一致性解码算法。项目使用TRL、PyTorch等库,在8个H100 GPU上10小时内完成训练。仓库包括安装指南、训练方法和代码结构说明,为AI数学研究提供参考资源。
Logo of cumulative-reasoning
cumulative-reasoning
Cumulative Reasoning项目开发了新型累积推理方法,显著提升大语言模型在复杂任务中的表现。该方法在24点游戏中达到98%准确率,在MATH数据集上实现72.2%准确率。项目还基于元提示技术开发CR Agent Assistant,为解决数学问题提供高效工具。研究表明,累积推理方法在各类数学问题上优于现有方法,尤其在高难度问题上表现出色。