Project Icon

MathBlackBox

蒙特卡罗树搜索增强大语言模型数学能力

MathBlackBox项目采用蒙特卡罗树搜索(MCTS)方法提升大语言模型的数学问题解决能力。项目使用VLLM或其他OpenAI兼容方法构建服务器,客户端则基于Hugging Face工具包和OpenAI进行推理。支持GSM8K、OlympiadBench和MATH等多个数学数据集。研究显示,该方法可使LLaMa-3 8B模型在数学奥林匹克解题方面达到接近GPT-4的水平。目前项目处于早期阶段,仍需进一步测试和优化。

DeepSeek-LLM - 多语言大模型展现卓越编码与数学能力
DeepSeek LLMGithub人工智能开源开源项目自然语言处理语言模型
DeepSeek LLM是一个包含67亿参数的先进语言模型,经过2万亿英文和中文token的训练。该模型在推理、编码、数学和中文理解等方面表现优异,超越多个同类模型。其67B Chat版本在编码和数学方面尤为出色,在HumanEval和GSM8K等基准测试中名列前茅。项目开源了7B和67B的base与chat版本,可用于学术和商业研究。
alphageometry - 无需人类示范的奥林匹克几何问题求解器
AlphaGeometryGithub人工智能几何定理证明开源项目数学奥林匹克机器学习
AlphaGeometry是一个创新的几何定理证明系统,能够解决奥林匹克级别的几何问题,无需人类示范。它结合了演绎-归纳推理和大型语言模型,自动构建辅助线并生成严格证明。在IMO-AG-30和JGEX-AG-231测试集上,AlphaGeometry分别解决了25和228个问题,大幅超越传统DDAR方法。项目开源了核心代码,包括DDAR求解器和语言模型推理模块,为几何定理自动证明开辟新路径。
T-MAC - 优化低比特量化LLM推理的CPU加速框架
CPU加速GithubLLM推理T-MAC低比特量化开源项目矩阵乘法
T-MAC是一个创新的内核库,采用查找表技术实现混合精度矩阵乘法,无需反量化即可加速CPU上的低比特LLM推理。该框架支持多种低比特模型,包括GPTQ/gguf的W4A16、BitDistiller/EfficientQAT的W2A16和BitNet的W1(.58)A8。T-MAC在多种设备上展现出显著性能提升,例如在Surface Laptop 7上,单核处理速度可达20 tokens/s,四核可达48 tokens/s,比llama.cpp快4~5倍。
AI-Optimizer - 涵盖从无模型到基于模型,从单智能体到多智能体的多种算法的多功能深度强化学习平台
AI-OptimizerGithub多智能体强化学习开源项目深度强化学习离线强化学习自监督学习
AI-Optimizer是一款多功能深度强化学习平台,涵盖从无模型到基于模型,从单智能体到多智能体的多种算法。其分布式训练框架高效便捷,支持多智能体强化学习、离线强化学习、迁移和多任务强化学习、自监督表示学习等,解决维度诅咒、非平稳性和探索-利用平衡等难题,广泛应用于无人机、围棋、扑克、机器人控制和自动驾驶等领域。
AngouriMath - 开源符号代数库,支持多种编程语言的数学计算工具
AngouriMathGithub开源开源项目数学计算符号代数库跨平台
AngouriMath是一款跨平台的开源符号代数库,兼容C#、F#、Jupyter和C++等多种编程环境。这个强大的数学工具可以自动求解方程组、执行微分运算、解析数学表达式、编译公式、处理矩阵运算、计算极限值,还能将数学表达式转换为LaTeX格式。AngouriMath在科研和数据分析中可用于函数可视化和符号计算,同时也能作为软件开发中的数学计算引擎,为各类项目提供高效的数学处理能力。
Qwen2.5-Math-7B-Instruct-bnb-4bit - Qwen2.5-Math利用CoT与TIR技术提升中英文数学问题解决能力
GithubHuggingfaceQwen2.5-Math免费笔记本工具集成推理开源项目数学问题模型精细调整
该系列在Qwen2的基础上整合链式思维(CoT)与工具集成推理(TIR),增强了中英文数学解决能力。Qwen2.5-Math提供基础、指令调优和数学奖励模型,性能较前代版提升显著,特别是在数学基准测试中。建议使用最新版本的transformers进行安装和推理,配备丰富的交互式Notebook示例,便于用户快速上手。
Qwen2.5-Math-7B-Instruct - 强大的数学问题求解模型 支持中英双语CoT和TIR推理
CoTGithubHuggingfaceQwen2.5-MathTIR开源项目数学语言模型模型自然语言处理
Qwen2.5-Math-7B-Instruct是一个专注于数学问题求解的大型语言模型。该模型支持链式思考(CoT)和工具集成推理(TIR)方法,可解决中英文数学问题。相较于前代模型,它在多项数学基准测试中表现出色。模型擅长精确计算、符号操作和算法推理,在MATH基准测试中使用TIR方法获得85.3分。作为Qwen2.5-Math系列的指令微调版本,该模型适用于数学问题解答场景。
Mathematics-for-ML - 机器学习数学基础资源大全,线性代数到贝叶斯建模的全面指南
GithubMathematics for Machine Learning信息论开源项目概率论深度学习线性代数
全面的数学资源集合,覆盖机器学习所需的基础和高级数学概念。包括深度学习、概率论、统计学、线性代数和多元微积分,提供书籍、论文和视频讲座链接,帮助系统学习和复习这些重要知识。
MathHandwriting - 将手写数学公式转换为LaTeX的智能API服务
AI工具AI数学工具API集成LaTeX转换手写公式识别数学学习
MathHandwriting是一个将手写数学公式转换为LaTeX格式的API服务,利用先进的handwriting recognition技术。它连接模拟和数字mathematics世界,提高数学学习和教学效率,简化复杂公式的数字化过程。API响应速度快,易于集成,适用于数学教育和研究领域。最新更新使API响应时间提升2倍,专用集群性能提升3倍,为用户提供更高效的数学公式识别体验。
MathVista - 视觉数学推理评估基准
GithubMathVista多模态模型大语言模型开源项目数学推理视觉理解
MathVista是一个评估AI模型视觉数学推理能力的基准测试。该数据集包含6,141个样本,涵盖31个多模态数据集。任务要求模型具备深度视觉理解和复合推理能力,对当前顶尖AI模型构成挑战。MathVista为研究人员提供了一个衡量AI模型在视觉数学任务中表现的标准化工具。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号