rho

选择性语言建模优化数学推理能力的语言模型

Rho-1项目采用选择性语言建模(SLM)技术,通过聚焦有价值token进行预训练。该模型在GSM8k和MATH等数学推理任务上表现突出,以较少训练量达到基线水平。项目发布了base和code interpreter等多个版本,展现了优秀的数学推理能力。

访问官网

Groma - 多模态大语言模型Groma的视觉定位技术

GithubGroma区域理解多模态大语言模型开源项目视觉上下文视觉标记

Groma是一款多模态大语言模型，具有出色的区域理解和视觉定位功能，能够处理用户定义的区域输入并生成基于视觉内容的长文本回答。Groma采用独特的视觉标记和外部模块进行定位，在多模态引用表达理解基准方面表现优秀，并提供详细的安装、数据准备和训练指南，方便用户进行自定义训练。

DeepSeek-LLM - 多语言大模型展现卓越编码与数学能力

DeepSeek LLMGithub人工智能开源开源项目自然语言处理语言模型

DeepSeek LLM是一个包含67亿参数的先进语言模型,经过2万亿英文和中文token的训练。该模型在推理、编码、数学和中文理解等方面表现优异,超越多个同类模型。其67B Chat版本在编码和数学方面尤为出色,在HumanEval和GSM8K等基准测试中名列前茅。项目开源了7B和67B的base与chat版本,可用于学术和商业研究。

NuminaMath-7B-TIR - 采用工具集成推理技术的数学问题解决语言模型

GithubHuggingfaceNuminaMath工具集成推理开源项目数学问题解决模型模型性能训练程序

NuminaMath 7B TIR是一种使用工具集成推理技术训练的语言模型，专门为数学问题解决而设计，在AI数学奥林匹克测试中取得了29/50的得分。经过深度微调，该模型能够处理从基础到高阶数学的复杂问题，尤其是在GSM8k和MATH等基准测试中表现优异。模型基于DeepSeek基础版优化，利用大规模数据集，通过逐步解题和工具推理增强问题解决能力，适合用于数学问题解决和教育场景。

replit-code-v1_5-3b - 代码补全的多编程语言支持模型

GithubHuggingfaceMosaicMLReplit Code v1.5transformers代码补全开源项目模型编程语言

Replit Code v1.5是具备3.3B参数的新型语言模型，专注于代码补全功能，支持30种编程语言，包括Java、Python和C++。在MosaicML平台上训练，利用特制的GPTNeoX分词器和优化词汇表处理1万亿代码代币。该模型适合商用及作为特定应用的基础模型模块。

SeaLLM-7B-v2 - 东南亚多语言大模型的新选择

GPT-3.5GithubHuggingfaceSeaLLM-7B-v2东南亚语言多语言开源项目数学推理模型

SeaLLM-7B-v2是一款经过多语言优化的开源大模型，专注于提升东南亚语言的推理能力。与前代 SeaLLM-13B 相比，该模型体积减小一半，但性能表现更出色，特别是在78.2分的GSM8K零样本推理任务中领先同类产品，并在多种语言的数学推理测试中超过GPT-3.5。凭借其稳健的多语言支持和开源特性，SeaLLM-7B-v2在数学推理、常识推理和多语言知识评估等多个领域中展示了强大的应用潜力，成为多语言文化与技术研究的有力工具。

RWKV-LM - 高性能并行化RNN，探索和应用RWKV模型

GithubRNNRWKVTransformer并行化开源项目性能

RWKV是一个高性能的并行化RNN，具有变换器级别的性能。该模型实现了快速的推理和训练速度，不依赖于传统的注意力机制，而是通过隐藏状态进行计算，优化了VRAM的使用，并支持处理无限长度的文本上下文。RWKV的这些特点使其在进行句子嵌入和处理复杂文本任务时显示出优越的能力。

OLMo - 开源语言模型加速科学研究

GithubOLMo人工智能开源语言模型开源项目机器学习自然语言处理

OLMo是一个开源语言模型项目，提供多种规模的先进模型，如1B、7B和7B Twin 2T，全部基于Dolma数据集训练。该项目支持模型训练、微调和推理，提供详细配置和检查点以确保研究可重现。OLMo还包含数据检查和评估工具，为语言模型研究提供全面支持，旨在加速这一领域的科学进展。

Llama-3.1-Nemotron-70B-Instruct-HF-FP8-dynamic - 多语种量化优化模型，显著降低内存占用

GithubHuggingfaceLlama-3.1-Nemotron-70B-Instruct-HF-FP8-dynamic多语言支持开源项目文本生成模型模型优化量化

通过将权重和激活量化为FP8格式，该项目优化了Llama-3.1-Nemotron模型，显著降低了GPU内存与磁盘的占用。模型适用于商业与研究，支持多语言开发和会话助手的构建。利用vLLM，可以实现高效部署并具有OpenAI兼容性。Llama-3.1-Nemotron-70B-Instruct-HF-FP8-dynamic在诸多测试中表现优良，在Arena-Hard评估中达99.41%的恢复率。

llm-toys - 微调小型语言模型实现多任务处理

Githubllm-toys任务微调低资源模型对话摘要开源项目语气变化

llm-toys 项目提供适用于释义、语气转换、对话总结和主题生成等任务的小型量化3B和7B语言模型。这些经过微调的模型能在普通消费级硬件上高效运行，并通过简单的安装步骤提升文本处理和生成能力。

llama2.rs - Rust开发的高效Llama2 CPU推理库

CPU推理GithubLlama2RustSIMD开源项目量化

llama2.rs是一个用Rust开发的Llama2 CPU推理库，专注于提供高性能的推理能力。项目支持4位GPT-Q量化、批量预填充提示标记、SIMD加速和内存映射等技术，实现了70B模型的即时加载。通过Python API，开发者可在普通台式机上运行70B Llama2模型（1 token/s）和7B模型（9 tokens/s）。该项目为大规模语言模型的CPU推理提供了高效且灵活的开源解决方案。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能，包括文生视频、动态画面和形象生成等，帮助用户快速上手，创造专业级内容。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台，用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品，帮助用户探索创意灵感。

讯飞文书

讯飞文书依托讯飞星火大模型，为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能，满足事务性工作的高频需求，帮助撰稿人节省精力，提高效率，优化工作与生活。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com