rho

选择性语言建模优化数学推理能力的语言模型

Rho-1项目采用选择性语言建模(SLM)技术,通过聚焦有价值token进行预训练。该模型在GSM8k和MATH等数学推理任务上表现突出,以较少训练量达到基线水平。项目发布了base和code interpreter等多个版本,展现了优秀的数学推理能力。

访问官网

Reasoning-0.5b-GGUF - 量化推理模型优化文本生成效果

GithubHuggingfaceReasoning-0.5bllama.cpp嵌入/输出权重开源项目文本生成模型量化

页面介绍了Reasoning-0.5b模型的多种量化版本，优化了ARM及其他平台的推理速度与性能。在LM Studio运行模型有助于在低RAM环境下展现性能优势。内容包括量化文件的特性、推荐下载链接、使用建议，以及在不同计算平台上的应用效果。用户通过huggingface-cli可依据硬件资源选择合适模型，提升性能效率。

SauerkrautLM-Gemma-7b - 双语AI模型的新训练技术应用

GithubHuggingfaceSauerkrautLM-Gemma-7b双语技能开源项目模型模型微调激光RMT训练技术

SauerkrautLM-Gemma-7b是VAGO solutions与Hyperspace.ai合作开发的AI语言模型。此模型运用激光QLoRA技术来强化语言与数学技能，并采用独特的数据选择周期提升其性能。在多个基准测试中的表现显著提升，显示出其潜在价值。尽管仍在早期阶段，偶尔会有不寻常表现，但在Open LLM榜单上仍有优良表现。

rwkv.cpp - 多精度量化推理和CPU优化的大语言模型

GithubPythonRWKVcuBLASggmlhipBLAS开源项目

该项目将RWKV-LM移植到ggerganov的ggml，支持FP32、FP16及量化的INT4、INT5和INT8推理，主要针对CPU使用，同时兼容cuBLAS。项目提供C库和Python封装。RWKV是一种不同于Transformer的大语言模型架构，只需前一步状态计算logits，适合长上下文使用。支持RWKV v5和v6模型以及LoRA检查点加载，适用于高质量和高性能需求的场景。

T0_3B - 小规模T0模型超越GPT-3，进行零样本自然语言任务处理

GithubHuggingfaceT0偏见与公平性开源项目模型模型训练自然语言处理评估数据

T0*模型通过自然语言提示实现零样本任务泛化，性能超越GPT-3，且模型体积缩小至16分之一。该模型在多任务提示数据集中微调，能够针对未见任务做出高效预测。适用于多种推理场景，包括情感分析、句子重排列和词义判断等。其训练数据源自多个数据集并经过严谨评估，保障模型性能可靠性。虽然T0*模型参数较大，但通过优化和并行化方案能够有效应用于多GPU环境。

Phi-3-mini-4k-instruct-llamafile - 提供跨平台AI权重，实现高效文本生成

AI模型GithubHuggingfacePhi-3-mini-4k-instruct开源项目推理能力模型责任感考量量化格式

Phi-3-Mini-4K-Instruct项目采用llamafile格式，提供可在Linux、MacOS、Windows等多平台运行的AI权重，适用于文本生成任务。其优化推理能力在语言理解、数学和代码等领域表现优异，尤其在内存和计算资源受限环境中有效。使用者需结合具体场景考虑模型适用性及潜在限制。

GPT4RoI - 大型语言模型的区域感知能力优化

GPT4RoIGithubLLaMA模型区域感兴趣调整大型语言模型开源项目视觉认知

GPT4RoI项目专注于优化大型语言模型的区域感知能力，发布新版本GPT4RoI-7B-delta-V0来提升性能。该项目提供完整的训练与推理代码，并有在线演示以提升用户体验。项目包含了详尽的数据集和权重处理方法，便于研究者和开发者有效应用于区域相关的语言模型任务。

rtp-llm - 大型语言模型推理加速引擎

CUDAGithubrtp-llm多模态输入大语言模型开源项目量化

rtp-llm是阿里巴巴基础模型推理团队开发的大型语言模型推理加速引擎，广泛应用于支持淘宝问答、天猫、菜鸟网络等业务，并显著提升处理效率。该项目基于高性能CUDA技术，支持多种权重格式和多模态输入处理，跨多个硬件后端。新版本增强了GPU内存管理和设备后端，优化了动态批处理功能，提高了用户的使用和体验效率。

SmolLM-360M - 3.6亿参数的高效语言模型专注常识推理和知识理解

GithubHuggingfaceSmolLM人工智能开源项目模型模型训练神经网络语言模型

SmolLM-360M是一款拥有3.6亿参数的高效语言模型，基于Cosmo-Corpus数据集训练而成。该模型利用Cosmopedia v2合成教材、Python-Edu教育样本和FineWeb-Edu网络教育资源等高质量数据，在常识推理和世界知识等多项基准测试中表现出色。SmolLM-360M支持CPU/GPU部署，并提供8位和4位量化版本以优化内存使用。这款模型主要面向英语内容生成和理解，可作为AI辅助工具在多种场景中应用。

Vikhr-Nemo-12B-Instruct-R-21-09-24 - 全新升级的俄英双语大语言模型内置RAG检索增强功能

GithubHuggingfaceRAG技术Vikhr-Nemo人工智能开源项目机器学习模型语言模型

Vikhr-Nemo-12B-Instruct-R是一个基于Mistral-Nemo的开源语言模型,针对俄语和英语进行了深度优化。模型通过SFT和SMPO方法训练,具备推理分析、文本生成、代码编写等多项能力。其特色在于支持RAG检索增强和128K长文本处理,在俄语基准测试中接近gpt-4o-mini水平。该项目完全开源,包含训练代码和数据集。

abel - 数学生成式AI Abel 7B模型在GSM8K和MATH上取得突破性成果

AbelGAIRGithub开源项目数学推理模型性能生成性AI

Abel项目通过优化数学推理模型，在GSM8K和MATH数据集上取得了显著进展。特别是其7B模型达到了超过80%的准确率，并在多个数学数据集上展示了优秀的泛化能力。该项目采用独特的Parental Oversight策略和SFT（监督微调），显著提升了模型性能，无需依赖外部工具和奖励模型。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能，包括文生视频、动态画面和形象生成等，帮助用户快速上手，创造专业级内容。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台，用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品，帮助用户探索创意灵感。

讯飞文书

讯飞文书依托讯飞星火大模型，为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能，满足事务性工作的高频需求，帮助撰稿人节省精力，提高效率，优化工作与生活。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com