Yi-9B-200K

Yi-9B-200K模型增强长文本处理，优化语言理解与推理

Yi系列大型语言模型开源项目模型 Github 开源 Huggingface 双语 Transformer

Yi系列开源语言模型通过Yi-9B-200K提升长文本解析能力，表现于代码、数学和逻辑推理上尤为突出。该模型使用截至2023年6月的数据集训练，跨语言功能强大，适用于个人、学术和商业环境。

文档

Qwen2-1.5B - 优秀性能和多语言能力的开源大语言模型

GithubHuggingfaceQwen2多语言能力大语言模型开源项目性能评估模型自然语言处理

Qwen2-1.5B是一款开源大语言模型，具有1.3B非嵌入参数。它在自然语言理解、生成、多语言处理、编程、数学和推理等领域表现优异。该模型在MMLU、GSM8K等多项基准测试中取得了优秀成绩，展现了较强的多语言能力。Qwen2-1.5B采用改进的Transformer架构，为进一步微调和应用奠定了基础。

Infinity-Instruct-3M-0625-Yi-1.5-9B - 大规模指令调优模型无需人类反馈的创新

GithubHuggingfaceInfinity Instruct北京智源人工智能研究院开源项目无强化学习模型模型训练深度学习

Infinity-Instruct-3M-0625-Yi-1.5-9B是一个开放源码的指导调优模型，不依赖于人类反馈强化学习。模型通过在Infinity-Instruct-3M上的微调展现了优异的性能，特别是在AlpacaEval 2.0和MT-Bench评估中表现突出。近期发布的InfInstruct-Mistral-7B 0625等模型权重优化了训练效率。借助FlagScale等创新训练技术，该模型大幅降低了训练成本，擅长处理数学和代码指令，并具备强大的聊天功能。该模型仅限于学术研究使用，不适用于商业用途。

Qwen2-72B - 新一代开源大语言模型在多个领域表现出色的中立评估

GithubHuggingfaceQwen2-72B多语言能力开源项目文本生成模型评估数据集语言模型

Qwen2系列大语言模型采用改进的Transformer架构，包含多种参数尺寸，加强了在多语言、编程、数学和推理领域的表现。Qwen2-72B模型对比现有开源和专有模型，展示了其在自然语言处理、代码生成和多语言翻译方面的竞争力，支持各类复杂任务的高效执行。了解更多关于模型的功能和实用建议，为语言技术应用提供支持。

Qwen2.5-3B-Instruct - 高性能多语言AI模型支持长文本处理

GithubHuggingfaceQwen2.5人工智能多语言支持大语言模型开源项目模型自然语言处理

Qwen2.5-3B-Instruct是Qwen2.5系列中的指令微调模型，拥有30亿参数。该模型在知识储备、编程和数学能力方面有显著提升，支持29种以上语言，能处理128K tokens的输入并生成8K tokens的输出。模型在指令遵循、长文本生成、结构化数据理解和JSON生成等方面表现优异，并能适应多样化的系统提示。采用因果语言模型架构，结合RoPE、SwiGLU等技术，提供高效的自然语言处理能力。

SciPhi-Mistral-7B-32k - 基于Mistral-7B-v0.1增强科学推理与教育能力的AI模型

GithubHuggingfaceSciPhi-Mistral-7B-32kTransformer大语言模型开源项目教育能力模型科学推理

SciPhi-Mistral-7B-32k是从Mistral-7B-v0.1微调而来的大型语言模型，通过四轮微调和超过十亿个token的数据集，实现了卓越的科学推理及教育能力。其特点包括采用变压器架构、组内查询注意力、滑窗注意力，并支持字节回退BPE分词器。SciPhi-Self-RAG-Mistral-7B-32k当前可用，具体细节可查看相关文档。

Qwen2.5-32B-Instruct-GPTQ-Int8 - 开源多语言大模型Qwen2.5 32B量化版支持超长文本处理

GithubHuggingfaceQwen2.5多语言支持大语言模型开源项目文本生成模型量化

Qwen2.5-32B-Instruct-GPTQ-Int8是Qwen2.5系列的量化版本，通过GPTQ 8位量化技术实现高效部署。模型支持29种语言交互，具备128K超长上下文理解和8K文本生成能力。在编程、数学计算、文本理解等任务中表现优异，同时对结构化数据处理能力显著提升。该模型采用325亿参数规模，适合在资源受限环境中运行

ChatGLM-6B - 高效灵活的开源双语对话模型的本地部署与定制

AI对话ChatGLM-6BGithub中英双语大语言模型开源开源项目

ChatGLM-6B是一款开源的中英双语对话语言模型，采用GLM架构，拥有62亿参数。该模型支持低资源设备部署，6GB显存即可运行。经过约1T标识符训练和多种技术优化，ChatGLM-6B能生成贴近人类偏好的回答。模型提供高效参数微调方法，便于开发者进行应用定制。该项目完全开放学术研究，同时允许免费商业使用，致力于推动大模型技术进步。

DeepSeek-LLM - 多语言大模型展现卓越编码与数学能力

DeepSeek LLMGithub人工智能开源开源项目自然语言处理语言模型

DeepSeek LLM是一个包含67亿参数的先进语言模型,经过2万亿英文和中文token的训练。该模型在推理、编码、数学和中文理解等方面表现优异,超越多个同类模型。其67B Chat版本在编码和数学方面尤为出色,在HumanEval和GSM8K等基准测试中名列前茅。项目开源了7B和67B的base与chat版本,可用于学术和商业研究。

babilong - BABILong基准测试长文本处理能力评估大语言模型极限

BABILongGithub开源项目推理能力数据集语言模型评估长文本处理

BABILong是一个用于评估自然语言处理模型长文本处理能力的基准测试。它将bAbI数据集的任务句子隐藏在PG19背景文本中，生成长达数百万标记的测试样本。该基准包含20个推理任务，涉及事实链接、归纳、演绎和计数等多个方面。BABILong为评估和改进大语言模型的长文本处理能力提供了有效工具，同时也对现有长文本模型提出了挑战。

Pretrained-Language-Model - 先进预训练语言模型与优化技术集合

GithubMindSporePyTorchTensorFlow开源项目自然语言处理预训练语言模型

此开源项目汇集了多个先进的预训练语言模型和相关优化技术。包含200B参数中文语言模型PanGu-α、高性能中文NLP模型NEZHA、模型压缩技术TinyBERT和DynaBERT等子项目。这些模型在多项中文NLP任务中表现出色，支持MindSpore、TensorFlow和PyTorch等多种深度学习框架。

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com