Yi-1.5-9B-Chat-16K

编码、数学和推理能力出色的高性能大语言模型

模型评测模型人工智能 Github 大语言模型 Yi-1.5 开源模型 Huggingface 开源项目

Yi-1.5是Yi系列的升级版本，经过5000亿高质量语料库的预训练和300万多样化样本的微调。该模型保持了优秀的语言理解、常识推理和阅读理解能力，同时显著提升了编码、数学、推理和指令遵循能力。Yi-1.5提供多种规模的基础模型和对话模型，在多项基准测试中表现优异，某些方面甚至超越了规模更大的模型。

Github

Huggingface

介绍相关项目

Qwen1.5-14B-Chat-AWQ - 高性能AWQ量化技术多语言模型完美支持32K长上下文

GithubHuggingfaceQwen1.5Transformer架构多语言支持开源项目模型聊天模型语言模型

Qwen1.5系列的14B参数量化版本，采用AWQ技术实现高性能与低资源消耗的平衡。模型支持多语言处理，具备32K上下文长度能力，并改进了对话质量。无需额外代码即可使用，整合了SwiGLU激活和优化的注意力机制，简化了开发流程。作为Qwen2的预览版，该模型在多个方面展现了性能提升。

vicuna-7b-v1.5-16k - 高性能开源聊天助手模型支持16K长文本输入

GithubHuggingfaceLlama 2Vicuna人工智能大语言模型开源项目机器学习模型

vicuna-7b-v1.5-16k是LMSYS开发的开源聊天模型，通过ShareGPT收集的12.5万条对话数据对Llama 2进行微调。模型支持16K上下文长度，采用线性RoPE缩放技术，主要应用于语言模型和聊天机器人研究。该项目提供完整的命令行界面和API接口，方便研究人员和开发者快速部署使用。

Qwen-1_8B-Chat - 18亿参数规模的高性能大语言模型

GithubHuggingfaceQwen-1.8B-Chat低成本部署多语言大语言模型开源项目模型系统指令

Qwen-1.8B-Chat是阿里云开发的18亿参数规模大语言模型,支持8192上下文长度。该模型采用大规模高质量语料训练,在多项中英文评测中表现优异。其15万词表规模有利于多语言处理。模型支持低成本部署,并可通过系统指令实现多样化功能。Qwen-1.8B-Chat在同等规模模型中展现出较强的综合能力。

Qwen-7B-Chat-Int4 - 大规模语言模型的高效应用

GithubHuggingfaceQwen-7B-Chat中文评测开源项目模型模型量化训练数据通义千问

Qwen-7B-Chat-Int4由阿里云基于Transformer架构开发，利用对齐机制和广泛的数据集进行训练，更新版在语言理解及数学和代码任务中表现出色。模型在多个任务中展现出较高的推理速度和低显存占用得益于其广泛预训练数据和先进的量化技术。优化后的分词器及加速方案便于多语言应用。更多信息请参见官方GitHub库。

chatglm2-6b - 性能升级的开源中英双语对话模型

ChatGLM2-6BGithubHuggingface人工智能对话模型开源开源项目模型自然语言处理

ChatGLM2-6B是ChatGLM-6B的升级版本，作为开源中英双语对话模型，它在性能、上下文长度和推理效率方面都有显著提升。经过1.4T标识符预训练，ChatGLM2-6B在多个数据集上表现优异，支持32K上下文长度，推理速度提高42%。此外，该模型采用更开放的协议，允许免费商业使用，为自然语言处理领域提供了强大的开源工具。

openchat-3.5-1210 - 7B参数规模开源语言模型在多项测试中超越大规模商业模型

GithubHuggingfaceOpenChat人工智能大语言模型开源项目性能评估模型

OpenChat-3.5-1210在Mistral-7B基础上采用C-RLFT技术开发，通过多样化数据训练实现性能突破。模型在编程、对话和数学推理等多个领域展现出色表现，基准测试成绩优于部分大规模商业模型。此外，模型还配备评估反馈功能，支持多种应用场景。作为参数规模仅7B的开源模型，OpenChat-3.5-1210体现了小型模型的巨大潜力。

starchat2-15b-v0.1 - 基于StarCoder2微调的双能力开源语言模型

GithubHuggingfaceStarChat2人工智能代码生成大模型开源项目模型语言模型

StarChat2-15b-v0.1是一款基于StarCoder2的开源语言模型，拥有160亿参数规模。该模型通过合成数据集微调，在MT Bench、IFEval聊天评测及HumanEval代码测试中展现了均衡性能。模型支持600多种编程语言，具备代码生成和对话交互功能。开发者可通过Transformers框架调用，需注意模型存在输出偏差等局限性。

Qwen2.5-1.5B - 多语言支持的15亿参数基础语言模型

GithubHuggingfaceQwen2.5人工智能大语言模型开源项目模型深度学习自然语言处理

Qwen2.5-1.5B是一个具有15亿参数的基础语言模型。它支持29种以上语言，可处理32,768个token的上下文，生成8K token的文本。该模型在编码、数学和结构化数据处理方面表现优异。采用transformer架构，包含RoPE和SwiGLU等技术。Qwen2.5-1.5B适合进一步微调和应用开发，但不建议直接用于对话任务。

Qwen1.5-1.8B - 多语言大规模语言模型支持32K上下文长度

GithubHuggingfaceQwen1.5人工智能多语言支持大语言模型开源项目模型自然语言处理

Qwen1.5是Qwen2的预览版，基于Transformer架构开发的解码器语言模型。它推出了8种不同规模的模型版本，涵盖0.5B至72B的常规模型和一个14B的MoE模型。相较于前代产品，Qwen1.5在对话系统性能、多语言处理能力和32K长文本理解等方面均有显著改进。技术上，该模型采用了SwiGLU激活函数、注意力机制的QKV偏置和分组查询等创新方法，同时优化了针对多语言和编程代码的分词器。

Yi-Ko-6B - 多语言大规模自动回归模型优化文本生成性能

GithubHuggingfaceYi-Ko-6B参数开源项目文本生成模型自回归模型语言模型

Yi-Ko-6B项目通过引入韩语和英语语料库，以及扩展词汇，实现对预训练模型的增强。该模型基于Llama-2优化的transformer架构，并拥有6亿参数，专注于文本生成任务。在AI2 Reasoning Challenge、HellaSwag和MMLU等多项基准测试中，模型展现了突出的多语言处理能力。此外，它还能高效执行韩语句子的词分段与生成。

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号