Yi-1.5-9B-32K

中型开源模型性能显著提升

编程性能 Github 算术推理开源项目语言理解 Yi-1.5 Huggingface 开源模型模型

Yi-1.5-9B-32K作为中型开源模型，以其在语言理解、推理及阅读理解上的出色表现而著称。经过3.6T预训练和多样化微调，其在编码、数学和指令遵循能力上较前版有大幅提升，适合需要高效开源AI解决方案的用户。

Qwen1.5-32B-Chat-GGUF - 基于Transformer架构的多语言解码模型

GithubHuggingfaceQwen1.5多语言支持开源项目模型模型性能语言模型量化模型

Qwen1.5是基于Transformer的语言模型，在多个模型规模和多语言支持方面有显著提升。支持从0.5B到72B的不同模型规模，表现出色的人类偏好能力，所有模型都稳定支持32K上下文长度，无需额外信任远程代码。项目提供多种量化模型格式，并评估了Wiki数据集上的模型困惑度。改进的分词器增强了对多种自然语言和代码的支持。

TinyLlama-1.1B-intermediate-step-1195k-token-2.5T - TinyLlama项目中的1.1B模型实现高效计算

GithubHuggingfaceLLama 2TinyLlama优化开源项目模型模型参数预训练

TinyLlama通过创新方法，在2.5万亿tokens数据集上实现预训练，紧凑的1.1B参数设计提高了计算和内存效率，适用于多种开源项目。

MiniCPM3-4B - 轻量高效的开源模型支持长文本处理和函数调用

GithubHuggingfaceMiniCPM3人工智能大语言模型开源模型开源项目机器学习模型

MiniCPM3-4B是一款开源语言模型，仅用4B参数就达到了接近GPT-3.5-Turbo的性能。它具备32k上下文窗口、函数调用和代码解释器等功能，在中英双语、数学和编程等多个基准测试中表现出色。通过创新的训练策略，MiniCPM3-4B实现了与7B-9B模型相当的能力，为资源受限的AI应用场景提供了高效选择。

Phi-3-medium-4k-instruct - 轻量级多任务语言模型

GithubHuggingfacePhi-3大语言模型开源项目指令微调推理能力模型自然语言处理

Phi-3-medium-4k-instruct是一个14B参数的轻量级开源语言模型,在常识、语言理解、数学和编码等多项基准测试中表现优异。该模型采用高质量合成数据和公开数据训练,经过指令微调和安全优化,支持4K上下文长度。它适用于内存/计算受限环境和低延迟场景,可广泛应用于商业和研究领域。

Phi-3-medium-128k-instruct - 14B参数轻量级开源大语言模型支持128K上下文

GithubHuggingfacePhi-3人工智能基准测试开源项目推理能力模型语言模型

Phi-3-medium-128k-instruct是微软开发的14B参数轻量级开源大语言模型,支持128K上下文长度。该模型在常识、语言理解、数学、编程、长文本处理和逻辑推理等方面表现优异,与同等规模及更大模型相比表现出色。经过指令微调和偏好优化,适用于多种商业和研究场景,尤其适合资源受限环境、低延迟场景和需要强大推理能力的应用。

InternVL2-2B - 多模态大语言模型支持多语言及多媒体理解

GithubHuggingfaceInternVL2人工智能多模态大语言模型开源项目模型自然语言处理计算机视觉

InternVL2-2B是一个开源的多模态大语言模型,参数量为2.2B。该模型在文档理解、图表分析和场景文本识别等任务中表现优异,性能接近商业闭源模型。InternVL2-2B支持8K上下文窗口,可处理长文本、多图像和视频输入,大幅提升了多模态理解能力。作为一款出色的开源模型,InternVL2-2B为多模态人工智能研究和应用提供了新的可能性。

SciPhi-Mistral-7B-32k - 基于Mistral-7B-v0.1增强科学推理与教育能力的AI模型

GithubHuggingfaceSciPhi-Mistral-7B-32kTransformer大语言模型开源项目教育能力模型科学推理

SciPhi-Mistral-7B-32k是从Mistral-7B-v0.1微调而来的大型语言模型，通过四轮微调和超过十亿个token的数据集，实现了卓越的科学推理及教育能力。其特点包括采用变压器架构、组内查询注意力、滑窗注意力，并支持字节回退BPE分词器。SciPhi-Self-RAG-Mistral-7B-32k当前可用，具体细节可查看相关文档。

Qwen1.5-7B - 多语言大规模预训练模型支持32K上下文

GithubHuggingfaceQwen1.5人工智能多语言支持开源项目文本生成模型语言模型

Qwen1.5-7B是基于Transformer架构的大规模预训练语言模型，作为Qwen2的beta版本，在多个方面实现了显著改进。该模型提供多种规模选择，支持多语言处理，并稳定支持32K上下文长度。相比前代产品，Qwen1.5-7B在Chat模型性能、技术创新和分词器优化等方面都有提升，为自然语言处理和代码生成任务提供了更强大的基础模型。

Qwen2-1.5B-Instruct-GPTQ-Int4 - 多语言大模型Qwen2，增强理解与推理性能

GithubHuggingfaceQwen2-1.5B-Instruct开源项目性能模型语言模型量化

Qwen2语言模型系列在开源与专有模型对比中展现出色表现。1.5B Instruct模型优化后，适合编程、数学及推理任务，支持多语言和代码处理，并具备改进的分词功能。可高效兼容Hugging Face Transformers平台，推理速度快，内存占用低。

Sonya-7B - MT-Bench测试中表现出色的Sonya-7B模型

GithubHuggingfaceMT-BenchSonya-7B开源项目性能模型融合

Sonya-7B在MT-Bench测试中超越GPT-4，成为第一轮表现最佳且总排名第二的全能模型。该模型融合了xDAN-L1-Chat-RL-v1和Stealth v1.2等多种模型的优势，具备强大性能和一致的提示效果。Sonya-7B是一款设计用于多种任务的通用模型，适合助手和角色扮演。尽管表现出色，它仍为7B模型，推荐使用8192上下文窗口，并建议尝试16384上下文扩展。该模型为直接融合结果，未进行额外训练或微调。

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com