Yi-1.5项目概述
Yi-1.5是Yi模型的升级版本,它在现有Yi模型的基础上进行了持续的预训练。该项目通过高质量的5000亿token语料库预训练,并在300万个多样化的样本上进行了微调,从而实现了性能的全面提升。
核心特点与优势
相比前代Yi模型,Yi-1.5在多个关键领域都取得了显著进步:
- 代码能力显著增强
- 数学运算更为精准
- 推理能力大幅提升
- 指令遵循度更高
- 保持了优秀的语言理解能力
- 具备出色的常识推理水平
- 阅读理解能力表现突出
模型系列
Yi-1.5提供了多个不同规格的模型版本:
对话模型系列
- Yi-1.5-34B-Chat:最大规格对话模型
- Yi-1.5-9B-Chat:中等规格对话模型
- Yi-1.5-6B-Chat:轻量级对话模型
- 特别提供16K上下文窗口版本
基础模型系列
- Yi-1.5-34B:最大规格基础模型
- Yi-1.5-9B:中等规格基础模型
- Yi-1.5-6B:轻量级基础模型
- 部分型号支持32K超长上下文
性能表现
Yi-1.5系列模型在多项基准测试中展现出色表现:
- Yi-1.5-34B-Chat在大多数基准测试中的表现可以与更大规模的模型相媲美或超越
- Yi-1.5-9B-Chat在同等规模的开源模型中表现最佳
- 基础模型版本同样展现出强大实力,在多个测试中位居前列
技术规格
- 支持多种上下文长度:4K、16K、32K
- 预训练数据规模:3.6万亿tokens
- 提供完整的模型权重下载
- 可通过主流模型平台获取,如Hugging Face、ModelScope和wisemodel
开放获取
该项目采用Apache-2.0许可证,用户可以通过多个渠道获取模型:
- Hugging Face模型社区
- ModelScope模型平台
- wisemodel平台 所有版本都提供完整的模型文件下载,方便研究者和开发者使用。