项目概述
Yi-1.5是Yi模型的升级版本,通过在高质量的500B token语料库上持续预训练,并在300万个多样化的样本上进行微调而成。相比于原有的Yi模型,Yi-1.5在编程、数学、推理和指令跟随等方面都有显著提升,同时保持了出色的语言理解、常识推理和阅读理解能力。
模型规格
Yi-1.5模型采用了3.6T的预训练token数据,支持4K、16K和32K的上下文长度,展现出强大的处理能力。目前该项目提供了多个不同规格的模型版本,以满足不同应用场景的需求。
模型系列
Yi-1.5项目提供两大类模型:
-
对话模型(Chat Models):
- Yi-1.5-34B-Chat系列(标准版和16K版本)
- Yi-1.5-9B-Chat系列(标准版和16K版本)
- Yi-1.5-6B-Chat版本
-
基础模型(Base Models):
- Yi-1.5-34B系列(标准版和32K版本)
- Yi-1.5-9B系列(标准版和32K版本)
- Yi-1.5-6B版本
性能表现
在性能评测方面,Yi-1.5展现出了卓越的表现:
- Yi-1.5-34B-Chat模型在多数基准测试中的表现可以与更大规模的模型相媲美,甚至有所超越
- Yi-1.5-9B-Chat模型在同等规模的开源模型中表现最为出色
- Yi-1.5-34B基础模型在某些基准测试中能够与更大规模的模型比肩
- Yi-1.5-9B基础模型在同等规模的开源模型中占据领先地位
获取途径
所有Yi-1.5系列模型均可通过以下平台获取:
- Hugging Face平台
- ModelScope平台
- WiseModel平台
开发支持
项目提供完整的技术文档和快速入门指南,开发者可以通过GitHub仓库获取详细的使用说明。此外,项目还提供了多个交流渠道,包括Discord、Twitter和微信群,方便用户交流讨论。项目团队同时维护着技术博客,并提供FAQ和学习中心,为开发者提供全方位的支持。