Vicuna-13B-v1.3 项目介绍
Vicuna-13B-v1.3 是由 LMSYS 开发的一个对话助手模型。该模型通过对 LLaMA 模型进行微调而成,LLaMA 模型是一个基于 Transformer 架构的自回归语言模型。为了训练 Vicuna 模型,研究人员收集了来自 ShareGPT 的用户共享对话,数量约为 12.5 万条。
开发背景
- 模型开发者:LMSYS
- 模型类型:基于 Transformer 架构的自回归语言模型
- 许可证:非商业许可证
- 基础模型:LLaMA
模型资源
主要用途
Vicuna 模型主要用于研究大型语言模型和聊天机器人。它的主要目标用户是从事自然语言处理、机器学习和人工智能研究的研究人员和爱好者。
如何开始使用
如需开始使用 Vicuna 模型,可以通过以下方式:
训练细节
Vicuna v1.3 是通过监督学习微调技术,从 LLaMA 模型基础上进行的微调。训练数据主要由从 ShareGPT.com 收集的对话构成,其数量约为 125,000 条。有关训练细节的更多信息可以在研究论文的附录中查看。
评估方式
针对 Vicuna 模型的评估,研究团队使用了标准基准测试、人类偏好测试和大型语言模型作为评判的方法。详细的评估信息可以参考这篇论文和 排行榜。
不同版本的区别
关于 Vicuna 不同版本之间的区别,可以访问 vicuna_weights_version.md 获取详细信息。