Baichuan2-13B-Chat项目介绍
Baichuan2-13B-Chat是百川智能推出的新一代大型开源语言模型之一。这个模型是Baichuan 2系列中的13B参数规模的对话版本,代表了当前开源大模型的先进水平。
模型特点
- 采用2.6万亿高质量tokens进行训练
- 在权威的中英文基准测试中取得同规模最佳成绩
- 提供Base和Chat两个版本,以及4bit量化版本
- 对学术研究完全开放,商用只需申请许可即可免费使用
性能表现
在C-Eval、MMLU、CMMLU等权威评测集上,Baichuan2-13B-Base模型的表现如下:
- C-Eval: 58.10 (5-shot)
- MMLU: 59.17 (5-shot)
- CMMLU: 61.97 (5-shot)
- Gaokao: 54.33 (5-shot)
- AGIEval: 48.17 (5-shot)
- BBH: 48.78 (3-shot)
这些成绩均超过了同规模的其他开源模型。
使用方法
使用Baichuan2-13B-Chat模型需要PyTorch 2.0及以上环境。可以通过Hugging Face Transformers库快速加载和使用:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("baichuan-inc/Baichuan2-13B-Chat",
revision="v2.0",
trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("baichuan-inc/Baichuan2-13B-Chat",
revision="v2.0",
device_map="auto",
torch_dtype=torch.bfloat16,
trust_remote_code=True)
然后可以通过model.chat()方法进行对话交互。
开源协议
Baichuan2-13B-Chat采用Apache 2.0开源协议,同时还需遵守《Baichuan 2模型社区许可协议》。商用时需满足一定条件并申请许可。
总结
Baichuan2-13B-Chat是一个强大的开源大语言模型,在多个领域展现出色性能。它为AI研究和应用提供了宝贵的资源,有望推动相关技术的进步和创新。