Awesome-Chinese-LLM

项目介绍：Awesome Chinese LLM

简介

Awesome Chinese LLM 是一个致力于收集和整理与中文大型语言模型（Large Language Model，LLM）相关的开源模型、应用、数据集和教程的项目。目前已经收录了超过100个这样的资源。自从ChatGPT等大语言模型展现出令人惊叹的类通用人工智能（AGI）能力之后，大语言模型的研究和应用在自然语言处理领域中掀起了一股新的浪潮。特别是一些较小规模的LLM，如ChatGLM、LLaMA，让普通用户也能参与其中，带来了众多基于LLM的二次微调或应用案例。

项目目标

本项目的目标是通过提供详尽的中文LLM资源集合，帮助那些有兴趣进行LLM相关工作的人们更方便地获取所需资料。同时，项目也鼓励社区中的成员贡献尚未收录的开源模型、应用或数据集。

常见底座模型

以下是几种常见的中文LLM底座模型的概览：

底座	包含模型	模型参数大小	训练token数	训练最大长度	是否可商用
ChatGLM	ChatGLM/2/3/4 Base&Chat	6B	1T/1.4	2K/32K	可商用
LLaMA	LLaMA/2/3 Base&Chat	7B/8B/13B/33B/70B	1T/2T	2k/4k	部分可商用
Baichuan	Baichuan/2 Base&Chat	7B/13B	1.2T/1.4T	4k	可商用
Qwen	Qwen/1.5/2/2.5 Base&Chat&VL	7B/14B/32B/72B/110B	2.2T/3T/18T	8k/32k	可商用
BLOOM	BLOOM	1B/7B/176B-MT	1.5T	2k	可商用
Aquila	Aquila/2 Base/Chat	7B/34B	-	2k	可商用
InternLM	InternLM/2/2.5 Base/Chat/VL	7B/20B	-	200k	可商用
Mixtral	Base&Chat	8x7B	-	32k	可商用
Yi	Base&Chat	6B/9B/34B	3T	200k	可商用
DeepSeek	Base&Chat	1.3B/7B/33B/67B	-	4k	可商用
XVERSE	Base&Chat	7B/13B/65B/A4.2B	2.6T/3.2T	8k/16k/256k	可商用