Lawyer LLaMA简介
Lawyer LLaMA是一个基于LLaMA训练的中文法律大模型,由北京大学团队开发。该模型在大规模中文法律语料上进行了持续预训练,并利用ChatGPT生成的法律指令数据进行了指令微调,使其具备了较强的中国法律知识和法律应用能力。
主要特点
-
掌握中国法律知识: 能够正确理解民法、刑法、行政法、诉讼法等领域的法律概念。
-
应用于中国法律实务: 能以通俗易懂的语言解释法律概念,进行基础法律咨询。
-
开源模型与数据: 开源了法律领域的指令微调数据和模型参数。
学习资源
1. GitHub仓库
项目的主要代码和资源都托管在GitHub上:
https://github.com/AndrewZhe/lawyer-llama
在这里可以找到:
- 详细的项目介绍
- 训练数据说明
- 模型使用指南
- 评测结果等
2. 技术报告
详细的技术细节可以参考arXiv上的论文:
Lawyer LLaMA: Enhancing LLMs with Legal Knowledge
3. 模型下载
目前公开了两个版本的模型:
lawyer-llama-13b-v2
: 最新版本,基于LLaMA-2lawyer-llama-13b-beta1.0
: 旧版本,基于LLaMA-1
可以在Hugging Face上下载模型权重:
https://huggingface.co/pkupie/lawyer-llama-13b-v2
4. 使用教程
如何使用模型进行推理,可以参考以下两个文档:
5. 数据集
项目还开源了用于训练的法律指令数据,包括法考题解答和法律咨询等,可以在GitHub仓库的data目录下找到。
社区贡献
除了官方资源,社区中也有一些有用的贡献:
总结
Lawyer LLaMA为中文法律AI的研究提供了宝贵的开源资源。无论是想了解项目细节,还是希望直接使用模型,上述资料都能提供很好的参考。但需要注意的是,模型输出并非专业法律意见,如需法律援助请咨询专业人士。
希望这份资料汇总能帮助大家更好地学习和使用Lawyer LLaMA项目。如果对项目有任何疑问,也可以在GitHub上提issue与开发者交流。