lawyer-llama - 专业微调法律LLaMA模型

Lawyer LLaMA 项目简介

Lawyer LLaMA 是一个专注于法律领域的人工智能项目，致力于在充满挑战的法律环境中利用LLaMA模型，通过精细微调和法律特定训练，提升模型的性能。从根本上，Lawyer LLaMA 的目标是弥补LLaMA在法律领域的探索空白，增强其在法律知识应用中的能力。

项目背景

LLaMA模型在通用领域的表现优异，但是因缺乏相关数据，很少有人探究LLaMA在法律领域的具体表现。Lawyer LLaMA正是为了解决这一问题而推出的，其通过对大规模法律语料的持续训练，系统学习中国法律知识。随后，利用ChatGPT生成了针对中国国家统一法律职业资格考试（简称法考）的题目解析和法律咨询回复数据，进行指令微调训练，使模型能将法律知识有效应用于实际场景。

模型能力

Lawyer LLaMA 经过训练，能够：

掌握中国法律知识： 精通民法、刑法、行政法、诉讼法等多个领域的法律概念，能够正确分析和回答法考中的大部分题目。
应用于实际法律事务： 能用简单易懂的语言解释法律概念，并能提供涵盖婚姻、借贷、海商、刑事等领域的基础法律咨询。

数据与技术更新

本项目将开源法律领域的指令微调数据和基于LLaMA训练的中文法律大模型参数，以支持中文法律大模型的进一步研究。以下是项目的更新：

2024年4月25日: 发布了新版的 Lawyer LLaMA 2 (lawyer-llama-13b-v2) 模型参数，并提高了法律指令微调数据的质量。
2023年10月14日: 更新了技术报告《Lawyer LLaMA: Enhancing LLMs with Legal Knowledge》，提供更多技术细节。
2023年6月8日: 开源了 lawyer-llama-13b-beta1.0 模型参数。
2023年5月25日: 发布了包含用户问题相关法条的对话数据和《Lawyer LLaMA技术报告》。
2023年4月13日: 开源了由ChatGPT生成的2k法考试题解答及5k法律咨询回复的指令微调数据。