#认知水平

LawBench：评估大型语言模型法律知识的基准测试

3 个月前

LawBench 大语言模型法律知识评估认知水平数据集 Github 开源项目

3 个月前

相关项目

LawBench

LawBench通过模拟司法认知的三个维度，设计了20个任务，全面评估大语言模型的法律能力。这些任务包括法律知识记忆、理解和应用，涵盖了法律实体识别、阅读理解、犯罪金额计算和咨询等实际应用场景。LawBench还设立了“弃权率”作为独立评估指标，以衡量模型在法律问询下的回应情况。通过注重实际应用，LawBench为用户提供了可靠的大语言模型法律能力评估工具。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com