#GPT-4-0613

AlignBench入门指南 - 全面评估中文大语言模型对齐水平的基准

1 个月前

AlignBench是一个专门用于评估中文大语言模型对齐性能的多维度基准测试。本文汇总了AlignBench项目的相关资源,帮助读者快速了解和使用这一评测工具。

1 个月前

2 个月前

AlignBench是一个专门用于评估中文大语言模型与人类意图对齐程度的全面基准。它采用多维度评估方法，结合人工参与的数据构建流程和规则校准的LLM-as-Judge评价方式，为中文大模型的对齐性能提供了可靠且可解释的评测标准。

2 个月前

投诉举报邮箱: service@vectorlightyear.com