#AlignBench

AlignBench - 多维度评估中文大语言模型对齐性能的基准

AlignBench大语言模型对齐水平评测GPT-4-0613Github开源项目

AlignBench 是多维度评估中文大语言模型对齐性能的评测基准。最新的 v1.1 版本提供了动态更新的数据、详细评分规则和高质量参考答案，确保评估的可靠性和可解释性。涵盖八大能力类别的数据主要来自真实用户问题，并使用 GPT-4 作为评分模型，通过多维度分析方法系统评估模型性能。

相关文章

Article Cover

AlignBench：全面评估中文大语言模型对齐性能的多维度基准

Article Cover

AlignBench入门指南 - 全面评估中文大语言模型对齐水平的基准

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号