热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#对齐水平
AlignBench - 多维度评估中文大语言模型对齐性能的基准
Github
开源项目
大语言模型
AlignBench
对齐水平
评测
GPT-4-0613
AlignBench 是多维度评估中文大语言模型对齐性能的评测基准。最新的 v1.1 版本提供了动态更新的数据、详细评分规则和高质量参考答案,确保评估的可靠性和可解释性。涵盖八大能力类别的数据主要来自真实用户问题,并使用 GPT-4 作为评分模型,通过多维度分析方法系统评估模型性能。
1
1
相关文章
AlignBench:全面评估中文大语言模型对齐性能的多维度基准
3 个月前
AlignBench入门指南 - 全面评估中文大语言模型对齐水平的基准
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号