热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#GPT-4-0613
AlignBench入门指南 - 全面评估中文大语言模型对齐水平的基准
1 个月前
AlignBench是一个专门用于评估中文大语言模型对齐性能的多维度基准测试。本文汇总了AlignBench项目的相关资源,帮助读者快速了解和使用这一评测工具。
AlignBench
大语言模型
对齐水平
评测
GPT-4-0613
Github
开源项目
1 个月前
AlignBench:全面评估中文大语言模型对齐性能的多维度基准
2 个月前
AlignBench是一个专门用于评估中文大语言模型与人类意图对齐程度的全面基准。它采用多维度评估方法,结合人工参与的数据构建流程和规则校准的LLM-as-Judge评价方式,为中文大模型的对齐性能提供了可靠且可解释的评测标准。
AlignBench
大语言模型
对齐水平
评测
GPT-4-0613
Github
开源项目
2 个月前
相关项目
AlignBench
AlignBench 是多维度评估中文大语言模型对齐性能的评测基准。最新的 v1.1 版本提供了动态更新的数据、详细评分规则和高质量参考答案,确保评估的可靠性和可解释性。涵盖八大能力类别的数据主要来自真实用户问题,并使用 GPT-4 作为评分模型,通过多维度分析方法系统评估模型性能。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号