热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#自动评价
alpaca_eval - 精确且成本低的指令追随语言模型自动评估工具
开源项目
AlpacaEval
评估
自动评价
instruction-following
GPT-4
Github
AlpacaEval是一款基于LLM的自动评估工具,针对指令追随模型(如ChatGPT)的评估,具备快速、低成本和高度人类相关性(0.98)的特点。主要功能包括模型排行榜、自动评估器、评估器构建工具包及20K人工偏好数据。AlpacaEval 2.0通过长度控制胜率,提高了与ChatBot Arena的对应性,适合模型开发阶段的快速评估。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号