热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#AGIEval
AGIEval - 全面评估AI模型人类认知能力的基准测试
AGIEval
基准测试
基础模型
人工智能评估
自然语言处理
Github
开源项目
AGIEval是一个评估AI基础模型人类认知能力的综合基准。它包含20个源自高标准入学和资格考试的任务,涉及多个领域。AGIEval提供完整数据集、基线系统评估和详细评估方法,是衡量AI模型综合能力的权威工具。最新版本支持多语言评估,并设有完整排行榜,为研究人员提供了全面的AI模型能力评估平台。
1
1
相关文章
AGIEval:一个人类中心的基础模型评估基准测试
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号