#AGIEval

AGIEval：一个人类中心的基础模型评估基准测试

3 个月前

3 个月前

相关项目

AGIEval

AGIEval是一个评估AI基础模型人类认知能力的综合基准。它包含20个源自高标准入学和资格考试的任务，涉及多个领域。AGIEval提供完整数据集、基线系统评估和详细评估方法，是衡量AI模型综合能力的权威工具。最新版本支持多语言评估，并设有完整排行榜，为研究人员提供了全面的AI模型能力评估平台。

投诉举报邮箱: service@vectorlightyear.com