ARC-AGI
ARC-AGI是一个评估人工通用智能抽象推理能力的基准测试项目。它提供800个任务,分为训练和评估两部分,每个任务包含输入/输出网格对。测试者需分析示例并推断正确的输出网格。项目配备浏览器界面,方便人类尝试解决任务。ARC-AGI不仅衡量AI系统,也适用于评估人类的通用流体智力,为AGI研究提供了重要参考。