#专家AGI

MMMU学习资料汇总 - 全面评估多模态AI模型能力的基准测试

2 个月前

MMMU 多模态理解专家AGI 基准测试 GPT-4V(ision)Github 开源项目

2 个月前

MMMU: 推动人工智能迈向专家级多模态理解与推理的里程碑

3 个月前

MMMU 多模态理解专家AGI 基准测试 GPT-4V(ision)Github 开源项目

3 个月前

相关项目

MMMU

MMMU是一个新型基准测试，设计用于评估多模态模型在多学科任务中的表现，特别是需要大学水平的学科知识和深思熟虑的推理能力。该基准包含11.5K道来自大学考试、测验和教材的多模态题目，覆盖艺术设计、商业、科学、健康医学、人文社会科学及技术工程六大领域。不同于现有基准，MMMU专注于高级感知和领域特定知识的推理，挑战模型执行专家级任务。评估14个开源LMM和GPT-4V(ision)显示，即使是最先进的模型其准确率仅为56%，表明有巨大改进空间。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com