热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#MMMU
MMMU学习资料汇总 - 全面评估多模态AI模型能力的基准测试
1 个月前
MMMU (Massive Multi-discipline Multimodal Understanding and Reasoning) 是一个旨在评估多模态AI模型在多学科领域理解和推理能力的基准测试。本文汇总了MMMU相关的学习资料,帮助读者快速了解和使用这一重要的评估工具。
MMMU
多模态理解
专家AGI
基准测试
GPT-4V(ision)
Github
开源项目
1 个月前
MMMU: 推动人工智能迈向专家级多模态理解与推理的里程碑
2 个月前
MMMU是一个创新的多学科多模态理解与推理基准测试,旨在评估人工智能模型在专家级任务中的表现。它涵盖了从艺术设计到工程技术的广泛学科,包含11.5K精心设计的多模态问题,为下一代AI模型的发展提供了新的方向和挑战。
MMMU
多模态理解
专家AGI
基准测试
GPT-4V(ision)
Github
开源项目
2 个月前
相关项目
MMMU
MMMU是一个新型基准测试,设计用于评估多模态模型在多学科任务中的表现,特别是需要大学水平的学科知识和深思熟虑的推理能力。该基准包含11.5K道来自大学考试、测验和教材的多模态题目,覆盖艺术设计、商业、科学、健康医学、人文社会科学及技术工程六大领域。不同于现有基准,MMMU专注于高级感知和领域特定知识的推理,挑战模型执行专家级任务。评估14个开源LMM和GPT-4V(ision)显示,即使是最先进的模型其准确率仅为56%,表明有巨大改进空间。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号