#循环评估

MMBench: 全面评估多模态模型能力的基准测试

2 个月前

2 个月前

相关项目

MMBench

MMBench是评估视觉语言模型多模态理解能力的基准测试集。它包含近3000道多项选择题,涵盖20个能力维度,采用循环评估和LLM选项提取等创新方法,提供可靠客观的评估。通过细粒度的能力测试和可重复的评价标准,MMBench为多模态模型开发提供了有价值的反馈。

投诉举报邮箱: service@vectorlightyear.com