热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#MMBench
MMBench: 全面评估多模态模型能力的基准测试
1 个月前
MMBench是一个创新的多模态基准测试,旨在全面评估大型视觉语言模型的多模态理解能力。它通过精心设计的数据集和评估策略,为模型开发提供了更细粒度、更客观的评估方法。
MMBench
多模态模型
评估基准
视觉语言模型
循环评估
Github
开源项目
1 个月前
相关项目
MMBench
MMBench是评估视觉语言模型多模态理解能力的基准测试集。它包含近3000道多项选择题,涵盖20个能力维度,采用循环评估和LLM选项提取等创新方法,提供可靠客观的评估。通过细粒度的能力测试和可重复的评价标准,MMBench为多模态模型开发提供了有价值的反馈。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号