#多模态评估

MMStar: 革新大型视觉语言模型评估的前沿基准

2 个月前

2 个月前

相关项目

MMStar

MMStar是一个创新的多模态评估基准，包含1500个精选的视觉关键样本。它解决了现有评估中的视觉冗余和数据泄露问题，提高了多模态性能评估的准确性。MMStar涵盖6大核心能力和18个细分维度，每个核心能力均衡分配250个样本。项目提供评估工具、数据集和在线排行榜，为视觉语言模型研究指明新方向。

投诉举报邮箱: service@vectorlightyear.com