热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#SEED-Bench
SEED-Bench: 一个用于评估多模态大语言模型的综合基准
2 个月前
SEED-Bench是一个全面的多模态大语言模型评估基准,包含了大量人工标注的多选题,涵盖了从基础视觉理解到复杂推理的多个维度,旨在全面评估模型的多模态能力。
SEED-Bench
多模态大语言模型
基准测试
评估维度
人工智能
Github
开源项目
2 个月前
相关项目
SEED-Bench
SEED-Bench是一个全面评估多模态大语言模型的基准测试。它包含28K个多项选择题,涵盖34个评估维度,包括文本和图像生成能力。该项目提供SEED-Bench-H、SEED-Bench-2-Plus等多个版本,分别针对不同评估方面。SEED-Bench为研究人员提供了一个客观比较多模态大语言模型性能的工具。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号