#SEED-Bench

SEED-Bench: 一个用于评估多模态大语言模型的综合基准

3 个月前

SEED-Bench 多模态大语言模型基准测试评估维度人工智能 Github 开源项目

3 个月前

相关项目

SEED-Bench

SEED-Bench是一个全面评估多模态大语言模型的基准测试。它包含28K个多项选择题，涵盖34个评估维度，包括文本和图像生成能力。该项目提供SEED-Bench-H、SEED-Bench-2-Plus等多个版本，分别针对不同评估方面。SEED-Bench为研究人员提供了一个客观比较多模态大语言模型性能的工具。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com