#评估维度

SEED-Bench - 多模态大语言模型评估基准

SEED-Bench多模态大语言模型基准测试评估维度人工智能Github开源项目

SEED-Bench是一个全面评估多模态大语言模型的基准测试。它包含28K个多项选择题，涵盖34个评估维度，包括文本和图像生成能力。该项目提供SEED-Bench-H、SEED-Bench-2-Plus等多个版本，分别针对不同评估方面。SEED-Bench为研究人员提供了一个客观比较多模态大语言模型性能的工具。

相关文章

Article Cover

SEED-Bench: 一个用于评估多模态大语言模型的综合基准

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号