#Q-Bench

Q-Bench：多模态大语言模型在低层视觉任务上的基准测试

2 个月前

Q-Bench 低层视觉多模态大语言模型基准测试 ICLR2024 Github 开源项目

2 个月前

相关项目

Q-Bench

Q-Bench是一个评估多模态大语言模型低层视觉能力的基准测试。它通过感知、描述和评估三个领域，使用LLVisionQA和LLDescribe数据集测试模型性能。该项目采用开放式评估框架，支持研究者提交结果或模型。Q-Bench对比了开源和闭源模型的表现，并与人类专家水平进行对照，为深入理解和提升多模态AI的基础视觉处理能力提供了关键洞察。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com