#HallusionBench

HallusionBench: 挑战大型视觉语言模型的图像-文本推理基准

3 个月前

HallusionBench 视觉语言模型 AI评估多模态模型图像理解 Github 开源项目

3 个月前

相关项目

HallusionBench

HallusionBench是一个诊断视觉语言模型中语言幻觉和视觉错觉的测试集。通过图像-文本推理任务,它挑战了GPT-4V和LLaVA-1.5等顶级多模态模型。项目提供案例分析,揭示模型局限性,为改进提供见解。HallusionBench设有公开评测基准,欢迎研究人员贡献失败案例,推动多模态AI发展。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com