#FLMR

Retrieval-Augmented Visual Question Answering:一种基于多模态检索的视觉问答新方法

3 个月前

FLMR 视觉问答多模态检索预训练模型基准测试 Github 开源项目

3 个月前

基于细粒度后期交互的多模态检索增强视觉问答系统

3 个月前

FLMR 视觉问答多模态检索预训练模型基准测试 Github 开源项目

3 个月前

相关项目

Retrieval-Augmented-Visual-Question-Answering

这个项目开发了一个基于细粒度后期交互多模态检索的视觉问答系统。系统在OK-VQA等多个基准数据集上实现了先进的检索和问答性能。它采用模块化架构,包含预训练映射网络、FLMR检索器和BLIP2读取器等关键组件。项目提供完整的代码库,支持训练和评估,并发布了预训练模型和处理后的数据集,便于研究人员进行后续研究。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com