热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#BridgeTower
bridgetower-large-itm-mlm-itc - BridgeTower 优化视觉语言表示学习的创新模型
模型
开源项目
Huggingface
BridgeTower
多模态
Github
预训练
图像文本匹配
视觉语言模型
BridgeTower模型通过在单模态和跨模态编码器间引入桥接层,实现了视觉和文本表示的有效对齐融合。仅用400万图像预训练,该模型在多个视觉语言任务上表现出色,如在VQAv2测试集达78.73%准确率。BridgeTower为视觉语言表示学习提供了新思路,显示出广阔应用前景。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号