热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#DIVA
DIVA - 扩散模型辅助CLIP增强视觉理解能力
DIVA
CLIP
AI视觉
扩散模型
迁移学习
Github
开源项目
DIVA是一种创新方法,利用扩散模型作为视觉助手优化CLIP表示。通过文本到图像扩散模型的生成反馈,DIVA无需配对文本数据即可提升CLIP视觉能力。在MMVP-VLM细粒度视觉评估基准上,DIVA显著提升了CLIP性能,同时保持了其在29个图像分类和检索基准上的强大零样本能力。这为增强视觉语言模型的视觉理解开辟了新途径。
1
1
相关文章
DIVA: 利用扩散反馈提升CLIP视觉能力的创新方法
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号