热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#开放词汇物体检测
owlv2-base-patch16 - 零样本文本对象检测,提高计算机视觉的识别效果
CLIP
开放词汇物体检测
图像编码器
Huggingface
Github
开源项目
模型
零样本目标检测
OWLv2
OWLv2是一种多模态模型,通过结合CLIP的骨干和ViT样的Transformer,实现零样本文本对象检测。通过去除视觉模型的代币池层,并加入轻量级的分类和框头部,提升开放词汇分类的效果。使用公开的图像-文本数据集训练和微调,旨在优化图像与文本的匹配度。该模型目标帮助研究人员探索计算机视觉模型的鲁棒性和泛化性能,特别适用于未标注对象的识别领域,主要受众为AI研究人员
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号