#开放词汇

CLIPSelf: 视觉Transformer自我蒸馏实现开放词汇密集预测

3 个月前

CLIPSelf 视觉Transformer 开放词汇密集预测 COCO Github 开源项目

3 个月前

YOLO-World: 开创实时开放词汇目标检测新纪元

3 个月前

YOLO-World 目标检测开放词汇预训练模型零样本学习 Github 开源项目

3 个月前

CodeT: 利用生成测试实现高效代码生成

3 个月前

CoDet 目标检测开放词汇图像文本对齐深度学习 Github 开源项目

3 个月前

开放词汇语义分割的最新进展与未来方向

3 个月前

开放词汇语义分割计算机视觉深度学习 CLIP Github 开源项目

3 个月前

3D-OVS: 突破性的弱监督3D开放词汇分割技术

3 个月前

3D分割开放词汇弱监督学习 TensoRF CLIP特征 Github 开源项目

3 个月前

相关项目

CoDet

CoDet是一种开放词汇目标检测方法，采用共现引导来对齐区域和词语。该方法利用大规模图像-文本对训练，在LVIS和COCO数据集上表现优异。CoDet兼容现代视觉基础模型，并可与Roboflow集成实现自动图像标注。这一方法为开放词汇目标检测领域提供了新的解决方案。

3D-OVS

3D-OVS是一种创新的弱监督3D开放词汇分割方法，仅依靠文本描述即可实现3D场景的精准分割。该技术融合TensoRF重建与CLIP特征提取，通过提示工程和DINO特征优化，提高了3D场景的语义理解能力。这一方法将3D视觉与自然语言处理有机结合，为多个领域的应用提供了新的可能性。

Awesome-Open-Vocabulary-Semantic-Segmentation

这是一个汇总开放词汇语义分割领域研究成果的项目。内容涵盖全监督、弱监督和无需训练等多种方法，同时收录零样本语义分割、指代图像分割和开放词汇目标检测等相关任务的论文。项目旨在为研究者提供该领域的最新进展概览。

YOLO-World

YOLO-World是一款创新的实时开放词汇目标检测模型。经过大规模数据集预训练,它展现出卓越的开放词汇检测和定位能力。采用'先提示后检测'范式,YOLO-World通过重参数化技术实现高效的自定义词汇推理。该模型支持零样本目标检测、分割等多种任务,并开源了在线演示、预训练权重和微调代码,为计算机视觉领域提供了实用的研究与应用工具。

CLIPSelf

CLIPSelf项目提出创新自蒸馏方法,使视觉Transformer能进行开放词汇密集预测。该方法利用模型自身知识蒸馏,无需标注数据,提升了目标检测和实例分割等任务性能。项目开源代码和模型,提供详细训练测试说明,为计算机视觉研究提供重要资源。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com