#开放词汇

CLIPSelf: 视觉Transformer自我蒸馏实现开放词汇密集预测

3 个月前
Cover of CLIPSelf: 视觉Transformer自我蒸馏实现开放词汇密集预测

YOLO-World: 开创实时开放词汇目标检测新纪元

3 个月前
Cover of YOLO-World: 开创实时开放词汇目标检测新纪元

CodeT: 利用生成测试实现高效代码生成

3 个月前
Cover of CodeT: 利用生成测试实现高效代码生成

开放词汇语义分割的最新进展与未来方向

3 个月前
Cover of 开放词汇语义分割的最新进展与未来方向

3D-OVS: 突破性的弱监督3D开放词汇分割技术

3 个月前
Cover of 3D-OVS: 突破性的弱监督3D开放词汇分割技术
相关项目
Project Cover

CoDet

CoDet是一种开放词汇目标检测方法,采用共现引导来对齐区域和词语。该方法利用大规模图像-文本对训练,在LVIS和COCO数据集上表现优异。CoDet兼容现代视觉基础模型,并可与Roboflow集成实现自动图像标注。这一方法为开放词汇目标检测领域提供了新的解决方案。

Project Cover

3D-OVS

3D-OVS是一种创新的弱监督3D开放词汇分割方法,仅依靠文本描述即可实现3D场景的精准分割。该技术融合TensoRF重建与CLIP特征提取,通过提示工程和DINO特征优化,提高了3D场景的语义理解能力。这一方法将3D视觉与自然语言处理有机结合,为多个领域的应用提供了新的可能性。

Project Cover

Awesome-Open-Vocabulary-Semantic-Segmentation

这是一个汇总开放词汇语义分割领域研究成果的项目。内容涵盖全监督、弱监督和无需训练等多种方法,同时收录零样本语义分割、指代图像分割和开放词汇目标检测等相关任务的论文。项目旨在为研究者提供该领域的最新进展概览。

Project Cover

YOLO-World

YOLO-World是一款创新的实时开放词汇目标检测模型。经过大规模数据集预训练,它展现出卓越的开放词汇检测和定位能力。采用'先提示后检测'范式,YOLO-World通过重参数化技术实现高效的自定义词汇推理。该模型支持零样本目标检测、分割等多种任务,并开源了在线演示、预训练权重和微调代码,为计算机视觉领域提供了实用的研究与应用工具。

Project Cover

CLIPSelf

CLIPSelf项目提出创新自蒸馏方法,使视觉Transformer能进行开放词汇密集预测。该方法利用模型自身知识蒸馏,无需标注数据,提升了目标检测和实例分割等任务性能。项目开源代码和模型,提供详细训练测试说明,为计算机视觉研究提供重要资源。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号