#密集预测

CLIPSelf: 视觉Transformer自我蒸馏实现开放词汇密集预测

2 个月前

Cover of CLIPSelf: 视觉Transformer自我蒸馏实现开放词汇密集预测

CLIPSelf是一种创新的方法,通过自我蒸馏将CLIP ViT的图像级识别能力适应到局部图像区域,无需使用任何区域-文本对,在开放词汇目标检测、语义分割和全景分割等多个基准测试中取得了最先进的性能。

CLIPSelf 视觉Transformer 开放词汇密集预测 COCO Github 开源项目

2 个月前

Cover of CLIPSelf: 视觉Transformer自我蒸馏实现开放词汇密集预测

RS-Mamba: 革新大型遥感图像密集预测任务

2 个月前

Cover of RS-Mamba: 革新大型遥感图像密集预测任务

RS-Mamba是一种新型的遥感图像处理模型,专为大型高分辨率遥感图像的密集预测任务而设计。它采用创新的全方位选择性扫描模块,能够以线性复杂度有效捕获遥感图像的全局上下文信息,在语义分割和变化检测等任务中取得了最先进的性能。

RS-Mamba 遥感图像密集预测语义分割变化检测 Github 开源项目

2 个月前

Cover of RS-Mamba: 革新大型遥感图像密集预测任务

DenseCL: 一种创新的自监督视觉预训练方法

2 个月前

Cover of DenseCL: 一种创新的自监督视觉预训练方法

DenseCL是一种新颖的密集对比学习方法,旨在改进自监督视觉预训练,特别是对密集预测任务的性能。它通过在像素级别优化对比损失来学习更好的特征表示,显著提高了目标检测和语义分割等下游任务的性能。

自监督学习视觉预训练对比学习密集预测 Github 开源项目 DenseCL

2 个月前

Cover of DenseCL: 一种创新的自监督视觉预训练方法

相关项目

Project Cover

Official_Remote_Sensing_Mamba

RS-Mamba是一种专门针对大型遥感图像密集预测任务的创新模型。该模型首次将状态空间模型引入遥感领域,通过循环状态空间模型实现全局有效感受野,同时保持线性复杂度。RS-Mamba采用多方向选择性扫描技术,有效捕捉遥感图像的空间特征分布。在语义分割和变化检测任务中,RS-Mamba展现出卓越性能。项目提供开源代码和训练框架,为遥感图像分析研究提供了新的工具和方法。

Project Cover

DenseCL是一种自监督视觉预训练方法，通过密集对比学习提升模型在密集预测任务中的表现。该方法实现简洁，核心部分仅需10行代码，适配多种数据增强技术。实验表明，DenseCL在目标检测和语义分割任务中性能显著提升，同时保持训练效率。项目开源了预训练模型和使用指南，便于研究者在视觉任务中应用。

Project Cover

CLIPSelf项目提出创新自蒸馏方法,使视觉Transformer能进行开放词汇密集预测。该方法利用模型自身知识蒸馏,无需标注数据,提升了目标检测和实例分割等任务性能。项目开源代码和模型,提供详细训练测试说明,为计算机视觉研究提供重要资源。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号