#COCO

tensorflow-yolov3实现指南与学习资料汇总 - YOLOv3目标检测的TensorFlow实现

2 个月前

YOLOv3 TensorFlow 2.0 目标检测 COCO VOC Github 开源项目

2 个月前

SSD-Tensorflow学习资料汇总 - 使用TensorFlow实现单发多框检测器

2 个月前

SSD TensorFlow VGG Pascal VOC COCO Github 开源项目

2 个月前

CLIPSelf: 视觉Transformer自我蒸馏实现开放词汇密集预测

3 个月前

CLIPSelf 视觉Transformer 开放词汇密集预测 COCO Github 开源项目

3 个月前

深入探讨学习障碍(LD):定义、识别与支持策略

3 个月前

目标检测知识蒸馏定位蒸馏 COCO PASCAL VOC Github 开源项目

3 个月前

DINO: 基于改进的去噪锚框的端到端目标检测算法

3 个月前

DINO 目标检测图像分割深度学习 COCO Github 开源项目

3 个月前

TensorFlow实现YOLOv3目标检测算法:原理、实现与应用

3 个月前

YOLOv3 TensorFlow 2.0 目标检测 COCO VOC Github 开源项目

3 个月前

SSD-Tensorflow: 基于TensorFlow实现的单发多框检测器

3 个月前

SSD TensorFlow VGG Pascal VOC COCO Github 开源项目

3 个月前

相关项目

tensorflow-yolov3

本文介绍了使用TensorFlow 2.0实现YOLOv3目标检测的方法，包括快速入门、训练自定义数据集和在VOC数据集上的评估。提供详细的代码示例和步骤说明，帮助开发者轻松训练和应用目标检测模型。文中附有中文博客链接，提供更多学习资源。

SSD-Tensorflow

SSD是一种高效的目标检测框架，利用单一网络结构实现物体识别。该项目提供了TensorFlow的重实现版本，支持VGG架构并且易于扩展到其他变种，如ResNet和Inception。项目包括数据集接口、网络定义和数据预处理模块，用户可以通过提供的脚本进行模型训练和评估，支持Pascal VOC数据集。代码和示例帮助用户快速上手并应用于实际检测任务。

DINO

DINO采用改良的降噪锚框，提供先进的端到端目标检测功能，并在COCO数据集上实现了优异的性能表现。模型在较小的模型和数据规模下，达到了63.3AP的优秀成绩。DINO具有快速收敛的特点，使用ResNet-50主干网络仅在12个周期内即可达到49.4AP。项目还提供丰富的模型库和详细的性能评估，用户可以通过Google Drive或百度网盘获取模型检查点和训练日志。

CLIPSelf

CLIPSelf项目提出创新自蒸馏方法,使视觉Transformer能进行开放词汇密集预测。该方法利用模型自身知识蒸馏,无需标注数据,提升了目标检测和实例分割等任务性能。项目开源代码和模型,提供详细训练测试说明,为计算机视觉研究提供重要资源。

LD项目提出了一种创新的定位蒸馏方法，旨在高效传递教师模型的定位知识到学生模型。该方法重构了定位知识蒸馏过程，并引入了有价值定位区域的概念，有选择地蒸馏语义和定位信息。实验结果显示，在不增加推理时间的前提下，LD能将GFocal-ResNet-50模型在COCO数据集上的AP从40.1提升至42.1。这种简单有效的蒸馏方案适用于多种密集目标检测器。

mask2former-swin-large-coco-instance

Mask2Former在COCO数据集上的实例分割中表现出色，采用Swin骨干网，通过掩码预测和标签分类统一处理多种分割任务。相比MaskFormer，其改进的多尺度变形注意力机制提升了性能，并且不增加计算量的情况下优化了训练效率。此模型可以用于实例分割，提供多种微调版本供不同需求使用。

git-base-coco

GIT是一种基于Transformer的图像文本生成模型，进行了COCO数据集的微调。其设计提升了在图像和视频描述以及问答上的能力。模型结合了CLIP图像令牌与文本令牌进行训练，能够有效预测下一个文本令牌。GIT被应用于图像和视频的标题生成、视觉问答和图像分类等视觉任务，利用大量图像文本对进行训练，实现了多样化的视觉语言任务，提升了视觉理解和交互的效果。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com