论文、数据集、代码和其他资源，使用深度学习进行目标检测和跟踪的集合

研究数据
论文
- 静态检测
  - 区域提议
  - RCNN
  - YOLO
  - SSD
  - RetinaNet
  - 无锚点
  - 杂项
- 视频检测
  - Tubelet
  - FGFA
  - RNN
- 多目标跟踪
  - 联合检测
    - 身份嵌入
  - 关联
  - 深度学习
  - RNN
  - 无监督学习
  - 强化学习
  - 网络流
  - 图优化
  - 基准
  - 指标
- 单目标跟踪
  - 强化学习
  - Siamese
  - 相关性
  - 杂项
- 深度学习
  - 合成梯度
  - 高效
- 无监督学习
- 插值
- 自编码器
  - 变分
数据集
代码
- 通用视觉
- 多目标跟踪
  - 框架
  - 通用
  - 基准
  - Siamese
  - 无监督
  - 重识别
    - 框架
  - 图神经网络
  - 显微镜 / 细胞跟踪
  - 3D
  - 指标
- 单目标跟踪
  - 图形用户界面应用 / 大规模跟踪 / 动物
- 视频检测
  - 动作检测
    - 框架
- 静态检测和匹配
  - 框架
  - 区域提议
  - FPN
  - RCNN
  - SSD
  - RetinaNet
  - YOLO
  - 无锚点
  - 杂项
  - 匹配
  - 边界检测
  - 文本检测
    - 框架
  - 3D检测
    - 框架
- 光流
  - 框架
- 实例分割
  - 框架
- 语义分割
  - 框架
  - 息肉
- 全景分割
- 视频分割
  - 全景视频分割
- 运动预测
- 姿势估计
  - 框架
- 自编码器
- 分类
  - 框架
- 深度强化学习
- 标注
  - 编辑
  - 增强
- 深度学习
集合
教程
博客

研究数据

我使用 DavidRM Journal 管理我的研究数据，因为它有出色的分层组织、交叉链接和标记功能。

我提供了一份日记条目导出文件，其中包含我在过去几年里收集的关于计算机视觉和深度学习的论文、文章、教程、代码和笔记的分类集合。

这是主题云的样子： Alt text

它需要 Jounal 8 并可由以下步骤导入：

使用 File -> Import -> Import User Preferences 导入我的用户偏好
使用 File -> Import -> Sync from The Journal Export File 导入研究数据

注意，必须在导入研究数据之前导入我的用户偏好，才能使标记的主题正常工作。

（可选）我的全局选项文件也提供给那些对暗主题感兴趣的人，可以通过 File -> Import -> Import Global Options 导入

更新日期：2023-11-22

论文

静态检测

区域提议

使用深度神经网络的可扩展目标检测 [cvpr14] [pdf] [notes]
用于目标识别的选择性搜索 [ijcv2013] [pdf] [notes]

RCNN

Faster R-CNN：具有区域提议网络的实时目标检测 [tpami17] [pdf] [notes]
区域全卷积网络中的目标检测 [nips16] [微软研究院] [pdf] [notes]
Mask R-CNN [iccv17] [Facebook AI 研究] [pdf] [notes] [arxiv] [代码（keras）] [代码（tensorflow）]
SNIPER 高效的多尺度训练 [ax1812/nips18] [pdf] [notes] [代码]

YOLO

只需看一次统一的实时目标检测 [ax1605] [pdf] [notes]
YOLO9000 更好、更快、更强 [ax1612] [pdf] [notes]
YOLOv3 增量改进 [ax1804] [pdf] [notes]
YOLOv4 目标检测的最佳速度和准确性 [ax2004] [pdf] [notes] [代码] <a id="ssd_"></a>

SSD

SSD 单阶段多框检测器 [ax1612/eccv16] [pdf] [notes]
DSSD 解卷积单阶段检测器 [ax1701] [pdf] [notes]

RetinaNet

用于目标检测的特征金字塔网络 [ax1704] [pdf] [notes]
用于密集对象检测的焦点损失 [ax180207/iccv17] [pdf] [notes]

无锚检测器

FoveaBox: 超越基于锚的目标检测 [ax1904] [pdf] [notes] [code]
CornerNet: 将目标检测为配对关键点 [ax1903/ijcv19] [pdf] [notes] [code]
FCOS 全卷积单阶段目标检测 [ax1908/iccv19] [pdf] [notes] [code] [code/FCOS_PLUS] [code/VoVNet] [code/HRNet] [code/NAS]
单阶段目标检测的特征选择无锚模块 [ax1903/cvpr19] [pdf] [notes] [code]
通过对极端点和中心点进行分组进行自底向上目标检测 [ax1901] [pdf] [notes] [code]
通过自适应训练样本选择弥合基于锚的检测与无锚检测之间的差距 [ax1912/cvpr20] [pdf] [notes] [code]
使用变压器进行端到端目标检测 [ax200528] [pdf] [notes] [code]
以点为目标 [ax1904] [pdf] [notes] [code]
RepPoints: 用于目标检测的点集表示 [iccv19] [pdf] [notes] [code]

杂项

OverFeat 使用卷积网络进行集成识别、定位和检测 [ax1402/iclr14] [pdf] [notes]
LSDA 通过适应进行大规模检测 [ax1411/nips14] [pdf] [notes]
获取局部化置信度以进行准确目标检测 [ax1807/eccv18] [pdf] [notes] [code]
EfficientDet: 可扩展且高效的目标检测 [cvpr20] [pdf]
Generalized Intersection over Union: 一个用于边框回归的度量和损失函数 [ax1902/cvpr19] [pdf] [notes] [code] [project]

视频检测

Tubelet

通过卷积神经网络从视频Tubelet中检测目标 [cvpr16] [pdf] [notes]
使用Tubelet建议网络进行视频中的目标检测 [ax1704/cvpr17] [pdf] [notes]

FGFA

用于视频识别的深度特征流 [cvpr17] [微软研究] [pdf] [arxiv] [code]
用于视频目标检测的流引导特征聚合 [ax1708/iccv17] [pdf] [notes]
迈向高性能视频目标检测 [ax1711] [微软] [pdf] [notes]

RNN

使用关联LSTM进行在线视频目标检测 [iccv17] [pdf] [notes]
情景很重要：使用循环神经网络优化视频中的目标检测 [bmvc16] [pdf] [notes]

多目标跟踪

联合检测

将目标检测为点 [ax2004] [pdf] [notes] [code][pytorch]

身份嵌入

MOTS 多目标跟踪与分割 [cvpr19] [pdf] [notes] [code] [project/data]
实时多目标跟踪 [ax1909] [pdf] [notes]
多目标跟踪的简单基准 [ax2004] [pdf] [notes] [code]
基于Tracklet-Conditioned检测的综合目标检测和跟踪 [ax1811] [pdf] [notes]

关联

深度亲和网络用于多目标跟踪 [ax1810/tpami19] [pdf] [notes] [code] [pytorch]

深度学习

使用基于CNN的单目标跟踪器和时空注意力机制的在线多目标跟踪 [ax1708/iccv17] [pdf] [arxiv] [notes]
使用双匹配注意网络的在线多目标跟踪 [ax1902/eccv18] [pdf] [arxiv] [notes] [code]
FAMNet 联合学习特征、亲和度和多维分配用于在线多目标跟踪 [iccv19] [pdf] [notes]
利用连接性：使用TrackletNet进行多目标跟踪 [ax1811/mm19] [pdf] [notes]
无花哨功能的跟踪 [ax1903/iccv19] [pdf] [notes] [code] [pytorch]

RNN

追踪不可追踪的目标：学习使用长期依赖追踪多个线索 [ax1704/iccv17] [Stanford] [pdf] [notes] [arxiv] [project],
使用双线性LSTM和神经门控进行多目标跟踪 [eccv18] [pdf] [notes]
在多目标跟踪中消除暴露偏差和度量不匹配 [cvpr19] [pdf] [notes] [code]

无监督学习

通过深度学习Tracklet关联进行无监督人员重新识别 [ax1809/eccv18] [pdf] [notes]
通过动画跟踪：多目标注意跟踪器的无监督学习 [ax1809/cvpr19] [pdf] [arxiv] [notes] [code]
简单的无监督多目标跟踪 [ax2006] [pdf] [notes]

强化学习

学习跟踪：通过决策进行在线多目标跟踪 [iccv15] [Stanford] [pdf] [notes] [code (matlab)] [project]
多目标跟踪的协同深度强化学习 [eccv18] [pdf] [notes]

网络流

带有聚合的本地流描述符的近在线多目标跟踪 [iccv15] [NEC Labs] [pdf] [author] [notes]
多目标跟踪的深度网络流 [cvpr17] [NEC Labs] [pdf] [supplementary] [notes]
多目标跟踪的神经求解器学习 [ax1912/cvpr20] [pdf] [notes] [code]

图优化

用于联合分割和多目标跟踪的多切割公式 [ax1607] [highest MT on MOT2015] [University of Freiburg, Germany] [pdf] [arxiv] [author] [notes] <a id="baselin_e_"></a>

基线

简单的在线实时跟踪 [icip16] [pdf] [笔记] [代码]
不使用图像信息进行高速检测跟踪 [avss17] [pdf] [笔记] [代码]

评估指标

HOTA 一个用于评估多目标跟踪的高级度量 [ijcv20/08] [pdf] [笔记] [代码]

单目标跟踪

强化学习

用于视频中视觉目标跟踪的深度强化学习 [ax1704] [USC-Santa Barbara, Samsung Research] [pdf] [arxiv] [作者] [笔记]
通过强化决策进行视觉跟踪 [ax1702] [Seoul National University, Chung-Ang University] [pdf] [arxiv] [作者] [笔记]
用于视觉跟踪的深度强化学习的动作决策网络 [cvpr17] [Seoul National University] [pdf] [补充材料] [项目] [笔记] [代码]
通过强化学习进行端到端的主动目标跟踪 [ax1705] [Peking University, Tencent AI Lab] [pdf] [arxiv]