Project Icon

Deep-Learning-for-Tracking-and-Detection

使用深度学习进行对象检测和跟踪的论文与资源合集

本项目汇集了有关深度学习在对象检测和跟踪领域的论文、数据集、代码及各种资源。内容涵盖静态检测、视频检测、多对象跟踪和单对象跟踪等主题,并提供了多种经典模型如RCNN、YOLO、SSD的实现和改进方案。此外,项目还涵盖了图像和视频分割、光流、运动预测等任务的资源,为研究人员和开发者提供了详尽的参考资料。

论文、数据集、代码和其他资源,使用深度学习进行目标检测和跟踪的集合

研究数据

我使用 DavidRM Journal 管理我的研究数据,因为它有出色的分层组织、交叉链接和标记功能。

我提供了一份日记条目导出文件,其中包含我在过去几年里收集的关于计算机视觉和深度学习的论文、文章、教程、代码和笔记的分类集合。

这是主题云的样子: Alt text

它需要 Jounal 8 并可由以下步骤导入:

  • 使用 File -> Import -> Import User Preferences 导入我的用户偏好
  • 使用 File -> Import -> Sync from The Journal Export File 导入研究数据

注意,必须在导入研究数据之前导入我的用户偏好,才能使标记的主题正常工作。

(可选)我的全局选项文件也提供给那些对暗主题感兴趣的人,可以通过 File -> Import -> Import Global Options 导入

更新日期:2023-11-22

论文

静态检测

区域提议

  • 使用深度神经网络的可扩展目标检测 [cvpr14] [pdf] [notes]
  • 用于目标识别的选择性搜索 [ijcv2013] [pdf] [notes]

RCNN

YOLO

SSD

RetinaNet

  • 用于目标检测的特征金字塔网络 [ax1704] [pdf] [notes]
  • 用于密集对象检测的焦点损失 [ax180207/iccv17] [pdf] [notes]

无锚检测器

杂项

  • OverFeat 使用卷积网络进行集成识别、定位和检测 [ax1402/iclr14] [pdf] [notes]
  • LSDA 通过适应进行大规模检测 [ax1411/nips14] [pdf] [notes]
  • 获取局部化置信度以进行准确目标检测 [ax1807/eccv18] [pdf] [notes] [code]
  • EfficientDet: 可扩展且高效的目标检测 [cvpr20] [pdf]
  • Generalized Intersection over Union: 一个用于边框回归的度量和损失函数 [ax1902/cvpr19] [pdf] [notes] [code] [project]

视频检测

Tubelet

  • 通过卷积神经网络从视频Tubelet中检测目标 [cvpr16] [pdf] [notes]
  • 使用Tubelet建议网络进行视频中的目标检测 [ax1704/cvpr17] [pdf] [notes]

FGFA

  • 用于视频识别的深度特征流 [cvpr17] [微软研究] [pdf] [arxiv] [code]
  • 用于视频目标检测的流引导特征聚合 [ax1708/iccv17] [pdf] [notes]
  • 迈向高性能视频目标检测 [ax1711] [微软] [pdf] [notes]

RNN

  • 使用关联LSTM进行在线视频目标检测 [iccv17] [pdf] [notes]
  • 情景很重要:使用循环神经网络优化视频中的目标检测 [bmvc16] [pdf] [notes]

多目标跟踪

联合检测

身份嵌入

关联

深度学习

  • 使用基于CNN的单目标跟踪器和时空注意力机制的在线多目标跟踪 [ax1708/iccv17] [pdf] [arxiv] [notes]

  • 使用双匹配注意网络的在线多目标跟踪 [ax1902/eccv18] [pdf] [arxiv] [notes] [code]

  • FAMNet 联合学习特征、亲和度和多维分配用于在线多目标跟踪 [iccv19] [pdf] [notes]

  • 利用连接性:使用TrackletNet进行多目标跟踪 [ax1811/mm19] [pdf] [notes]

  • 无花哨功能的跟踪 [ax1903/iccv19] [pdf] [notes] [code] [pytorch]

RNN

  • 追踪不可追踪的目标:学习使用长期依赖追踪多个线索 [ax1704/iccv17] [Stanford] [pdf] [notes] [arxiv] [project],

  • 使用双线性LSTM和神经门控进行多目标跟踪 [eccv18] [pdf] [notes]

  • 在多目标跟踪中消除暴露偏差和度量不匹配 [cvpr19] [pdf] [notes] [code]

无监督学习

  • 通过深度学习Tracklet关联进行无监督人员重新识别 [ax1809/eccv18] [pdf] [notes]

  • 通过动画跟踪:多目标注意跟踪器的无监督学习 [ax1809/cvpr19] [pdf] [arxiv] [notes] [code]

  • 简单的无监督多目标跟踪 [ax2006] [pdf] [notes]

强化学习

网络流

图优化

  • 用于联合分割和多目标跟踪的多切割公式 [ax1607] [highest MT on MOT2015] [University of Freiburg, Germany] [pdf] [arxiv] [author] [notes]

基线

评估指标

单目标跟踪

强化学习

Siamese

相关性

其它

  • 弥合检测与跟踪之间的差距:一种统一的方法 [iccv19] [pdf] [笔记]

深度学习

合成梯度

高效

  • EfficientNet:对卷积神经网络的模型缩放重新思考 [icml2019] [pdf] [笔记]

无监督学习

插值

自编码器

变分

数据集

多目标跟踪

无人机

合成

显微镜 / 细胞跟踪

单对象跟踪

视频检测

视频理解 / 活动识别

静态检测

动物

边界检测

静态分割

视频分割

分类

光流

运动预测

代码

通用视觉

多对象跟踪

框架

通用

基准

Siamese

无监督

Re-ID

框架

图神经网络

显微镜 / 细胞追踪

3D

评测

单目标追踪

GUI应用 / 大规模追踪 / 动物

视频检测

动作检测

框架

静态检测和匹配

框架

区域提案

FPN

RCNN

SSD

RetinaNet

YOLO

Anchor Free

Misc

Matching

Boundary Detection

Text Detection

框架

3D Detection

框架

Optical Flow

框架

Instance Segmentation

框架

语义分割

框架

息肉分割

全景分割

视频分割

全景视频分割

运动预测

姿态估计

框架

自动编码器

分类

框架

深度强化学习

标注

编辑

增强

深度学习

类别不平衡

小样本学习

无监督学习

集锦

数据集

深度学习

静态检测

视频检测

单目标跟踪

多目标跟踪

静态分割

视频分割

运动预测

深度压缩感知

其他

教程

合辑

多目标跟踪

静态检测

视频检测

实例分割

深度学习

优化

类不平衡

循环神经网络(RNN)

深度强化学习(Deep RL)

自动编码器(Autoencoders)

博客

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号