SparseTrack

多目标跟踪新方法：基于伪深度的场景分解技术

SparseTrack 多目标跟踪场景分解伪深度数据关联 Github 开源项目

SparseTrack提出了一种新的多目标跟踪方法，通过伪深度估计和深度级联匹配策略来分解密集场景。这种方法在MOT17和MOT20基准测试中表现出色，仅使用IoU匹配就达到了与复杂算法相当的性能。SparseTrack为解决拥挤场景中的多目标跟踪问题提供了新的思路，展示了简单方法在复杂任务中的潜力。

Github

介绍相关项目

MOTSFusion - 将3D多目标跟踪与场景重建融合的创新算法

3D重建GithubKITTI数据集MOTSFusion开源项目目标跟踪计算机视觉

MOTSFusion项目提出了一种创新的多目标跟踪算法,通过融合3D跟踪和场景重建技术来提高准确性。该算法利用立体图像、光流和视差信息,结合分割网络和检测器,实现对车辆和行人的精确跟踪。项目在KITTI MOTS数据集上展现了优异性能,并开源了完整代码。这种方法为自动驾驶等应用中的多目标跟踪提供了新的思路。

mahalanobis_3d_multi_object_tracking - 在NuScenes Tracking Challenge中荣获冠军，提升了自主驾驶3D多目标追踪的准确率

AB3DMOTAutonomous DrivingGithubNuScenes Tracking ChallengeProbabilistic TrackingStanford University开源项目

该项目提出了一种在线3D多目标追踪方法，在NeurIPS 2019 AI Driving Olympics Workshop上荣获NuScenes Tracking Challenge冠军。与AB3DMOT方法相比，显著提高了较小目标如行人的追踪精度。项目提供了详尽的技术报告与源码，以及详细的运行步骤，便于他人复现结果。使用MEGVII的检测结果，该方法在多目标追踪准确率（AMOTA）上表现出色，特别是对行人和小型目标的追踪效果尤为明显。

SpaTracker - 将2D像素的3D空间运动轨迹可视化

3D追踪CVPR 2024GithubSpatialTracker像素追踪开源项目计算机视觉

SpaTracker是一个计算机视觉项目，可在3D空间中追踪视频中任意2D像素的运动轨迹。该项目支持RGB和RGBD视频输入，采用单目深度估计技术实现像素级追踪。SpaTracker提供演示代码和预训练模型，可视化效果优秀。这一工具可应用于动作分析和视觉特效等领域。该项目在CVPR 2024被评为亮点论文，体现了其在3D视觉追踪领域的创新性。

StrongSORT - 先进多目标跟踪算法全面升级DeepSORT技术

DeepSORTGithubStrongSORT多目标跟踪开源项目深度学习目标检测

StrongSORT是对DeepSORT多目标跟踪算法的全面升级。该项目在检测、嵌入和关联等核心环节进行了优化,并引入AFLink和GSI两个轻量级插件算法。经过改进的StrongSORT在MOT17和MOT20数据集上刷新了HOTA和IDF1指标记录,性能显著优于现有方法。项目开源了完整代码实现和使用说明,便于研究人员复现和拓展。

SparseBEV - 多摄像头视频中的高性能稀疏3D目标检测技术

GithubICCV 2023PyTorchSparseBEVnuScenes开源项目立体检测

SparseBEV利用多摄像头视频实现高性能稀疏3D目标检测，得到ICCV 2023的认可，并提供PyTorch实现、训练和评估指南。新发布的SparseOcc展示了全稀疏架构支持多种预训练权重和配置文件。用户可使用提供的代码进行可视化和模型优化，实现高效3D检测。兼容不同版本的PyTorch和CUDA，表现卓越。

multi-object-tracker - 利用Python实现多对象跟踪，兼容多种检测器

CentroidTrackerGithubOpenCVTF-MobileNetSSDYOLOv3multi-object tracker开源项目

该项目提供多种基于Python的多对象跟踪算法，包括CentroidTracker、IOUTracker、CentroidKF_Tracker和SORT，支持TF_SSDMobileNetV2、Caffe_SSDMobileNet和YOLOv3等OpenCV对象检测器。安装简便，使用友好，支持GPU加速，适用于视频数据解析和对象追踪。参考项目示例可快速上手，实现精准多对象跟踪。

MeMOTR - 基于长期记忆的Transformer多目标跟踪方法

GithubMeMOTRTransformer多目标跟踪开源项目计算机视觉长期记忆

MeMOTR提出了一种基于Transformer的端到端多目标跟踪方法，通过长期记忆注入和定制记忆注意力层提升目标关联性能。该方法在DanceTrack和SportsMOT等数据集上展现出优秀的跟踪效果，为复杂场景的多目标跟踪提供了新思路。项目开源了代码、预训练模型和使用说明，便于研究者复现和改进。

Segment-and-Track-Anything - 视频中任意对象的自动分割与追踪系统

AI视觉GithubSAM-Track交互式分割开源项目目标跟踪视频分割

Segment-and-Track-Anything是一个专注于视频中任意对象分割和追踪的开源项目。该系统集成了SAM模型的关键帧分割能力和DeAOT模型的多目标追踪功能。它支持自动检测新对象、交互式修改、文本提示等多种操作模式，适用于街景分析、增强现实、细胞追踪等领域。项目提供了直观的WebUI界面和灵活的参数设置，使用户能够轻松实现复杂的视频对象分割和追踪任务。

iros20-6d-pose-tracking - 6D姿态跟踪的优化方案，提高机器人操控和视觉领域的精度和效率

6D姿态跟踪GithubRGB-D图像iros20-6d-pose-trackingse(3)-TrackNet开源项目机器人操作

se(3)-TrackNet通过校准合成图像残差，实现视频序列中的6D姿态跟踪，适用领域包括机器人操控和增强现实。其神经网络架构有效减少域迁移，并采用Lie Algebra实现三维定向表示，即使仅使用合成数据训练也能在真实图像中工作。研究表明，在遮挡条件下，该方法提供稳定和精准的姿态估计，计算效率高达90.9Hz。

siam-mot - 区域基的多目标追踪网络

CVPRGithubSiamMOT多目标跟踪开源项目深度学习运动模型

SiamMOT是一种基于区域的连体多目标追踪网络，通过在帧间估算对象实例的运动，实现目标检测和关联。项目展示了显式和隐式运动建模的重要性，显著提升了在MOT17、TAO-person和Caltech Roadside Pedestrians数据集上的性能，且在HiEve数据集上超越了ACM MM'20 HiEve Grand Challenge的获胜者。SiamMOT在单个现代GPU上以每秒17帧的速度运行，支持对人或人和车辆的联合追踪，并提供丰富的预训练模型供用户使用。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号