iros20-6d-pose-tracking

6D姿态跟踪的优化方案，提高机器人操控和视觉领域的精度和效率

iros20-6d-pose-tracking se(3)-TrackNet 6D姿态跟踪机器人操作 RGB-D图像 Github 开源项目

se(3)-TrackNet通过校准合成图像残差，实现视频序列中的6D姿态跟踪，适用领域包括机器人操控和增强现实。其神经网络架构有效减少域迁移，并采用Lie Algebra实现三维定向表示，即使仅使用合成数据训练也能在真实图像中工作。研究表明，在遮挡条件下，该方法提供稳定和精准的姿态估计，计算效率高达90.9Hz。

访问官网

Github

介绍相关项目

RGBD-semantic-segmentation - RGB-D语义分割技术发展综述及性能评估

GithubRGBD语义分割开源项目性能对比数据集深度学习评估指标

本项目汇总了RGB-D语义分割领域的最新研究成果,提供详尽的论文列表和性能对比。涵盖NYUDv2等主流数据集的基准结果,包括像素精度、平均精度、mIoU等关键指标。通过定期更新反映该领域最新进展,为计算机视觉研究人员提供全面的参考资源。项目内容还包括数据集介绍、评估指标说明和详细的性能对比表格,全面呈现RGB-D语义分割技术的发展脉络。对于想深入了解该领域的研究人员和工程师而言,这是一个高价值的信息聚合平台。

graph-cut-ransac - 高效鲁棒性估计算法，支持同源矩阵、基础矩阵及6D姿态估计

C++Computer VisionGithubGraph-Cut RANSACOpenCVPython开源项目

Graph-Cut RANSAC是一种用于同源矩阵、基础矩阵和6D姿态估计的鲁棒性算法。它已包括在OpenCV中，并支持通过pip安装Python封装，或通过CMake编译C++源码。该算法的应用示例可通过Jupyter Notebook进行演示，主要依赖Eigen、CMake和OpenCV库，适用于现代编译器。

FollowYourPose - 基于姿态和文本的自动视频生成技术

AAAI 2024AI生成Follow-Your-PoseGithub姿态控制开源项目文本生成视频

FollowYourPose项目提出了一种新方法，可以通过姿态和文本生成视频。该方法采用两阶段训练方案，利用易获取的数据集和预训练的文本到图像模型，生成可编辑且姿态可控的角色视频。第一阶段通过关键点图像对进行文本到图像的生成，第二阶段利用姿态自由视频数据集微调网络，成功生成连续的姿态可控角色视频，同时保留预训练模型的编辑和概念组合能力。

multi-object-tracker - 利用Python实现多对象跟踪，兼容多种检测器

CentroidTrackerGithubOpenCVTF-MobileNetSSDYOLOv3multi-object tracker开源项目

该项目提供多种基于Python的多对象跟踪算法，包括CentroidTracker、IOUTracker、CentroidKF_Tracker和SORT，支持TF_SSDMobileNetV2、Caffe_SSDMobileNet和YOLOv3等OpenCV对象检测器。安装简便，使用友好，支持GPU加速，适用于视频数据解析和对象追踪。参考项目示例可快速上手，实现精准多对象跟踪。

yolov5-deepsort-tensorrt - 基于YOLOv5和DeepSORT的Jetson设备目标跟踪系统

DeepSortGithubJetsonTensorRTYolov5开源项目目标跟踪

这个项目是YOLOv5和DeepSORT算法在Jetson设备上的C++实现，针对Jetson Xavier NX和Jetson Nano进行了优化。系统能够高效跟踪多个人头目标，在Jetson Xavier NX上处理70多个目标时可达到10 FPS。项目包含环境配置、模型生成和运行指南，支持自定义模型，并提供了不同YOLOv5版本的兼容性说明。适合需要在边缘设备上进行高性能目标跟踪的应用场景。

shape-of-motion - 从单个视频实现4D场景重建的前沿技术

4D重建GithubShape of Motion单视频重建开源项目深度学习计算机视觉

Shape of Motion项目展示了一种新型4D重建方法，可从单个视频重建动态3D场景。该项目结合深度学习和计算机视觉技术，实现运动物体的精确重建。项目包含完整工作流程，涵盖预处理、模型训练和性能评估。研究团队公开了源代码和数据集，为计算机视觉领域提供了有价值的研究资源。这一技术可能在计算机图形学、增强现实等方面带来应用突破。

siam-mot - 区域基的多目标追踪网络

CVPRGithubSiamMOT多目标跟踪开源项目深度学习运动模型

SiamMOT是一种基于区域的连体多目标追踪网络，通过在帧间估算对象实例的运动，实现目标检测和关联。项目展示了显式和隐式运动建模的重要性，显著提升了在MOT17、TAO-person和Caltech Roadside Pedestrians数据集上的性能，且在HiEve数据集上超越了ACM MM'20 HiEve Grand Challenge的获胜者。SiamMOT在单个现代GPU上以每秒17帧的速度运行，支持对人或人和车辆的联合追踪，并提供丰富的预训练模型供用户使用。

MixFormer - 基于迭代混合注意力的端到端目标跟踪框架

GithubMixFormer开源项目注意力机制深度学习目标追踪计算机视觉

MixFormer是一种创新的端到端目标跟踪框架，采用目标-搜索混合注意力(MAM)骨干网络和角点头部结构，实现了无需显式集成模块的紧凑跟踪流程。这种无后处理方法在LaSOT、GOT-10K和TrackingNet等多个基准测试中表现卓越，并在VOT2020上取得0.584的EAO成绩。项目开源了代码、模型和原始结果，为目标跟踪研究领域提供了宝贵资源。

Deep-Learning-for-Tracking-and-Detection - 使用深度学习进行对象检测和跟踪的论文与资源合集

GithubRCNNYOLOdeep learningmulti object trackingobject detection开源项目

本项目汇集了有关深度学习在对象检测和跟踪领域的论文、数据集、代码及各种资源。内容涵盖静态检测、视频检测、多对象跟踪和单对象跟踪等主题，并提供了多种经典模型如RCNN、YOLO、SSD的实现和改进方案。此外，项目还涵盖了图像和视频分割、光流、运动预测等任务的资源，为研究人员和开发者提供了详尽的参考资料。

lightning-pose - 基于PyTorch Lightning的高效姿态估计框架

GithubLightning Pose姿态估计开源项目深度学习计算机视觉

Lightning Pose是一个基于PyTorch Lightning的姿态估计框架，利用NVIDIA DALI加速未标记视频的训练。框架集成了TensorBoard、FiftyOne和Streamlit等评估工具，支持已标记数据和未标记视频的模型训练与评估。项目还提供浏览器应用，涵盖数据标注、模型训练到结果可视化的完整流程。此外，团队开发的Ensemble Kalman Smoother (EKS)后处理器可与多种姿态估计包兼容。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号