#CVPR

Awesome 6D对象姿态估计综述

3 个月前

物体姿态估计 3D重建计算机视觉深度学习 CVPR Github 开源项目

3 个月前

RAVE: 快速一致的视频编辑新突破

3 个月前

RAVE 视频编辑扩散模型零样本 CVPR Github 开源项目

3 个月前

SyncTalk：说话头合成中的同步魔鬼

3 个月前

SyncTalk 头像合成人工智能计算机视觉 CVPR Github 开源项目

3 个月前

DisCo: 突破性的人类舞蹈生成技术

3 个月前

DisCo 舞蹈生成深度学习 CVPR 视频合成 Github 开源项目

3 个月前

Awesome-World-Model: 自动驾驶世界模型的最新进展与应用

3 个月前

Autonomous Driving World Models CVPR Generative AI Survey Github 开源项目

3 个月前

SiamMOT: 创新的多目标跟踪网络

3 个月前

SiamMOT 多目标跟踪运动模型深度学习 CVPR Github 开源项目

3 个月前

Pointcept: 一个强大的点云感知研究代码库

3 个月前

Pointcept 点云感知 CVPR 3D表示学习预训练 Github 开源项目

3 个月前

深入解析MLPerf基准测试:评估AI系统性能的行业标准

3 个月前

视觉跟踪 CVPR AAAI ICCV SiamRPN++Github 开源项目

3 个月前

Realtime Multi-Person Pose Estimation: 突破性的实时多人姿态估计技术

3 个月前

Realtime Multi-Person Pose Estimation OpenPose CVPR MSCOCO Keypoints Challenge Part Affinity Fields Github 开源项目

3 个月前

相关项目

benchmark_results

本页面汇总了包括CVPR、AAAI、和ICCV在内的顶级会议上视觉对象跟踪领域的论文。详细介绍包括Siam R-CNN、PrDiMP等在内的多种跟踪技术及其实现代码与研究要点。

siam-mot

SiamMOT是一种基于区域的连体多目标追踪网络，通过在帧间估算对象实例的运动，实现目标检测和关联。项目展示了显式和隐式运动建模的重要性，显著提升了在MOT17、TAO-person和Caltech Roadside Pedestrians数据集上的性能，且在HiEve数据集上超越了ACM MM'20 HiEve Grand Challenge的获胜者。SiamMOT在单个现代GPU上以每秒17帧的速度运行，支持对人或人和车辆的联合追踪，并提供丰富的预训练模型供用户使用。

Awesome-World-Model

本页面汇总了关于自动驾驶世界模型的最新论文和研究成果，涵盖包括CVPR、ECCV、ICML和ICLR等知名会议和期刊的前沿研究。通过这些世界模型，研究人员能够预测未来状态，提升基础模型性能，并生成未来的点云数据。此外，页面还介绍了重要的研讨会与挑战赛，以及业界专家的技术博客和视频，提供了对自动驾驶世界模型应用的全面视角。

Pointcept

Pointcept 是一个专为点云感知研究设计的开源代码库，集成了 Point Transformer V3、OA-CNNs 和 PonderV2 等顶尖技术。通过多数据集预训练架构和高效的场景对比学习框架，Pointcept 在室内外场景中表现出色。用户可以使用统一接口和预处理支持，快速部署点云感知解决方案。项目持续更新，最近的新版本优化数据集结构，提升整体性能。

Awesome-Monocular-3D-detection

了解单目3D物体检测的最新研究进展，页面涵盖2024至2016年的相关学术论文，并持续更新。您可浏览详细的文章列表，涉及单目3D检测领域的各种关键主题和方法。此外，网站还提供Pytorch代码，方便研究和应用。适合研究人员、开发人员和单目3D检测领域的爱好者。

DisCo

DisCo 是一个生成逼真人类舞蹈的多用途工具包，支持图像与视频生成。它具有优秀的泛化能力，无需人类特定的微调，同时提供特定人类的细调，以满足多样化的研究需求。其框架操作简便，支持高效训练和多种研究方向。DisCo 在实际应用中表现出色，支持预训练、细调和人类特定细调，适用于广泛的应用场景。用户可以通过在线演示或本地部署模型推理，研究人员也可以利用该代码库进行再实现和开发。

awesome-hand-pose-estimation

本项目汇集了手部姿态估计的核心资源，包括评估方法、权威期刊论文、顶级会议论文和预印本等，从2014年到2024年覆盖最前沿的研究成果，囊括了多视角视频数据集和RGB+深度数据集。本项目提供该领域的最新动态，适合研究人员和开发者参考，用户亦可贡献资源，共同完善这一知识库。

GenerateU

GenerateU项目提出新型开放式目标检测方法，通过生成式区域语言预训练实现无需预定义类别的检测。在LVIS数据集零样本迁移测试中，即使推理时未见类别名称，也达到开放词汇目标检测方法GLIP的性能水平。该项目入选CVPR2024，为通用目标检测领域带来创新突破，特别适用于用户缺乏精确物体类别知识的场景。

Realtime_Multi-Person_Pose_Estimation

该项目展示了一种无需人体检测器的实时多人人体姿态估计方法，曾获2016年MSCOCO关键点挑战赛冠军等多个奖项。项目提供了C++、TensorFlow、Pytorch等多种实现版本，适用于不同应用场景。页面还包括详细的测试与训练步骤，以及相关的代码库和资源链接，适合研究人员和开发者使用。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com