#CVPR
Awesome-World-Model: 自动驾驶世界模型的最新进展与应用
Realtime Multi-Person Pose Estimation: 突破性的实时多人姿态估计技术
benchmark_results
本页面汇总了包括CVPR、AAAI、和ICCV在内的顶级会议上视觉对象跟踪领域的论文。详细介绍包括Siam R-CNN、PrDiMP等在内的多种跟踪技术及其实现代码与研究要点。
siam-mot
SiamMOT是一种基于区域的连体多目标追踪网络,通过在帧间估算对象实例的运动,实现目标检测和关联。项目展示了显式和隐式运动建模的重要性,显著提升了在MOT17、TAO-person和Caltech Roadside Pedestrians数据集上的性能,且在HiEve数据集上超越了ACM MM'20 HiEve Grand Challenge的获胜者。SiamMOT在单个现代GPU上以每秒17帧的速度运行,支持对人或人和车辆的联合追踪,并提供丰富的预训练模型供用户使用。
Awesome-World-Model
本页面汇总了关于自动驾驶世界模型的最新论文和研究成果,涵盖包括CVPR、ECCV、ICML和ICLR等知名会议和期刊的前沿研究。通过这些世界模型,研究人员能够预测未来状态,提升基础模型性能,并生成未来的点云数据。此外,页面还介绍了重要的研讨会与挑战赛,以及业界专家的技术博客和视频,提供了对自动驾驶世界模型应用的全面视角。
Pointcept
Pointcept 是一个专为点云感知研究设计的开源代码库,集成了 Point Transformer V3、OA-CNNs 和 PonderV2 等顶尖技术。通过多数据集预训练架构和高效的场景对比学习框架,Pointcept 在室内外场景中表现出色。用户可以使用统一接口和预处理支持,快速部署点云感知解决方案。项目持续更新,最近的新版本优化数据集结构,提升整体性能。
Awesome-Monocular-3D-detection
了解单目3D物体检测的最新研究进展,页面涵盖2024至2016年的相关学术论文,并持续更新。您可浏览详细的文章列表,涉及单目3D检测领域的各种关键主题和方法。此外,网站还提供Pytorch代码,方便研究和应用。适合研究人员、开发人员和单目3D检测领域的爱好者。
DisCo
DisCo 是一个生成逼真人类舞蹈的多用途工具包,支持图像与视频生成。它具有优秀的泛化能力,无需人类特定的微调,同时提供特定人类的细调,以满足多样化的研究需求。其框架操作简便,支持高效训练和多种研究方向。DisCo 在实际应用中表现出色,支持预训练、细调和人类特定细调,适用于广泛的应用场景。用户可以通过在线演示或本地部署模型推理,研究人员也可以利用该代码库进行再实现和开发。
awesome-hand-pose-estimation
本项目汇集了手部姿态估计的核心资源,包括评估方法、权威期刊论文、顶级会议论文和预印本等,从2014年到2024年覆盖最前沿的研究成果,囊括了多视角视频数据集和RGB+深度数据集。本项目提供该领域的最新动态,适合研究人员和开发者参考,用户亦可贡献资源,共同完善这一知识库。
GenerateU
GenerateU项目提出新型开放式目标检测方法,通过生成式区域语言预训练实现无需预定义类别的检测。在LVIS数据集零样本迁移测试中,即使推理时未见类别名称,也达到开放词汇目标检测方法GLIP的性能水平。该项目入选CVPR2024,为通用目标检测领域带来创新突破,特别适用于用户缺乏精确物体类别知识的场景。
Realtime_Multi-Person_Pose_Estimation
该项目展示了一种无需人体检测器的实时多人人体姿态估计方法,曾获2016年MSCOCO关键点挑战赛冠军等多个奖项。项目提供了C++、TensorFlow、Pytorch等多种实现版本,适用于不同应用场景。页面还包括详细的测试与训练步骤,以及相关的代码库和资源链接,适合研究人员和开发者使用。