#CVPR

benchmark_results项目学习资料汇总 - 视觉跟踪论文列表与基准测试

2 个月前
Cover of benchmark_results项目学习资料汇总 - 视觉跟踪论文列表与基准测试

Realtime_Multi-Person_Pose_Estimation学习资料汇总-实时多人姿态估计框架

2 个月前
Cover of Realtime_Multi-Person_Pose_Estimation学习资料汇总-实时多人姿态估计框架

ECON: 从单张图像重建高保真3D人体模型的革新性方法

3 个月前
Cover of ECON: 从单张图像重建高保真3D人体模型的革新性方法

计算机视觉论文集锦:Awesome-Computer-Vision-Paper-List项目介绍

3 个月前
Cover of 计算机视觉论文集锦:Awesome-Computer-Vision-Paper-List项目介绍

VoxFormer: 基于稀疏体素Transformer的相机3D语义场景补全

3 个月前
Cover of VoxFormer: 基于稀疏体素Transformer的相机3D语义场景补全

MAD数据集:一个用于视频语言定位的大规模电影音频描述数据集

3 个月前
Cover of MAD数据集:一个用于视频语言定位的大规模电影音频描述数据集

LIVE: 突破性的层级图像矢量化技术

3 个月前
Cover of LIVE: 突破性的层级图像矢量化技术

HumanBench: 开启以人为中心的基础模型新纪元

3 个月前
Cover of HumanBench: 开启以人为中心的基础模型新纪元

Mip-Splatting: 革新性的3D高斯渲染抗锯齿技术

3 个月前
Cover of Mip-Splatting: 革新性的3D高斯渲染抗锯齿技术

CVPR 2020-2024 底层视觉研究进展概述

3 个月前
Cover of CVPR 2020-2024 底层视觉研究进展概述
相关项目
Project Cover

benchmark_results

本页面汇总了包括CVPR、AAAI、和ICCV在内的顶级会议上视觉对象跟踪领域的论文。详细介绍包括Siam R-CNN、PrDiMP等在内的多种跟踪技术及其实现代码与研究要点。

Project Cover

siam-mot

SiamMOT是一种基于区域的连体多目标追踪网络,通过在帧间估算对象实例的运动,实现目标检测和关联。项目展示了显式和隐式运动建模的重要性,显著提升了在MOT17、TAO-person和Caltech Roadside Pedestrians数据集上的性能,且在HiEve数据集上超越了ACM MM'20 HiEve Grand Challenge的获胜者。SiamMOT在单个现代GPU上以每秒17帧的速度运行,支持对人或人和车辆的联合追踪,并提供丰富的预训练模型供用户使用。

Project Cover

Awesome-World-Model

本页面汇总了关于自动驾驶世界模型的最新论文和研究成果,涵盖包括CVPR、ECCV、ICML和ICLR等知名会议和期刊的前沿研究。通过这些世界模型,研究人员能够预测未来状态,提升基础模型性能,并生成未来的点云数据。此外,页面还介绍了重要的研讨会与挑战赛,以及业界专家的技术博客和视频,提供了对自动驾驶世界模型应用的全面视角。

Project Cover

Pointcept

Pointcept 是一个专为点云感知研究设计的开源代码库,集成了 Point Transformer V3、OA-CNNs 和 PonderV2 等顶尖技术。通过多数据集预训练架构和高效的场景对比学习框架,Pointcept 在室内外场景中表现出色。用户可以使用统一接口和预处理支持,快速部署点云感知解决方案。项目持续更新,最近的新版本优化数据集结构,提升整体性能。

Project Cover

Awesome-Monocular-3D-detection

了解单目3D物体检测的最新研究进展,页面涵盖2024至2016年的相关学术论文,并持续更新。您可浏览详细的文章列表,涉及单目3D检测领域的各种关键主题和方法。此外,网站还提供Pytorch代码,方便研究和应用。适合研究人员、开发人员和单目3D检测领域的爱好者。

Project Cover

DisCo

DisCo 是一个生成逼真人类舞蹈的多用途工具包,支持图像与视频生成。它具有优秀的泛化能力,无需人类特定的微调,同时提供特定人类的细调,以满足多样化的研究需求。其框架操作简便,支持高效训练和多种研究方向。DisCo 在实际应用中表现出色,支持预训练、细调和人类特定细调,适用于广泛的应用场景。用户可以通过在线演示或本地部署模型推理,研究人员也可以利用该代码库进行再实现和开发。

Project Cover

awesome-hand-pose-estimation

本项目汇集了手部姿态估计的核心资源,包括评估方法、权威期刊论文、顶级会议论文和预印本等,从2014年到2024年覆盖最前沿的研究成果,囊括了多视角视频数据集和RGB+深度数据集。本项目提供该领域的最新动态,适合研究人员和开发者参考,用户亦可贡献资源,共同完善这一知识库。

Project Cover

GenerateU

GenerateU项目提出新型开放式目标检测方法,通过生成式区域语言预训练实现无需预定义类别的检测。在LVIS数据集零样本迁移测试中,即使推理时未见类别名称,也达到开放词汇目标检测方法GLIP的性能水平。该项目入选CVPR2024,为通用目标检测领域带来创新突破,特别适用于用户缺乏精确物体类别知识的场景。

Project Cover

Realtime_Multi-Person_Pose_Estimation

该项目展示了一种无需人体检测器的实时多人人体姿态估计方法,曾获2016年MSCOCO关键点挑战赛冠军等多个奖项。项目提供了C++、TensorFlow、Pytorch等多种实现版本,适用于不同应用场景。页面还包括详细的测试与训练步骤,以及相关的代码库和资源链接,适合研究人员和开发者使用。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号