#CVPR

benchmark_results项目学习资料汇总 - 视觉跟踪论文列表与基准测试

2 个月前

视觉跟踪 CVPR AAAI ICCV SiamRPN++Github 开源项目

2 个月前

Realtime_Multi-Person_Pose_Estimation学习资料汇总-实时多人姿态估计框架

2 个月前

Realtime Multi-Person Pose Estimation OpenPose CVPR MSCOCO Keypoints Challenge Part Affinity Fields Github 开源项目

2 个月前

ECON: 从单张图像重建高保真3D人体模型的革新性方法

3 个月前

3D人体重建深度学习计算机视觉 CVPR ECON Github 开源项目

3 个月前

计算机视觉论文集锦:Awesome-Computer-Vision-Paper-List项目介绍

3 个月前

人工智能会议论文收集 CVPR NeurIPS ICCV Github 开源项目

3 个月前

VoxFormer: 基于稀疏体素Transformer的相机3D语义场景补全

3 个月前

VoxFormer 3D语义场景补全计算机视觉 CVPR 语义分割 Github 开源项目

3 个月前

MAD数据集：一个用于视频语言定位的大规模电影音频描述数据集

3 个月前

MAD数据集视频语言定位电影音频描述计算机视觉 CVPR Github 开源项目

3 个月前

LIVE: 突破性的层级图像矢量化技术

3 个月前

LIVE 图像矢量化 SVG生成计算机视觉 CVPR Github 开源项目

3 个月前

HumanBench: 开启以人为中心的基础模型新纪元

3 个月前

HumanBench 人体感知基础模型计算机视觉 CVPR Github 开源项目

3 个月前

Mip-Splatting: 革新性的3D高斯渲染抗锯齿技术

3 个月前

3D Gaussian Splatting Mip-Splatting 计算机视觉图形渲染 CVPR Github 开源项目

3 个月前

CVPR 2020-2024 底层视觉研究进展概述

3 个月前

CVPR 底层视觉论文集代码集图像处理 Github 开源项目

3 个月前

相关项目

benchmark_results

本页面汇总了包括CVPR、AAAI、和ICCV在内的顶级会议上视觉对象跟踪领域的论文。详细介绍包括Siam R-CNN、PrDiMP等在内的多种跟踪技术及其实现代码与研究要点。

siam-mot

SiamMOT是一种基于区域的连体多目标追踪网络，通过在帧间估算对象实例的运动，实现目标检测和关联。项目展示了显式和隐式运动建模的重要性，显著提升了在MOT17、TAO-person和Caltech Roadside Pedestrians数据集上的性能，且在HiEve数据集上超越了ACM MM'20 HiEve Grand Challenge的获胜者。SiamMOT在单个现代GPU上以每秒17帧的速度运行，支持对人或人和车辆的联合追踪，并提供丰富的预训练模型供用户使用。

Awesome-World-Model

本页面汇总了关于自动驾驶世界模型的最新论文和研究成果，涵盖包括CVPR、ECCV、ICML和ICLR等知名会议和期刊的前沿研究。通过这些世界模型，研究人员能够预测未来状态，提升基础模型性能，并生成未来的点云数据。此外，页面还介绍了重要的研讨会与挑战赛，以及业界专家的技术博客和视频，提供了对自动驾驶世界模型应用的全面视角。

Pointcept

Pointcept 是一个专为点云感知研究设计的开源代码库，集成了 Point Transformer V3、OA-CNNs 和 PonderV2 等顶尖技术。通过多数据集预训练架构和高效的场景对比学习框架，Pointcept 在室内外场景中表现出色。用户可以使用统一接口和预处理支持，快速部署点云感知解决方案。项目持续更新，最近的新版本优化数据集结构，提升整体性能。

Awesome-Monocular-3D-detection

了解单目3D物体检测的最新研究进展，页面涵盖2024至2016年的相关学术论文，并持续更新。您可浏览详细的文章列表，涉及单目3D检测领域的各种关键主题和方法。此外，网站还提供Pytorch代码，方便研究和应用。适合研究人员、开发人员和单目3D检测领域的爱好者。

DisCo

DisCo 是一个生成逼真人类舞蹈的多用途工具包，支持图像与视频生成。它具有优秀的泛化能力，无需人类特定的微调，同时提供特定人类的细调，以满足多样化的研究需求。其框架操作简便，支持高效训练和多种研究方向。DisCo 在实际应用中表现出色，支持预训练、细调和人类特定细调，适用于广泛的应用场景。用户可以通过在线演示或本地部署模型推理，研究人员也可以利用该代码库进行再实现和开发。

awesome-hand-pose-estimation

本项目汇集了手部姿态估计的核心资源，包括评估方法、权威期刊论文、顶级会议论文和预印本等，从2014年到2024年覆盖最前沿的研究成果，囊括了多视角视频数据集和RGB+深度数据集。本项目提供该领域的最新动态，适合研究人员和开发者参考，用户亦可贡献资源，共同完善这一知识库。

GenerateU

GenerateU项目提出新型开放式目标检测方法，通过生成式区域语言预训练实现无需预定义类别的检测。在LVIS数据集零样本迁移测试中，即使推理时未见类别名称，也达到开放词汇目标检测方法GLIP的性能水平。该项目入选CVPR2024，为通用目标检测领域带来创新突破，特别适用于用户缺乏精确物体类别知识的场景。

Realtime_Multi-Person_Pose_Estimation

该项目展示了一种无需人体检测器的实时多人人体姿态估计方法，曾获2016年MSCOCO关键点挑战赛冠军等多个奖项。项目提供了C++、TensorFlow、Pytorch等多种实现版本，适用于不同应用场景。页面还包括详细的测试与训练步骤，以及相关的代码库和资源链接，适合研究人员和开发者使用。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com