#CVPR 2024

mPLUG-Owl学习资料汇总 - 强大的多模态大语言模型家族

2024年09月10日
Cover of mPLUG-Owl学习资料汇总 - 强大的多模态大语言模型家族

CVPR2024-Papers-with-Code-Demo 学习资料汇总 - 最新计算机视觉论文代码合集

2024年09月10日
Cover of CVPR2024-Papers-with-Code-Demo 学习资料汇总 - 最新计算机视觉论文代码合集

CVPR2024-Papers-with-Code学习资料汇总 - 计算机视觉顶会论文与代码合集

2024年09月10日
Cover of CVPR2024-Papers-with-Code学习资料汇总 - 计算机视觉顶会论文与代码合集

DriveLM入门指南-基于图视觉问答的自动驾驶模型

2024年09月10日
Cover of DriveLM入门指南-基于图视觉问答的自动驾驶模型

LAMP: 一种革命性的少样本视频生成方法

2024年09月05日
Cover of LAMP: 一种革命性的少样本视频生成方法

MonoGS: 革命性的高斯飞溅SLAM技术

2024年09月05日
Cover of MonoGS: 革命性的高斯飞溅SLAM技术

SpatialTracker: 在3D空间中追踪任意2D像素的突破性技术

2024年09月05日
Cover of SpatialTracker: 在3D空间中追踪任意2D像素的突破性技术

RT-DETR: 实时目标检测的新突破

2024年09月05日
Cover of RT-DETR: 实时目标检测的新突破

Video-P2P:突破性视频编辑技术的革新之作

2024年09月05日
Cover of Video-P2P:突破性视频编辑技术的革新之作

CVPR 2024人工智能生成内容(AIGC)研究进展综述

2024年09月05日
Cover of CVPR 2024人工智能生成内容(AIGC)研究进展综述
相关项目
Project Cover

CVPR2024-Papers-with-Code

CVPR 2024的论文和代码集锦,涵盖3D建模、机器学习、视觉感知等多种计算机视觉领域,为研究人员和技术开发者提供一站式检索最新科研成果与实用工具。

Project Cover

CVPR2024-Papers-with-Code-Demo

CVPR2024-Papers-with-Code-Demo项目整合了CVPR会议的最新论文和开源代码,覆盖机器学习、计算机视觉等多个领域,提供丰富的论文资源和代码链接。适合学者和开发者深入探讨和应用最新科研成果。

Project Cover

mPLUG-Owl

mPLUG-Owl系列模型通过模块化强化其多模具集成,提升大型语言模型的功能。mPLUG-Owl2在CVPR 2024获得突出展示,而最新的mPLUG-Owl2.1则针对中文模式进行了优化,已在HuggingFace平台推出。

Project Cover

awesome-nerf-editing

本项目汇集了辐射场编辑领域的开创性研究成果、调查报告和最新进展。涵盖ECCV、SIGGRAPH、CVPR等顶级会议,提供不断更新的资源和文献。专业研究人员和爱好者均可在此找到关于NeRF和3D Gaussian Splatting技术的详尽信息。欢迎关注项目动态,并通过提交Issues或Pull Requests参与讨论和维护。

Project Cover

UniDepth

UniDepth项目提出了通用的单目深度测量方法,支持多个数据集如NYUv2、KITTI和SUN-RGBD。通过训练模型,该方法可直接从RGB图像生成深度和内参预测,无需预先深度数据。其高精度、低延迟的推理能力在多个基准测试中表现优秀。支持多种输入形状和比例,适合机器人视觉和自动驾驶等应用。

Project Cover

mickey

该项目介绍了MicKey,这是一种在CVPR 2024上发布的特征检测管道。MicKey通过描述符匹配实现度量对应,并可以恢复精确的相对位姿。其在端到端训练中仅需图像对及其相对位姿真值,主要针对AR即时定位进行了优化。在Map-free基准测试中,MicKey的性能得到了验证,大大简化了3D地图构建流程。

Project Cover

CVPR-2023-24-Papers

构建CVPR 2024会议最新研究论文的全面合集,涵盖计算机视觉和深度学习领域的最新进展。提供代码实现,适用于科研和开发,助力推动视觉智能的发展。

Project Cover

GaussianDreamer

本文客观介绍了通过整合2D和3D扩散模型的快速3D对象生成框架GaussianDreamer。3D扩散模型提供初始几何信息,而2D扩散模型则增强了其几何和外观。GaussianDreamer在单个GPU上可在15分钟内生成高质量的3D实例,比现有方法更快。生成的3D实例支持实时渲染,可方便地整合到动画和仿真管道中。

Project Cover

DriveLM

DriveLM项目集成nuScenes和CARLA数据集,提出基于VLM的图形视觉问答方法,实现图形VQA和端到端驾驶。作为CVPR 2024自主驾驶挑战的主要赛道,提供了基准、测试数据、提交格式和评估流程,帮助解决数据缺乏和闭环规划问题。了解DriveLM的关键特性、主要优势及最新更新,推动多模态模型在现实应用中的发展。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号