#3D感知

EmbodiedScan - 全面多模态3D感知套件,提高具身AI的理解能力
Github开源项目深度学习多模态EmbodiedScanMMScan3D感知
EmbodiedScan及其系列如MMScan是专为多模态3D感知设计的开放数据集与基准,用于深入理解第一人称3D场景。包含超过5000次扫描、100万RGB-D视图、语言提示和160k 3D定向框。基于此数据库的Embodied Perceptron展示了在3D感知和语言定位中的优秀表现,适用于计算机视觉和机器人领域。通过我们的演示和基准测试,了解详细信息和应用案例。
UniTR - 多模态变换器网络推动3D感知进展
Github开源项目目标检测3D感知UniTR多模态转换器BEV分割
UniTR是一种新型统一多模态变换器网络,用于3D感知任务。它通过共享权重处理相机和激光雷达等多传感器数据,实现高效多模态融合。在nuScenes数据集上,UniTR在3D目标检测和BEV地图分割任务中均达到最新水平,且降低推理延迟。该研究为提升自动驾驶系统的感知能力提供了新思路。
SegmentAnything3D - Segment Anything技术在3D场景中的创新应用
Github开源项目计算机视觉图像分割3D感知点云处理Segment Anything 3D
SAM3D项目将Segment Anything技术扩展到3D感知领域,通过将2D图像分割信息转移到3D空间,为3D场景理解提供新思路。该项目结合SAM生成掩码、点云合并和区域合并等技术,实现2D到3D的有效转换。SAM3D不仅拓展了计算机视觉的应用范围,也为3D场景分析和理解开辟了新的研究方向。
patchwork-plusplus - 基于3D点云的高效地面分割算法Patchwork++
Github开源项目3D感知点云处理机器人技术Patchwork++地面分割
Patchwork++是Patchwork算法的改进版,专注于3D点云地面分割。该算法具有快速、稳健和自适应特性,有效解决了欠分割问题。项目提供C++、Python和ROS2支持,适用于多种开发环境。凭借在多个数据集上的出色表现,Patchwork++成为自动驾驶和机器人导航领域的重要工具。