#3D感知

EmbodiedScan - 全面多模态3D感知套件，提高具身AI的理解能力

Github开源项目深度学习多模态EmbodiedScanMMScan3D感知

EmbodiedScan及其系列如MMScan是专为多模态3D感知设计的开放数据集与基准，用于深入理解第一人称3D场景。包含超过5000次扫描、100万RGB-D视图、语言提示和160k 3D定向框。基于此数据库的Embodied Perceptron展示了在3D感知和语言定位中的优秀表现，适用于计算机视觉和机器人领域。通过我们的演示和基准测试，了解详细信息和应用案例。

UniTR - 多模态变换器网络推动3D感知进展

Github开源项目目标检测3D感知UniTR多模态转换器BEV分割

UniTR是一种新型统一多模态变换器网络,用于3D感知任务。它通过共享权重处理相机和激光雷达等多传感器数据,实现高效多模态融合。在nuScenes数据集上,UniTR在3D目标检测和BEV地图分割任务中均达到最新水平,且降低推理延迟。该研究为提升自动驾驶系统的感知能力提供了新思路。

SegmentAnything3D - Segment Anything技术在3D场景中的创新应用

Github开源项目计算机视觉图像分割3D感知点云处理Segment Anything 3D

SAM3D项目将Segment Anything技术扩展到3D感知领域，通过将2D图像分割信息转移到3D空间，为3D场景理解提供新思路。该项目结合SAM生成掩码、点云合并和区域合并等技术，实现2D到3D的有效转换。SAM3D不仅拓展了计算机视觉的应用范围，也为3D场景分析和理解开辟了新的研究方向。

patchwork-plusplus - 基于3D点云的高效地面分割算法Patchwork++

Github开源项目3D感知点云处理机器人技术Patchwork++地面分割

Patchwork++是Patchwork算法的改进版，专注于3D点云地面分割。该算法具有快速、稳健和自适应特性，有效解决了欠分割问题。项目提供C++、Python和ROS2支持，适用于多种开发环境。凭借在多个数据集上的出色表现，Patchwork++成为自动驾驶和机器人导航领域的重要工具。

相关文章

Article Cover

EmbodiedScan: 面向具身人工智能的全面多模态3D感知套件

Article Cover

UniTR: 突破性的统一多模态Transformer用于3D感知

Article Cover

SegmentAnything3D: 将2D分割扩展到3D场景的创新方法

Article Cover

Patchwork++: 快速稳健的3D LiDAR点云地面分割算法

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号