#VoxFormer

VoxFormer: 基于稀疏体素Transformer的相机3D语义场景补全

3 个月前

VoxFormer 3D语义场景补全计算机视觉 CVPR 语义分割 Github 开源项目

3 个月前

相关项目

VoxFormer

VoxFormer是一种基于Transformer的创新框架，仅通过2D图像即可生成完整的3D语义体素。它采用两阶段设计：先从深度估计生成可见占据体素查询，再通过密集化阶段生成完整3D体素。在SemanticKITTI数据集上，VoxFormer在几何和语义方面分别提升了20.0%和18.1%，同时将训练所需GPU内存减少约45%。这为相机驱动的3D语义场景补全任务提供了一个强有力的基线。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com