EmbodiedScan
EmbodiedScan及其系列如MMScan是专为多模态3D感知设计的开放数据集与基准,用于深入理解第一人称3D场景。包含超过5000次扫描、100万RGB-D视图、语言提示和160k 3D定向框。基于此数据库的Embodied Perceptron展示了在3D感知和语言定位中的优秀表现,适用于计算机视觉和机器人领域。通过我们的演示和基准测试,了解详细信息和应用案例。