ARKitScenes
本仓库配套研究论文《ARKitScenes - 使用移动RGB-D数据的多样化真实世界3D室内场景理解数据集》,包含了论文中描述的数据、可视化和处理资产的脚本以及训练代码。
论文
ARKitScenes - 使用移动RGB-D数据的多样化真实世界3D室内场景理解数据集
使用这些数据或源代码时,请引用
@inproceedings{
dehghan2021arkitscenes,
title={{ARK}itScenes - A Diverse Real-World Dataset for 3D Indoor Scene Understanding Using Mobile {RGB}-D Data},
author={Gilad Baruch and Zhuoyuan Chen and Afshin Dehghan and Tal Dimry and Yuri Feigin and Peter Fu and Thomas Gebauer and Brandon Joffe and Daniel Kurz and Arik Schwartz and Elad Shulman},
booktitle={Thirty-fifth Conference on Neural Information Processing Systems Datasets and Benchmarks Track (Round 1)},
year={2021},
url={https://openreview.net/forum?id=tjZjv_qh_CE}
}
概述
ARKitScenes不仅是第一个使用现在广泛可用的深度传感器捕获的RGB-D数据集,而且是迄今为止收集的最大的室内场景理解数据集。除了原始和处理后的数据,ARKitScenes还包括使用固定激光扫描仪捕获的高分辨率深度图,以及大量家具分类的手动标注的3D定向边界框。我们还为两个下游任务提供了辅助脚本:3D物体检测和RGB-D引导上采样。我们希望我们的数据集能够推动现有最先进方法的边界,并引入更好地代表真实世界场景的新挑战。
主要特点
• ARKitScenes是第一个使用广泛可用的Apple LiDAR扫描仪捕获的RGB-D数据集。除了原始数据,我们还为每个场景提供相机姿态和表面重建。
• ARKitScenes是最大的室内3D数据集,包含1,661个独特场景的5,047次捕获。
• 我们提供高质量的地面真实数据,包括(a)配准的RGB-D帧和(b)房间定义对象的定向边界框。
下面是RGB-D数据集及其地面真实数据资产与ARKitScenes的比较概览。 HR和LR分别代表高分辨率和低分辨率,可用于841个独特场景的2,257次捕获的子集。
数据收集
在下图中,我们提供了(a)iPad Pro扫描设置的示意图。(b)辅助iPad Pro数据收集的网格叠加。(c)使用iPad Pro捕获的扫描模式示例之一,红色标记显示了该房间中固定激光扫描仪的选定位置。
数据下载
要下载数据,请参照数据文档
任务
这里我们提供了论文中提到的两个任务,即3D物体检测(3DOD)和深度上采样。
3DOD
深度上采样
许可
ARKitScenes数据集根据知识共享署名-非商业性使用-相同方式共享4.0国际公共许可证授权。要查看此许可证的副本,请访问https://creativecommons.org/licenses/by-nc-sa/4.0/。 关于商业许可的查询,请联系ARKitScenes-license@group.apple.com 如果您有任何其他问题,请在仓库中提出issue并联系ARKitScenes@group.apple.com