ARKitScenes

革新3D室内场景理解的大规模数据集

ARKitScenes 3D室内场景理解 RGB-D数据集深度传感器家具标注 Github 开源项目

ARKitScenes是一个创新的3D室内场景理解数据集，利用移动RGB-D技术捕获数据。作为首个采用广泛可用深度传感器的RGB-D数据集，它涵盖了1,661个独特场景的5,047次捕获。数据集提供原始和处理后的数据、高分辨率深度图及手动标注的3D定向边界框。此外，项目还包含3D物体检测和RGB-D引导上采样的辅助脚本，为推进室内场景理解技术和应对真实世界挑战提供了宝贵资源。

Github

介绍相关项目

ISBNet - 高效准确的3D点云实例分割网络实现先进场景理解

3D点云GithubISBNet实例分割开源项目深度学习计算机视觉

ISBNet是一种创新的3D点云实例分割网络，采用实例感知采样和框感知动态卷积技术。通过多任务学习方法和轴对齐边界框预测，ISBNet在ScanNetV2、S3DIS和STPLS3D等数据集上实现了领先的分割精度，同时保持快速推理速度。该方法有效解决了密集场景中相同语义类别物体的分割问题，为3D场景理解提供了新的解决方案。

Gaussian-SLAM - 革新性实时3D重建技术，融合高斯散射实现逼真效果

3D重建Gaussian-SLAMGithubSLAM开源项目神经渲染计算机视觉

Gaussian-SLAM是一种创新的3D场景重建技术，将高斯散射与SLAM系统相结合。该技术能够准确映射环境，生成高质量纹理和细节，实现照片级真实的稠密重建效果。Gaussian-SLAM在Replica、TUM_RGBD、ScanNet等多个数据集上展示了优秀性能，为实时3D重建和增强现实应用开辟了新途径，是计算机视觉和机器人领域的重要进展。

mvsplat - 从稀疏多视角图像高效重建3D场景

3D Gaussian SplattingGithubMVSplat多视图图像开源项目神经渲染计算机视觉

MVSplat是一种基于3D高斯分布渲染的多视角图像重建技术。该项目利用深度学习和计算机视觉方法，从稀疏的多视角图像高效重建3D场景并实现新视角渲染。MVSplat在RealEstate10K和ACID数据集上表现优异，并具有良好的跨数据集泛化能力。项目提供了安装指南、预训练模型和评估代码，便于研究人员进行复现和改进。

3d-bat - 全面高效的3D全景数据标注工具箱

3D BATGithub多模态数据开源项目标注工具自动驾驶计算机视觉

3D-BAT是一个开源的3D边界框标注工具箱，专门用于全景多模态数据流的处理。该工具支持AI辅助标注、批量编辑和插值模式等功能，实现了3D到2D的标签转换和自动跟踪。作为基于Web的应用，3D-BAT支持在线访问和跨平台使用，并提供了高度的可定制性。这个工具箱为自动驾驶和计算机视觉等领域的研究提供了一个实用的数据标注解决方案。

ok-robot - 家庭环境中实现自主导航与操作的模块化框架

GithubOK-Robot室内导航开源框架开源项目机器人操作物体抓取

OK-Robot是一个零样本模块化框架，集成了先进的导航和操作模型，用于执行家庭环境中的取放任务。该项目在10个真实家庭中测试了170多个物体，成功率达58.5%。通过整合AnyGrasp抓取和VoxelMap开放词汇导航等技术，OK-Robot为家庭服务机器人研究提供了开放平台。

OpalAi - 快速生成精确2D/3D室内平面图的手机应用

3D扫描AI工具BIM模型CAD建模Scanto3D室内地图

OpalAi是iOS和iPad平台上的房屋设计应用，通过手机扫描快速生成2D和3D平面图。应用能在几分钟内创建精确的BIM模型，自动清除家具影响，并支持多种输出格式。适用于房地产评估、建筑施工等领域，为室内空间设计提供高效便捷的解决方案。

sc_depth_pl - 通过自我监督学习实现视频中的单目深度估计

ARNGithubSC-Depthmonocular depthpytorchself-supervised learning开源项目

SC-Depth项目提供了SC-DepthV1, V2和V3版本的PyTorch Lightning实现，专注于从视频中进行自我监督的单目深度估计。SC-DepthV1引入了几何一致性损失和自发现蒙板，提高了深度预测的准确性。SC-DepthV2通过引入自动矫正网络（ARN）解决了手持相机视频中大相对旋转的问题。SC-DepthV3利用外部预训练的深度估计网络，在动态场景中显著提升了单目深度估计的准确性。该项目提供了详细的安装指南、数据集组织和训练流程，支持多种数据集和自定义数据的训练。了解更多关于SC-Depth的详细信息以及其在多个挑战性数据集上的评估结果。

awesome-6d-object - 6D物体姿态估计与重建资源汇总

3D重建CVPRGithub开源项目深度学习物体姿态估计计算机视觉

这个项目整理了6D物体姿态估计、单视图3D物体重建和3D手-物体姿态估计领域的重要资源。内容包括arXiv论文、期刊会议论文、学位论文、数据集、研讨会和挑战赛信息。资源按年份和会议分类,涵盖2014年至今的研究进展,为相关研究人员提供了全面的参考。

Magiscan - 智能3D扫描应用助力快速生成精细数字模型

3D扫描3D模型AI工具MagiScan人工智能移动应用

Magiscan是一款适用于iOS和Android平台的3D扫描应用。该应用运用人工智能技术，能够快速生成各类物体的高精度3D模型。支持USDZ、GTLF、GLB等多种格式导出，广泛应用于电商、NVIDIA Omniverse等领域。Magiscan操作简便、性能卓越且价格合理，适合专业人士和普通用户使用。Magiscan为3D打印、虚拟现实内容创作、产品展示等领域提供了便捷的3D模型制作解决方案。

toon3d - 创新的卡通场景3D重建技术

3D重建GithubToon3D卡通场景多视图立体视觉开源项目结构光法

Toon3D是一个开源项目，致力于将非几何一致性场景（如卡通）重建为3D模型。该项目利用少量2D卡通图像，通过自定义的SfM（Structure from Motion）流程实现3D重建。Toon3D提供了完整的数据处理、标注和重建工具链，使研究人员和开发者能够轻松探索和应用这一创新技术。项目的成果为计算机视觉、动画制作和游戏开发等领域开辟了新的研究方向。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号