Project Icon

LaserMix

创新半监督LiDAR语义分割框架

LaserMix是针对LiDAR语义分割的半监督学习框架。该方法利用驾驶场景空间先验,通过激光束混合构建低变化区域,促使分割模型在混合前后保持一致预测。在多个数据集上,LaserMix显著提升了分割性能,尤其适用于标注数据有限的情况。该框架兼容多种LiDAR分割网络,并已整合至MMDetection3D代码库。


LaserMix:用于半监督激光雷达语义分割的方法

孔令栋,  任嘉伟,  潘亮,  刘子伟
南洋理工大学 S-Lab

简介

LaserMix是一个为激光雷达语义分割设计的半监督学习(SSL)框架。它利用驾驶场景的强空间先验,通过激光束混合构建低变化区域,并鼓励分割模型在混合前后做出自信一致的预测。



图. 基于倾角φ的激光束分区示意图。


访问我们的项目页面了解更多详情。:red_car:

更新

  • [2024.05] - 我们改进的框架 LaserMix++ :rocket: 已在 arXiv 上发布。
  • [2024.01] - 为 RoboDrive 挑战赛 定制的工具包已经发布。:hammer_and_wrench:
  • [2023.12] - 我们正在 ICRA 2024 上举办 RoboDrive 挑战赛。:blue_car:
  • [2023.12] - 推出 FRNet,这是一个高效且有效的实时 LiDAR 分割模型,在 SemanticKITTInuScenes 上取得了promising的半监督学习结果。代码和检查点可供下载。
  • [2023.03] - 想测试你的 LiDAR 语义分割模型的鲁棒性吗?查看我们最新的工作 :robot: Robo3D,这是一个综合套件,能够在我们新建立的数据集 SemanticKITTI-CnuScenes-CWOD-C 上评估 3D 分割器的分布外鲁棒性。
  • [2023.03] - LaserMix 被选为 CVPR 2023 的 :sparkles: 亮点论文 :sparkles:(被接收论文的前 10%)。
  • [2023.02] - LaserMix 被 CVPR 2023 接收!:tada:
  • [2023.02] - LaserMix 已集成到 MMDetection3D 代码库中!查看 dev-1.x 分支中的这个 PR 了解更多详情。:beers:
  • [2023.01] - 根据建议,我们将在半监督 LiDAR 语义分割基准中建立一个序列轨道,考虑 LiDAR 数据收集的本质。结果将逐步更新在 RESULT.md 中。
  • [2022.12] - 我们支持更广泛的 LiDAR 分割骨干网络,包括 RangeNet++SalsaNextFIDNetCENetMinkowskiUNetCylinder3DSPVCNN,支持全监督和半监督设置。检查点将很快提供!
  • [2022.12] - 基于空间先验的 SSL 推导可在此处获得。快来看看!:memo:
  • [2022.08] - 根据 Paper-with-Code,LaserMix 在 nuScenesSemanticKITTIScribbleKITTI 的半监督语义分割排行榜上均获得第一名。:bar_chart:
  • [2022.08] - 我们提供了一个 视频演示,展示了在 SemanticKITTI 验证集上的视觉比较。快来看看!
  • [2022.07] - 我们的论文已在 arXiv 上发布,点击这里查看。代码将很快提供!

大纲

安装

请参考 INSTALL.md 了解安装详情。

数据准备

请参考 DATA_PREPARE.md 了解准备 1nuScenes2SemanticKITTI3ScribbleKITTI 数据集的详细信息。

入门指南

请参考 GET_STARTED.md 了解更多关于这个代码库的使用方法。

视频演示

演示 1演示 2演示 3
链接 :arrow_heading_up:链接 :arrow_heading_up:链接 :arrow_heading_up:

主要结果

框架概述

范围视图

方法nuScenesSemanticKITTIScribbleKITTI
1%10%20%50%1%10%20%50%1%10%20%50%
仅监督38.357.562.767.636.252.255.957.233.147.749.952.5
LaserMix49.568.270.673.043.458.859.461.438.354.455.658.7
提升+11.2+10.7+7.9+5.4+7.2+6.6+3.5+4.2+5.2+6.7+5.7+6.2
LaserMix++
提升

体素

方法nuScenesSemanticKITTIScribbleKITTI
1%10%20%50%1%10%20%50%1%10%20%50%
仅监督50.965.966.671.245.456.157.858.739.248.052.153.8
LaserMix55.369.971.873.250.660.061.962.344.253.755.156.8
提升+4.4+4.0+5.2+2.0+5.2+3.9+4.1+3.6+5.0+5.7+3.0+3.0
LaserMix++
提升

消融研究

定性示例

定性

检查点和更多结果

有关更多实验结果和预训练权重,请参阅 RESULT.md

待办事项

  • 初始发布。:rocket:
  • 添加许可证。详情请参阅此处
  • 添加视频演示 :movie_camera:
  • 添加安装详情。
  • 添加数据准备详情。
  • 添加评估详情。
  • 添加训练详情。

引用

如果您觉得这项工作有帮助,请考虑引用我们的论文:

@inproceedings{kong2023lasermix,
  title = {LaserMix for Semi-Supervised LiDAR Semantic Segmentation},
  author = {Kong, Lingdong and Ren, Jiawei and Pan, Liang and Liu, Ziwei},
  booktitle = {IEEE/CVF Conference on Computer Vision and Pattern Recognition},
  pages = {21705--21715},
  year = {2023},
}

许可证

知识共享许可协议
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

致谢

本工作基于 MMDetection3D 代码库开发。


MMDetection3D是一个基于PyTorch的开源工具箱,旨在成为下一代通用3D感知平台。它是由MMLab开发的OpenMMLab项目的一部分。

在本工作过程中,我们感谢使用了以下公共资源:1nuScenes2nuScenes-devkit3SemanticKITTI4SemanticKITTI-API5ScribbleKITTI6FIDNet7CENet8SPVNAS9Cylinder3D10TorchSemiSeg11MixUp12CutMix13CutMix-Seg14CBST15MeanTeacher16Cityscapes

我们要特别感谢洪方舟富有洞察力的讨论和反馈。❤️

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号