Project Icon

nanodet

轻量级移动设备实时目标检测模型

NanoDet-Plus 是一款超轻量级高精度的无锚目标检测模型,专为移动设备实时检测设计。其模型文件仅有980KB(INT8)或1.8MB(FP16),在ARM CPU上实现97fps检测速度,精度达34.3 mAP@0.5:0.95。NanoDet-Plus 训练友好,GPU内存占用低,支持ncnn、MNN、OpenVINO等多种后端,提供基于ncnn的安卓演示。此模型在COCO数据集上提升了7 mAP,支持多种分辨率和配置,满足不同场景需求。

NanoDet-Plus: 超快速高精度的轻量级无锚框目标检测模型

NanoDet-Plus 是一个超快速、高精度的轻量级无锚框目标检测模型,专为移动设备实时应用而设计。它是 NanoDet 的升级版本,在保持轻量化的同时,大幅提升了检测精度。

主要特点

  • 超轻量级: 模型文件仅 980KB (INT8) 或 1.8MB (FP16)。
  • 超高速: 在移动 ARM CPU 上可达到 97fps (10.23ms)。
  • 高精度: COCO 数据集上可达到 34.3 mAP@0.5:0.95,同时保持 CPU 实时性能。
  • 训练友好: 相比其他模型显著降低 GPU 内存消耗。GTX1060 6G 显卡可支持 batch size 为 80。
  • 易部署: 支持多种后端,包括 ncnn、MNN 和 OpenVINO。提供基于 ncnn 推理框架的 Android 演示。

技术创新

NanoDet-Plus 在原有 NanoDet 的基础上引入了两项重要创新:

  1. 新型标签分配策略:

    • 提出了简单的指派引导模块 (AGM)
    • 引入了动态软标签分配器 (DSLA) 这两项技术解决了轻量级模型训练中的最优标签分配问题。
  2. Ghost-PAN 特征金字塔: 引入了一种轻量级特征金字塔网络,用于增强多层特征融合。

这些改进使 NanoDet-Plus 在 COCO 数据集上的检测精度比原版 NanoDet 提高了 7 个百分点的 mAP。

性能对比

以 NanoDet-Plus-m 416x416 分辨率模型为例:

  • mAP: 30.4 (COCO val2017)
  • CPU 延迟: 8.32ms (Intel i7-8700)
  • ARM 延迟: 19.77ms (4xA76)
  • FLOPS: 1.52G
  • 参数量: 1.17M
  • 模型大小: 2.3MB (FP16) / 1.2MB (INT8)

相比 YOLOv5-n、MobileDet 等同类模型,NanoDet-Plus 在精度和速度上都具有明显优势。

应用场景

NanoDet-Plus 适用于各种需要在移动设备上进行实时目标检测的应用场景,如:

  • 移动 AR
  • 自动驾驶
  • 智能安防
  • 工业检测
  • 移动端 AI 相机

部署方案

NanoDet-Plus 支持多种部署方案:

  • Android: 提供基于 ncnn 的示例应用
  • NCNN C++: 支持在各种平台上使用 NCNN 推理
  • OpenVINO: 支持 Intel 平台优化推理
  • MNN: 支持使用阿里巴巴 MNN 框架推理
  • Web 浏览器: 支持 WebAssembly 部署

此外还提供了 PyTorch 推理 demo,方便研究人员进行实验和改进。

总之,NanoDet-Plus 是一个高效、精准、易用的轻量级目标检测解决方案,特别适合资源受限的移动和嵌入式设备。它的开源为计算机视觉领域的研究和应用带来了新的可能。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号