Project Icon

EdgeSAM

边缘设备上快速的分割模型EdgeSAM

EdgeSAM通过优化的Prompt-In-the-Loop蒸馏方法,为边缘设备提供高效的分割模型。相较于原始SAM,EdgeSAM在速度上提升了40倍,并在iPhone 14上实现了超过30帧每秒的性能。此外,EdgeSAM在COCO和LVIS数据集上的mIoUs分别提升了2.3和3.2,性能优于MobileSAM。该项目支持ONNX和CoreML平台,并已经集成到多个开源工具中。用户还可以通过iOS App方便地使用EdgeSAM。

EdgeSAM 项目介绍

项目概述

EdgeSAM 是一个经过优化的分割模型,旨在提高边缘设备上的执行效率,同时尽量保持性能的完整。与原始的Segment Anything Model (SAM) 相比,EdgeSAM 的运行速度提升了40倍,相比 MobileSAM,在边缘设备上部署时,速度提升了14倍。同时在COCO和LVIS数据集上的平均交并比(mIoUs)分别提高了2.3和3.2,成为第一个能够在iPhone 14上以超过30帧每秒(FPS)运行的SAM变体。

技术背景

EdgeSAM通过将原始的基于视觉Transformer(ViT)的图像编码器转换为完全基于卷积神经网络(CNN)的架构,提高了在边缘设备上的适用性。为了确保模型能够准确捕获用户输入与掩码生成之间的复杂动态关系,项目团队在蒸馏过程中不仅包括了提示编码器和掩码解码器,还引入了盒和点提示。

性能表现

在性能测试中,EdgeSAM展示出优异的表现。在COCO数据集上,EdgeSAM使用1% SA-1B训练集时达到42.2的COCO AP,速度在iPhone 14上达到38.7 FPS,在NVIDIA 2080 Ti上为164.3 FPS。相比之下,原始的SAM则在使用SA-1B完整训练集时达到46.1的COCO AP,其在2080 Ti上运行速度仅为4.3 FPS。

EdgeSAM的创新性在于其能够在性能与速度之间取得良好平衡,非常适合于在资源有限的设备上进行高效部署。

使用指南

要使用EdgeSAM,用户需要安装Python 3.8或更高版本及PyTorch 2.0.0。项目代码可以通过GitHub克隆,安装所需的依赖关系后,即可运行。例如,通过以下代码可以在Python中使用EdgeSAM:

from edge_sam import SamPredictor, sam_model_registry
sam = sam_model_registry["edge_sam"](checkpoint="<path/to/checkpoint>")
predictor = SamPredictor(sam)
predictor.set_image(<your_image>)
masks, _, _ = predictor.predict(<input_prompts>)

相关应用

EdgeSAM已经被集成到多个工具中,如X-AnyLabeling、ISAT和Grounded-Segment-Anything。并且已经有一款iOS应用程序 CutCha 上线,该应用由EdgeSAM提供支持。

总结来说,EdgeSAM在边缘设备上的高效表现和易用性,使其在需要实时图像分割应用时成为一个非常有吸引力的选择。未来,随着更多平台的集成和应用的推出,EdgeSAM预计将在图像处理领域发挥更重要的作用。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号