SOLO

无框的实例分割算法，可直接输出实例掩码和类别概率，并具备高质量掩码预测和顶级性能

SOLO SOLOv2 目标分割高质量遮罩预测 ResNet-101 Github 开源项目

SOLO项目实现了SOLO和SOLOv2两种完全无框的实例分割算法，可直接输出实例掩码和类别概率，并具备高质量掩码预测和顶级性能。该项目基于mmdetection，支持多GPU和单GPU训练，并提供多种预训练模型下载，包括轻量级模型。对于研究人员来说，这些工具显著提高了分割精度和训练速度，适用于各种应用场景。

访问官网

Github

Huggingface

介绍相关项目

ComfyUI-YoloWorld-EfficientSAM - YOLO-World + EfficientSAM for ComfyUI 的非官方实现，提供高效的对象检测与实例分割功能

ComfyUIEfficientSAMGithubYOLO-World实例分割对象检测开源项目

该项目非官方实现了YOLO-World和EfficientSAM，通过融合这两个模型，提供高效的对象检测与实例分割功能。版本V2.0新增了蒙版分离与提取功能，支持指定蒙版单独输出，可处理图像和视频。项目特点包括支持加载多种YOLO-World和EfficientSAM模型，提供检测框厚度、置信度阈值、IoU阈值等配置选项，以提升检测与分割的精准性。详细的视频演示和安装指南，使用户能够轻松上手，体验高效的图像处理能力。

Segment Anything Model - 一键智能识别与分割图像中的对象

AIAI工具AI开发Meta AISegment Anything Model图像分割模型训练热门零次训练

Meta AI推出的Segment Anything Model (SAM)，能够一键从图像中分割任意对象。此AI模型具备零样本泛化能力，可处理未知对象和图像，适用于视频追踪、图像编辑等多种应用场景。

ultralytics - 适用于对象检测、跟踪、实例分割和图像分类等多种应用场景的多功能对象检测模型

GithubUltralyticsYOLOv8姿态估计实例分割开源项目目标检测

Ultralytics的YOLOv8是一款前沿对象识别模型，提供了与前代产品相比更优化的特性。适用于对象检测、跟踪、实例分割和图像分类等多种应用场景，其高速准确性和用户友好性使其成为AI领域开发者的优选。更多细节，请参阅官方文档或参与Discord社区互动。

mask2former-swin-large-ade-panoptic - 通用图像分割模型，提升性能和效率

ADE20kGithubHuggingfaceMask2FormerMaskFormer分割开源项目模型视觉

Mask2Former利用多尺度可变形注意力Transformer，提高图像分割性能与效率。其掩蔽注意力解码器在不增加计算负担的情况下提升表现，适用于实例、语义和全景分割。基于ADE20k全景分割数据集的训练研究，提供优化的分割方案。

PaddleSeg - 高性能端到端图像分割工具套件，支持从训练到部署

AI套件GithubPaddleSegPaddleX图像分割开源项目飞桨

PaddleSeg是一款基于飞桨PaddlePaddle的图像分割套件，内含超过45种模型算法和140多个预训练模型，支持语义分割、交互式分割、Matting及全景分割。应用场景广泛，包括医疗、工业、遥感等。具备高精度、高性能、模块化以及全流程特性，兼容多个操作系统如Linux、Windows、MacOS，适用于多种硬件的训练和部署。

mmsegmentation - 高效的PyTorch语义分割工具箱与新特性介绍

GithubMMSegmentationOpenMMLabPyTorchv1.0.0开源项目语义分割

MMSegmentation是基于PyTorch的开源语义分割框架，提供模块化设计和统一基准，支持多种算法。最新v1.2.0版本新增开放词汇语义分割和单目深度估计功能，提升训练效率和快速部署体验。

VNext - 高级视频实例分割框架，支持在线和离线模式

GithubIDOLInstMoveSeqFormerVNext开源项目视频实例分割

VNext是一个基于Detectron2的视频实例识别框架，提供先进的在线和离线实例分割算法及对象中心的视频分割运动模型。用户可参考官方教程进行安装、训练和评估。最新算法InstMove、IDOL和SeqFormer在国际会议上获得认可并取得优异成绩。

LISA - 通过大型语言模型进行推理分割的技术

GithubLISA分割掩码多模态大语言模型开源项目推理分割

LISA凭借其多模态大型语言模型，开创推理分割任务，能够将复杂文本问题转化为精准的图像分割结果。该项目不仅包含超千个图像指令对、综合推理及世界知识评估，还展示出在无需推理的数据集训练下的强大零样本能力。推理训练图片指令对的引入进一步强化了其性能。详情请参阅相关论文。

PFENet - 优化少样本分割的先验引导特征增强网络

GithubPFENet少样本分割开源项目深度学习特征提取语义分割

PFENet作为少样本分割网络的代表作，利用先验引导特征增强技术优化分割效果。在PASCAL-5i和COCO等主流数据集上，PFENet展现出卓越性能。该开源项目包含完整实现代码、预训练模型和详细文档，为计算机视觉研究提供了宝贵资源。

CV - 全面的计算机视觉深度学习模型集合

Github图像分类开源项目深度学习目标检测计算机视觉语义分割

这个项目收集了多个计算机视觉领域的深度学习模型，包括图像分类、目标检测、语义分割和生成模型。项目为每个模型提供论文链接、详细解析和代码实现，涵盖从AlexNet到YOLO系列等经典算法。这是一个面向研究人员和开发者的综合性学习资源，有助于理解和应用先进的计算机视觉技术。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号