#图像分割

深入探索A Person Mask Generator: 为图像处理带来精准分割的利器

3 个月前

a-person-mask-generator 自动生成遮罩 Automatic1111 ComfyUI 图像分割 Github 开源项目

3 个月前

MP-Former: 革新图像分割的掩码引导transformer模型

3 个月前

MP-Former 图像分割 Transformer CVPR 2023 Mask2Former Github 开源项目

3 个月前

Detectron2: Facebook AI Research的下一代计算机视觉库

3 个月前

Detectron2 计算机视觉目标检测图像分割深度学习 Github 开源项目

3 个月前

Lang-Segment-Anything: 基于文本提示的图像分割和对象检测新型工具

3 个月前

Language Segment-Anything 图像分割对象检测深度学习计算机视觉 Github 开源项目

3 个月前

SegmentAnything3D: 将2D分割扩展到3D场景的创新方法

3 个月前

开源项目 Segment Anything 3D 3D感知图像分割点云处理计算机视觉 Github

3 个月前

MobileSAM: 移动设备上的轻量级图像分割神器

3 个月前

MobileSAM 图像分割计算机视觉 AI模型深度学习 Github 开源项目

3 个月前

X-Decoder: 一个通用的像素、图像和语言解码模型

3 个月前

X-Decoder 图像分割计算机视觉多任务学习开放词汇分割 Github 开源项目

3 个月前

Set-of-Mark (SoM): 提升大型语言模型视觉能力的创新方法

3 个月前

GPT-4V 视觉提示 Set-of-Mark 图像分割视觉推理 Github 开源项目

3 个月前

LabelConvert: 优秀的数据集格式转换工具

3 个月前

LabelConvert 数据集格式转换目标检测图像分割开源工具 Github 开源项目

3 个月前

Medical-SAM2: 基于SAM2的医学影像分割新突破

3 个月前

Medical SAM 2 图像分割医学影像深度学习计算机视觉 Github 开源项目

3 个月前

相关项目

techniques

本网站详细介绍一系列用于卫星与航空图像处理的深度学习技术，包括分类、分割和对象检测等多种关键技术。这些技术有助于处理复杂的图像尺寸和多元的对象类别，适用于城市规划、环境监测等多个领域。

PaddleSeg

PaddleSeg是一款基于飞桨PaddlePaddle的图像分割套件，内含超过45种模型算法和140多个预训练模型，支持语义分割、交互式分割、Matting及全景分割。应用场景广泛，包括医疗、工业、遥感等。具备高精度、高性能、模块化以及全流程特性，兼容多个操作系统如Linux、Windows、MacOS，适用于多种硬件的训练和部署。

dress-code

Dress Code数据集提供高分辨率的虚拟试衣图像，包含来自YOOX NET-A-PORTER目录的53792件服装和107584张图像。数据集分为上身、下身和连衣裙三类，分辨率为1024x768，并附有关键点、骨架图、人类标签图和稠密姿态信息。请注意，使用此数据集需遵守相关条款，且仅对非私人公司开放。更多信息，请访问相关链接。

DINO

DINO采用改良的降噪锚框，提供先进的端到端目标检测功能，并在COCO数据集上实现了优异的性能表现。模型在较小的模型和数据规模下，达到了63.3AP的优秀成绩。DINO具有快速收敛的特点，使用ResNet-50主干网络仅在12个周期内即可达到49.4AP。项目还提供丰富的模型库和详细的性能评估，用户可以通过Google Drive或百度网盘获取模型检查点和训练日志。

sports

该项目旨在通过对象检测、图像分割和关键点检测等技术，解决体育分析中的多项挑战。提供的体育数据集和工具包能够优化球体追踪、球员号码识别、球员追踪和重新识别，以及相机校准功能。用户可以在Python环境下安装源代码，并利用开源数据集推进体育数据分析的发展。

Grounded-SAM-2

Grounded-SAM-2是一个开源项目，结合Grounding DINO和SAM 2技术，实现图像和视频中的目标检测、分割和跟踪。该项目支持自定义视频输入和多种提示类型，适用于广泛的视觉任务。通过简化代码实现和提供详细文档，Grounded-SAM-2提高了易用性。项目展示了开放世界模型在处理复杂视觉任务中的潜力，为研究人员和开发者提供了强大的工具。

segment-anything-fast

segment-anything-fast是基于Facebook's segment-anything的优化版本，专注于提高图像分割模型的性能。通过整合bfloat16、torch.compile和自定义Triton内核等技术，该项目显著提升了模型推理速度。它支持多种优化方法，如动态int8对称量化和2:4稀疏格式，同时保持了简单的安装和使用流程。这使得开发者能够轻松替换原始segment-anything，实现更高效的图像分割。该优化框架适用于需要实时或大规模图像分割处理的应用，如自动驾驶、医疗影像分析或视频编辑等领域，可显著提高处理效率和资源利用率。

SLiMe

SLiMe是一种基于Stable Diffusion的单样本图像分割方法，通过单个训练样本实现准确分割。项目提供PyTorch实现，包含训练、测试和数据处理指南。SLiMe在PASCAL-Part和CelebAMask-HQ数据集上表现优异，为图像分割研究提供新思路。项目开源代码，支持自定义数据集训练和测试。SLiMe采用图像分块处理技术，提高分割精度。研究者可基于此探索更多单样本学习应用场景。

Segment Anything Model

Meta AI推出的Segment Anything Model (SAM)，能够一键从图像中分割任意对象。此AI模型具备零样本泛化能力，可处理未知对象和图像，适用于视频追踪、图像编辑等多种应用场景。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com