#图像分割

BiRefNet: 高分辨率图像二分割的双边参考网络

3 个月前
Cover of BiRefNet: 高分辨率图像二分割的双边参考网络

Grounded-Segment-Anything: 结合多个强大模型实现复杂视觉任务的开源项目

3 个月前
Cover of Grounded-Segment-Anything: 结合多个强大模型实现复杂视觉任务的开源项目

揭秘groundingLMM:首个实现像素级语义分割的大型多模态模型

3 个月前
Cover of 揭秘groundingLMM:首个实现像素级语义分割的大型多模态模型

EVF-SAM: 早期视觉-语言融合的文本提示分割任意物体模型

3 个月前
Cover of EVF-SAM: 早期视觉-语言融合的文本提示分割任意物体模型

Meta的Segment Anything Model 2 (SAM 2): 图像和视频分割的新突破

3 个月前
Cover of Meta的Segment Anything Model 2 (SAM 2): 图像和视频分割的新突破

FastSAM: 快速分割任何物体的革命性技术

3 个月前
Cover of FastSAM: 快速分割任何物体的革命性技术

Grounded SAM 2: 突破性的视觉AI模型revolutionizing计算机视觉领域

3 个月前
Cover of Grounded SAM 2: 突破性的视觉AI模型revolutionizing计算机视觉领域

体育与计算机视觉的完美结合:探索Roboflow Sports项目

3 个月前
Cover of 体育与计算机视觉的完美结合:探索Roboflow Sports项目

DINO: 基于改进的去噪锚框的端到端目标检测算法

3 个月前
Cover of DINO: 基于改进的去噪锚框的端到端目标检测算法

Dress Code: 高分辨率多类别虚拟试衣技术的突破性进展

3 个月前
Cover of Dress Code: 高分辨率多类别虚拟试衣技术的突破性进展
相关项目
Project Cover

techniques

本网站详细介绍一系列用于卫星与航空图像处理的深度学习技术,包括分类、分割和对象检测等多种关键技术。这些技术有助于处理复杂的图像尺寸和多元的对象类别,适用于城市规划、环境监测等多个领域。

Project Cover

PaddleSeg

PaddleSeg是一款基于飞桨PaddlePaddle的图像分割套件,内含超过45种模型算法和140多个预训练模型,支持语义分割、交互式分割、Matting及全景分割。应用场景广泛,包括医疗、工业、遥感等。具备高精度、高性能、模块化以及全流程特性,兼容多个操作系统如Linux、Windows、MacOS,适用于多种硬件的训练和部署。

Project Cover

dress-code

Dress Code数据集提供高分辨率的虚拟试衣图像,包含来自YOOX NET-A-PORTER目录的53792件服装和107584张图像。数据集分为上身、下身和连衣裙三类,分辨率为1024x768,并附有关键点、骨架图、人类标签图和稠密姿态信息。请注意,使用此数据集需遵守相关条款,且仅对非私人公司开放。更多信息,请访问相关链接。

Project Cover

DINO

DINO采用改良的降噪锚框,提供先进的端到端目标检测功能,并在COCO数据集上实现了优异的性能表现。模型在较小的模型和数据规模下,达到了63.3AP的优秀成绩。DINO具有快速收敛的特点,使用ResNet-50主干网络仅在12个周期内即可达到49.4AP。项目还提供丰富的模型库和详细的性能评估,用户可以通过Google Drive或百度网盘获取模型检查点和训练日志。

Project Cover

sports

该项目旨在通过对象检测、图像分割和关键点检测等技术,解决体育分析中的多项挑战。提供的体育数据集和工具包能够优化球体追踪、球员号码识别、球员追踪和重新识别,以及相机校准功能。用户可以在Python环境下安装源代码,并利用开源数据集推进体育数据分析的发展。

Project Cover

Grounded-SAM-2

Grounded-SAM-2是一个开源项目,结合Grounding DINO和SAM 2技术,实现图像和视频中的目标检测、分割和跟踪。该项目支持自定义视频输入和多种提示类型,适用于广泛的视觉任务。通过简化代码实现和提供详细文档,Grounded-SAM-2提高了易用性。项目展示了开放世界模型在处理复杂视觉任务中的潜力,为研究人员和开发者提供了强大的工具。

Project Cover

segment-anything-fast

segment-anything-fast是基于Facebook's segment-anything的优化版本,专注于提高图像分割模型的性能。通过整合bfloat16、torch.compile和自定义Triton内核等技术,该项目显著提升了模型推理速度。它支持多种优化方法,如动态int8对称量化和2:4稀疏格式,同时保持了简单的安装和使用流程。这使得开发者能够轻松替换原始segment-anything,实现更高效的图像分割。该优化框架适用于需要实时或大规模图像分割处理的应用,如自动驾驶、医疗影像分析或视频编辑等领域,可显著提高处理效率和资源利用率。

Project Cover

SLiMe

SLiMe是一种基于Stable Diffusion的单样本图像分割方法,通过单个训练样本实现准确分割。项目提供PyTorch实现,包含训练、测试和数据处理指南。SLiMe在PASCAL-Part和CelebAMask-HQ数据集上表现优异,为图像分割研究提供新思路。项目开源代码,支持自定义数据集训练和测试。SLiMe采用图像分块处理技术,提高分割精度。研究者可基于此探索更多单样本学习应用场景。

Project Cover

Segment Anything Model

Meta AI推出的Segment Anything Model (SAM),能够一键从图像中分割任意对象。此AI模型具备零样本泛化能力,可处理未知对象和图像,适用于视频追踪、图像编辑等多种应用场景。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号