SOLO

无框的实例分割算法，可直接输出实例掩码和类别概率，并具备高质量掩码预测和顶级性能

SOLO SOLOv2 目标分割高质量遮罩预测 ResNet-101 Github 开源项目

SOLO项目实现了SOLO和SOLOv2两种完全无框的实例分割算法，可直接输出实例掩码和类别概率，并具备高质量掩码预测和顶级性能。该项目基于mmdetection，支持多GPU和单GPU训练，并提供多种预训练模型下载，包括轻量级模型。对于研究人员来说，这些工具显著提高了分割精度和训练速度，适用于各种应用场景。

访问官网

Github

Huggingface

介绍相关项目

detectron2 - Facebook开源的高性能目标检测和图像分割框架

Detectron2Github图像分割开源项目深度学习目标检测计算机视觉

Detectron2是Facebook AI Research开发的开源计算机视觉库，提供先进的目标检测和图像分割算法。它支持全景分割、Densepose和级联R-CNN等功能，可用于研究项目和生产应用。该库训练速度快，支持模型导出，并提供大量预训练模型。Detectron2为研究人员和开发者提供了强大而灵活的工具，推动计算机视觉技术的发展和应用。

Grounded-Segment-Anything - 融合文本引导的开放世界目标检测与分割工具

GithubGrounded-SAM图像分割开源项目目标检测视觉AI

Grounded-Segment-Anything项目结合了Grounding DINO和Segment Anything模型的优势，能够根据文本提示检测和分割图像中的任意物体。该工具为开放世界场景中的目标检测和分割任务提供了有效解决方案，支持自动标注、3D人体网格重建和图像编辑等多种应用。通过提高检测和分割精度并提升工作效率，Grounded-Segment-Anything为计算机视觉领域带来了显著进展。

SAM-Adapter-PyTorch - 提升复杂场景下图像分割效果的开源项目

GithubICCVPyTorchPythonSAM-AdapterSegment Anything开源项目

SAM-Adapter项目提升了SAM在伪装、阴影和医疗图像分割中的表现。最新的更新支持更强大的SAM2骨干网络，并提供多种预训练模型和数据集下载链接，便于快速上手。该项目在IEEE/CVF国际计算机视觉会议上展示，并包含详细的环境配置和训练指南，方便研究人员进行深度学习任务。

awesome-object-detection - 提供涵盖R-CNN至YOLOv3等系统目标检测资源

Fast R-CNNFaster R-CNNGithubMask R-CNNR-CNNYOLO开源项目

awesome-object-detection为研究者和开发者提供涵盖R-CNN至YOLOv3等系统目标检测资源，适用于学术研究与实际应用。

Grounded-SAM-2 - 多模态视频目标检测与分割框架

GithubGrounding DINOSAM 2图像分割开源项目目标检测视频追踪

Grounded-SAM-2是一个开源项目，结合Grounding DINO和SAM 2技术，实现图像和视频中的目标检测、分割和跟踪。该项目支持自定义视频输入和多种提示类型，适用于广泛的视觉任务。通过简化代码实现和提供详细文档，Grounded-SAM-2提高了易用性。项目展示了开放世界模型在处理复杂视觉任务中的潜力，为研究人员和开发者提供了强大的工具。

edgeyolo - 优化边缘设备性能的模型，支持ONNX和TensorRT导出

COCO2017EdgeYOLOGithubHuawei AscendNvidia Jetson AGX XavierTensorRT开源项目

EdgeYOLO为边缘设备优化，在Nvidia Jetson AGX Xavier上达34FPS，并通过RH loss提升小型和中型物体检测。支持COCO2017和VisDrone2019数据集，提供多种模型格式和部署代码，包括RKNN、MNN和TensorRT。项目定期更新，并集成了SAMLabeler Pro工具，支持多人远程标注。可快速上手和训练，适配不同设备和应用场景。

MobileSAM - 高效轻量化图像分割模型，适用于移动设备

AI模型GithubMobileSAM图像分割开源项目深度学习计算机视觉

MobileSAM是一种轻量级图像分割模型,专为移动应用优化。它保持了与原始SAM相当的性能,同时大幅减少了模型参数和推理时间。通过将ViT-H编码器替换为TinyViT,MobileSAM将参数量从615M降至9.66M,推理速度从456ms提升至12ms。该项目提供完整的训练和使用文档,支持ONNX导出,可轻松集成到现有SAM项目中。

LibtorchSegmentation - 高性能C++图像分割库

C++库GithubLibTorch图像分割开源项目神经网络预训练模型

LibtorchSegmentation是基于LibTorch的C++图像分割库，提供高级API和多种模型架构。支持15种预训练编码器，推理速度比PyTorch CUDA快35%。该库简单易用yet功能强大，适合快速开发和部署各类图像分割应用。

overeasy - 无数据集需求的定制视觉模型构建

GithubOvereasy分割图像处理开源项目计算机视觉零样本视觉模型

Overeasy允许无大规模数据集，通过链式预训练零样本视觉模型实现高效图像处理。利用专用工具和工作流，用户可定制端到端管道，支持边框检测及分类。功能涵盖执行图和检测，安装简便，文档详尽，并提供Colab示例。

RT-DETR - 超越YOLO的实时目标检测算法领域突破

CVPR 2024GithubRT-DETR实时目标检测开源项目深度学习物体识别

RT-DETR是一个开源的实时目标检测算法项目，在性能上超越了YOLO系列。它提供多种模型变体，从轻量级R18到大型X模型，适应不同应用需求。在COCO和Objects365数据集上，RT-DETR展现出卓越性能，最高达到56.2mAP和217FPS。项目同时支持PyTorch和PaddlePaddle框架，便于研究和应用。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号