#目标检测

models - 产业级开源模型库,支持多场景端到端开发
Github开源项目目标检测图像分类飞桨开源模型库语义理解
飞桨开源模型库提供经过实践验证的主流模型,支持语义理解、图像分类、目标检测等场景,助力企业低成本开发和快速集成。模型库根据国内企业研发流程定制,广泛应用于能源、金融、工业、农业等领域,包含超过600个官方模型和260个生态模型。
boxmot - BoxMOT:支持分割、目标检测和姿态估计的多对象跟踪模块
Github开源项目目标检测BoxMOTYolov8多目标跟踪姿态估计
BoxMOT项目提供可插拔的多对象跟踪模块,支持分割、目标检测和姿态估计。提供适用于各种硬件配置的跟踪方法,包括CPU和GPU。兼容多种ReID模型及Yolov8、Yolo-NAS、YOLOX等目标检测模型,并通过快速实验脚本提高实验效率。
paper2gui - 无缝集成AI技术的多功能桌面应用工具箱
Github开源项目AI应用Paper2GUI视频超分辨图像风格化目标检测热门
Paper2GUI是一个为普通用户设计的AI驱动桌面应用工具箱,支持Windows、Mac和Linux系统。提供40+ AI模型,覆盖AI绘画、语音合成、视频补帧等多种功能。用户可享受免安装、即开即用的便捷体验,特别适用于希望轻松利用AI技术的生产力用户。
ultralytics - 适用于对象检测、跟踪、实例分割和图像分类等多种应用场景的多功能对象检测模型
Github开源项目目标检测实例分割姿态估计YOLOv8Ultralytics
Ultralytics的YOLOv8是一款前沿对象识别模型,提供了与前代产品相比更优化的特性。适用于对象检测、跟踪、实例分割和图像分类等多种应用场景,其高速准确性和用户友好性使其成为AI领域开发者的优选。更多细节,请参阅官方文档或参与Discord社区互动。
yolov3 - 开源视觉AI技术
人工智能Github开源项目目标检测图像识别YOLOv3Ultralytics
YOLOv3是Ultralytics公司开发的开源视觉AI技术,汇集了广泛的研究和丰富经验。平台包含详尽的文档和教程,支持社区讨论,简化学习和实施过程。此技术因其出色性能和易用性,在全球范围内被广泛采用,帮助用户迅速部署并有效训练模型。
deep_learning_object_detection - 探索深度学习在目标检测领域的最新进展
Github开源项目目标检测deep learningSSDR-CNN性能表
本项目汇总自2014年以来的目标检测相关深度学习研究论文,含最新论文、代码实现及性能数据。资源周期性更新,旨在为开发者和研究人员提供有价值的信息参考,帮助掌握领域前沿技术与动态。
DAMO-YOLO - 基于YOLO系列和嵌入包括神经网络架构搜索及轻量级算法在内的多项新技术的对象检测算法
Github开源项目性能优化目标检测DAMO-YOLO检测模型算法更新
DAMO-YOLO, 阿里巴巴DAMO实验室的先进对象检测技术,基于YOLO系列和嵌入包括神经网络架构搜索及轻量级算法在内的多项新技术,以优化性能和效率。针对广泛行业场景,提供一站式解决方案,从训练到部署全面支持。
awesome-yolo-object-detection - YOLO目标检测开源项目与资源汇编
Github开源项目机器学习目标检测YOLO实时检测视觉AI
提供YOLO目标检测的全面资源汇编。包含官方以及多个针对特殊任务或硬件的优化版本,涵盖YOLOv1至YOLOv7等系列。项目中还包括丰富的学习资源、应用示例及工具,为学者和开发者提供了解及使用YOLO技术的优质资料。
TensorRT-YOLO - 为YOLO目标检测模型提供推理加速解决方案
Github开源项目目标检测CUDAYOLO推理加速TensorRT-YOLO
此项目基于TensorRT,为YOLO目标检测模型提供推理加速解决方案,支持YOLOv3至YOLOv10及PP-YOLOE系列。集成EfficientNMS插件及CUDA技术,有效提升推理效率。支持C++和Python,包含CLI快速导出和推理功能,并提供Docker一键部署。推荐CUDA 11.6及以上版本和TensorRT 8.6及以上版本。
ONNX-YOLOv8-Object-Detection - 将YOLOv8模型转换为ONNX格式的方法
Github开源项目目标检测GPUONNX模型转换YOLOv8
本项目提供了一种将YOLOv8模型转换为ONNX格式的高效方法,支持在NVIDIA GPU或CPU上进行对象检测。确保输入图片尺寸与模型要求一致,以获得最佳检测精度。项目配有详细的安装指南和推理示例,包括图片、摄像头和视频推理,方便开发者快速上手并应用于实际场景。
Exclusively-Dark-Image-Dataset - 低光环境中的目标检测与图像增强数据集
Github开源项目目标检测图像增强数据集Exclusively Dark低光图像
Exclusively Dark (ExDark) 数据集包含7,363张低光环境图像,适用于低光条件下的目标检测和图像增强研究。该数据集涵盖了10种不同的低光环境,注释了12类目标对象。提供了用于低光图像增强的源代码,研究人员可利用此数据集和源代码优化计算机视觉技术。
YOLOv8-TensorRT-CPP - 用C++和TensorRT实现高效的YOLOv8模型推理
Github开源项目深度学习目标检测TensorRTYOLOv8CPP
本文介绍了如何使用TensorRT的C++ API实现YOLOv8模型的推理,支持目标检测、语义分割和身体姿态估计,包括系统要求、安装步骤、模型转换和项目构建方法。内容中强调了在GPU上运行推理的注意事项和性能基准测试,提供了从PyTorch到ONNX模型转换的详细步骤,是开发计算机视觉应用的参考资料。
QueryInst - 简洁高效的实例分割策略
Github开源项目目标检测实例分割COCO数据集QueryInstmmdetection
QueryInst是一种由动态掩码头并行监督驱动的查询实例分割方法,在准确性和速度上具有显著优势。该项目涵盖对象检测、实例分割和视频实例分割等多种实例级别识别任务,并提供详细的功能介绍和模型训练指导。目前本项目仍在积极开发中,计划扩展至更多实例级别识别任务。
pylabel - 图像数据集转换与标注工具
Github开源项目目标检测Python包PyLabel图像数据集注释转换
PyLabel是一个Python包,可用于为计算机视觉模型(如PyTorch和YOLOv5)准备图像数据集。该工具支持在不同标注格式之间进行转换(如COCO到YOLO),并在Jupyter notebook中提供AI辅助标注功能。PyLabel允许使用单行代码转换标注格式,将注释数据存储在pandas DataFrame中便于分析,按类分层将数据集分为训练集、测试集和验证集,并支持带边界框的图像可视化,从而使图像数据处理更高效便捷。
FCOS - 完全卷积单阶段对象检测技术
Github开源项目卷积神经网络目标检测性能提升FCOSResNet-50
FCOS算法是一种完全卷积的单阶段对象检测方法,通过避免使用锚点框,提高了检测性能和速度。在COCO minival数据集上,FCOS实现了46FPS和40.3的AP评分,并在各种模型和硬件上表现出色,包括ResNe(x)t和MobileNet等。与Faster R-CNN相比,FCOS在ResNet-50平台上表现更佳(38.7对36.8的AP),且训练和推理时间更短。该项目已基于Detectron2实现,并引入了多项优化和改进。
mmyolo - YOLO算法与实时对象识别工具包
Github开源项目目标检测实例分割OpenMMLabMMYOLOYOLO系列算法
MMYOLO是一个基于PyTorch和MMDetection的开源工具包,专注于YOLO系列算法,适用于对象检测和旋转对象检测任务。该项目提供统一的基准测试、详细文档和模块化设计,便于用户构建和扩展模型。支持YOLOv5实例分割和YOLOX-Pose等功能,显著提升训练速度,并在RTMDet模型上实现了先进的性能。
EasyCV - 基于PyTorch的全能计算机视觉工具箱,支持自监督学习和Transformer模型
Github开源项目PyTorch目标检测图像分类自监督学习EasyCV
EasyCV是基于PyTorch的全能计算机视觉工具箱,专注于自监督学习、Transformer模型和主要视觉任务,包括图像分类、度量学习、目标检测和姿态估计。该工具箱提供了最先进的自监督算法如SimCLR、MoCO V2、Swav、DINO和基于掩码图像建模的MAE。它拥有简单综合的推理接口,并支持多种预训练模型。EasyCV支持多GPU和多工作者训练,利用DALI优化数据处理,使用TorchAccelerator和fp16加速训练,并通过PAI-Blade优化推理性能。
DINO - 降噪锚框实现端到端目标检测
Github开源项目深度学习目标检测图像分割COCODINO
DINO采用改良的降噪锚框,提供先进的端到端目标检测功能,并在COCO数据集上实现了优异的性能表现。模型在较小的模型和数据规模下,达到了63.3AP的优秀成绩。DINO具有快速收敛的特点,使用ResNet-50主干网络仅在12个周期内即可达到49.4AP。项目还提供丰富的模型库和详细的性能评估,用户可以通过Google Drive或百度网盘获取模型检查点和训练日志。
Grounded-SAM-2 - 多模态视频目标检测与分割框架
Github开源项目目标检测图像分割SAM 2Grounding DINO视频追踪
Grounded-SAM-2是一个开源项目,结合Grounding DINO和SAM 2技术,实现图像和视频中的目标检测、分割和跟踪。该项目支持自定义视频输入和多种提示类型,适用于广泛的视觉任务。通过简化代码实现和提供详细文档,Grounded-SAM-2提高了易用性。项目展示了开放世界模型在处理复杂视觉任务中的潜力,为研究人员和开发者提供了强大的工具。
gdrnpp_bop2022 - GDRNPP:BOP挑战赛获奖的6D物体姿态估计算法
Github开源项目目标检测GDRNPPBOP Challenge 20226D姿态估计姿态优化
GDRNPP_BOP2022是一个在ECCV'22 BOP挑战赛中获得多项大奖的6D物体姿态估计算法。该项目采用域随机化技术、ConvNext骨干网络和双重掩码头,并结合深度信息进行姿态优化。项目提供完整的训练和测试代码,涵盖目标检测、姿态估计和优化,为计算机视觉研究提供高性能的6D姿态估计工具。
CoDet - 共现引导的开放词汇目标检测方法
Github开源项目深度学习目标检测开放词汇CoDet图像文本对齐
CoDet是一种开放词汇目标检测方法,采用共现引导来对齐区域和词语。该方法利用大规模图像-文本对训练,在LVIS和COCO数据集上表现优异。CoDet兼容现代视觉基础模型,并可与Roboflow集成实现自动图像标注。这一方法为开放词汇目标检测领域提供了新的解决方案。
GenerateU - 开创无预定义类别的目标检测新范式
Github开源项目目标检测计算机视觉预训练CVPRGenerateU
GenerateU项目提出新型开放式目标检测方法,通过生成式区域语言预训练实现无需预定义类别的检测。在LVIS数据集零样本迁移测试中,即使推理时未见类别名称,也达到开放词汇目标检测方法GLIP的性能水平。该项目入选CVPR2024,为通用目标检测领域带来创新突破,特别适用于用户缺乏精确物体类别知识的场景。
UniTR - 多模态变换器网络推动3D感知进展
Github开源项目目标检测3D感知UniTR多模态转换器BEV分割
UniTR是一种新型统一多模态变换器网络,用于3D感知任务。它通过共享权重处理相机和激光雷达等多传感器数据,实现高效多模态融合。在nuScenes数据集上,UniTR在3D目标检测和BEV地图分割任务中均达到最新水平,且降低推理延迟。该研究为提升自动驾驶系统的感知能力提供了新思路。
StrongSORT - 先进多目标跟踪算法全面升级DeepSORT技术
Github开源项目深度学习目标检测多目标跟踪StrongSORTDeepSORT
StrongSORT是对DeepSORT多目标跟踪算法的全面升级。该项目在检测、嵌入和关联等核心环节进行了优化,并引入AFLink和GSI两个轻量级插件算法。经过改进的StrongSORT在MOT17和MOT20数据集上刷新了HOTA和IDF1指标记录,性能显著优于现有方法。项目开源了完整代码实现和使用说明,便于研究人员复现和拓展。
detr - Transformer架构重塑目标检测流程
Github开源项目深度学习目标检测计算机视觉TransformerDETR
DETR项目运用Transformer架构创新性地改进了目标检测方法。该方法将传统的复杂流程转化为直接的集合预测问题,在COCO数据集上达到42 AP的性能表现,同时计算资源消耗减半。DETR结合全局损失函数与编码器-解码器结构,实现了图像的高效并行处理,大幅提升了目标检测的速度和准确性。项目开源了简洁的实现代码和预训练模型,便于研究人员进行深入探索和实际应用。
GLEE - 实现多任务图像和视频处理的通用视觉基础模型
Github开源项目目标检测计算机视觉实例分割GLEE多任务模型
GLEE是一个通用对象基础模型,在超过1000万张来自多个数据集的图像上进行联合训练。该模型能同时处理多种以对象为中心的视觉任务,并在多个基准测试中保持领先性能。GLEE具有出色的通用性和零样本迁移能力,可作为增强其他架构或模型的基础组件。这项研究被CVPR2024接受为亮点论文,研究团队计划开源相关代码和预训练模型。
YOLOv8-multi-task - 轻量级神经网络实现实时多任务目标检测与分割
Github开源项目目标检测自动驾驶语义分割YOLOv8多任务学习
YOLOv8-multi-task项目提出了一种轻量级神经网络模型,可同时执行目标检测、可行驶区域分割和车道线检测等多任务。该模型使用自适应拼接模块和通用分割头设计,在提高性能的同时保持高效率。实验表明,该模型在推理速度和可视化效果方面优于现有方法,适用于需要实时处理的多任务场景。
yolov10 - 实现实时端到端目标检测新突破
人工智能Github开源项目目标检测实时检测YOLOv10端到端
YOLOv10是新一代实时端到端目标检测模型,通过创新的无NMS训练策略和全面的效率-准确度优化设计,在推理速度和计算效率方面实现显著提升。COCO数据集实验结果表明,YOLOv10在不同模型规模下均达到了业界领先的性能和效率水平,为实时目标检测领域带来新的发展方向。
ddddocr - 多功能验证码识别库 支持OCR与目标检测
Github开源项目OCR目标检测DdddOcr验证码识别滑块检测
ddddocr是一个开源的验证码识别库,支持基础OCR、目标检测和滑块识别等多种功能。该项目采用深度学习技术,无需针对特定验证码训练,具有通用性强的特点。ddddocr支持Windows、Linux和MacOS等主流操作系统,提供Python接口便于集成。项目设计注重简化配置和使用流程,为开发者提供了一个高效的验证码识别工具。
T-Rex - 融合文本和视觉提示的通用目标检测模型
Github开源项目目标检测计算机视觉APIT-Rex2视觉提示
T-Rex2是一款融合文本和视觉提示的通用目标检测模型。它突破传统模型局限,具备零样本检测能力,适用于农业、工业和生物医学等领域。该模型支持交互式视觉提示、通用视觉提示和文本提示三种工作流程,满足多样化的目标检测需求。项目提供在线演示和API接口,便于快速体验和集成。
ares - 对抗性机器学习研究与评估的开源Python库
Github开源项目目标检测图像分类ARES 2.0对抗性机器学习鲁棒性训练
ARES 2.0是一个基于PyTorch的对抗性机器学习研究库。它专注于评估图像分类和目标检测模型的鲁棒性,并提供防御机制。该库支持多种攻击方法,具备分布式训练和测试能力,同时提供预训练模型。ARES 2.0为机器学习模型的安全性研究提供了全面的工具集。
Grounded-Segment-Anything - 融合文本引导的开放世界目标检测与分割工具
Github开源项目目标检测图像分割视觉AIGrounded-SAM
Grounded-Segment-Anything项目结合了Grounding DINO和Segment Anything模型的优势,能够根据文本提示检测和分割图像中的任意物体。该工具为开放世界场景中的目标检测和分割任务提供了有效解决方案,支持自动标注、3D人体网格重建和图像编辑等多种应用。通过提高检测和分割精度并提升工作效率,Grounded-Segment-Anything为计算机视觉领域带来了显著进展。
Anti-UAV - 无人机目标检测与追踪开源项目
Github开源项目目标检测计算机视觉数据集Anti-UAV无人机跟踪
Anti-UAV是一个开源项目,致力于在复杂环境中检测和追踪无人机目标。该项目提供新的数据集、评估指标和基线方法,支持RGB和红外视频输入。数据集包含多尺度无人机的高质量视频序列和密集标注。Anti-UAV旨在推动无人机检测追踪技术发展,可应用于区域安全防护等领域。
JSON2YOLO - COCO到YOLO格式转换工具 提升目标检测效率
Github开源项目机器学习目标检测Ultralytics数据集转换COCO2YOLO
JSON2YOLO是一个开源数据集转换工具,专注于将COCO格式JSON数据转换为YOLO格式。这款跨平台工具支持Linux、MacOS和Windows,为机器学习实践者简化了数据处理流程。它不仅优化了数据转换过程,还能提升目标检测模型的训练效率。项目源码可在GitHub获取,用户也可加入Discord社区交流。
YOLOv6 - 高性能目标检测框架支持多场景应用
Github开源项目深度学习模型训练目标检测计算机视觉YOLOv6
YOLOv6是一款高效的目标检测框架,提供从轻量级到大型的多种模型选择。它在速度和精度上取得平衡,支持量化和移动端部署,适用于各种实时检测场景。最新版本还引入了分割功能,扩展了应用范围。YOLOv6不仅适用于工业领域,还可广泛应用于安防、交通等多个领域。
tensorflow-yolov3 - 使用TensorFlow 2.0实现的YOLOv3目标检测教程
Github开源项目目标检测COCOYOLOv3TensorFlow 2.0VOC
本文介绍了使用TensorFlow 2.0实现YOLOv3目标检测的方法,包括快速入门、训练自定义数据集和在VOC数据集上的评估。提供详细的代码示例和步骤说明,帮助开发者轻松训练和应用目标检测模型。文中附有中文博客链接,提供更多学习资源。