watsor

实时视频流物体检测的开源项目

物体检测视频流实时监控 MQTT HomeAssistant Github 开源项目

Watsor是一个开源的视频监控项目,利用深度学习实现实时物体检测。它支持多种硬件加速器,通过MQTT协议报告检测结果,并可通过HTTP广播带检测结果的视频流。适用于CCTV等需要视频流物体检测的场景。主要功能包括智能检测、检测区域限制、硬件加速、MQTT集成和多格式视频编码。

文档

YOLO-World - 下一代实时开放词汇目标检测模型

GithubYOLO-World开放词汇开源项目目标检测零样本学习预训练模型

YOLO-World是一款创新的实时开放词汇目标检测模型。经过大规模数据集预训练,它展现出卓越的开放词汇检测和定位能力。采用'先提示后检测'范式,YOLO-World通过重参数化技术实现高效的自定义词汇推理。该模型支持零样本目标检测、分割等多种任务,并开源了在线演示、预训练权重和微调代码,为计算机视觉领域提供了实用的研究与应用工具。

Deep-Learning-for-Tracking-and-Detection - 使用深度学习进行对象检测和跟踪的论文与资源合集

GithubRCNNYOLOdeep learningmulti object trackingobject detection开源项目

本项目汇集了有关深度学习在对象检测和跟踪领域的论文、数据集、代码及各种资源。内容涵盖静态检测、视频检测、多对象跟踪和单对象跟踪等主题，并提供了多种经典模型如RCNN、YOLO、SSD的实现和改进方案。此外，项目还涵盖了图像和视频分割、光流、运动预测等任务的资源，为研究人员和开发者提供了详尽的参考资料。

SportsLabKit - 专业体育分析工具包实现比赛视频数据化

GithubSportsLabKit体育分析开源项目数据处理目标跟踪计算机视觉

SportsLabKit是一个开源的体育分析工具包,可将比赛视频转换为可分析的数据。目前主要用于足球领域,计划扩展到其他运动。核心功能包括高性能追踪、灵活架构、2D场地校准和数据封装,便于进行运动员追踪和数据分析。该项目集成了SORT、DeepSORT、ByteTrack等多种追踪算法,支持YOLOv8等检测模型,为研究人员和开发者提供了灵活的开发环境。SportsLabKit正在持续开发中,旨在提供更多计算机视觉工具和统一的数据表示方法。

Holocron - 深度学习计算机视觉技巧的高效实现与应用

GithubHolocronPyTorch开源项目模型深度学习计算机视觉

Holocron项目提供深度学习计算机视觉最新技术的高效实现，增强开发者灵活性并与PyTorch生态系统兼容。支持多种图像分类、目标检测和语义分割模型，包括Res2Net、Darknet和YOLO等。项目附带详细文档、示例代码和实时演示，助力开发者快速上手并部署高性能视觉解决方案，并提供多种优化算法和工具提升训练效率与准确性。适用于追求前沿性能和灵活开发环境的研究人员和工程师。

Smart-Home-Security-Guardian-Bot - 多功能智能家居安全守护机器人集成无线充电和实时监控

DIY项目GithubHABot安全机器人开源项目智能家居物联网

Smart-Home-Security-Guardian-Bot是一个开源的智能家居安全项目。该设备集成Arduino Pro Mini和ESP32-CAM，体积小巧但功能丰富。支持无线充电，具备运动感应、光线检测、实时视频流等功能。通过MQTT协议控制，可灵活配置以满足不同家庭安全需求。配备多种传感器和执行器，提供语音通知和LED指示，为用户提供全方位的智能家居安全解决方案。

psi - 开源框架助力多模态集成AI系统开发

GithubPlatform for Situated Intelligence人工智能多模态系统开源框架开源项目流数据处理

Platform for Situated Intelligence (\psi)是一个开源框架，专注于多模态集成AI系统的开发和研究。它提供高性能基础设施处理多模态时序流数据，并配备数据可视化、标注和处理工具。\psi包含丰富的组件生态系统，支持各类传感器、处理技术和执行器。该框架适用于开发社交机器人、混合现实系统等应用，尤其擅长处理流式传感器数据、整合多种AI技术，并满足低延迟要求。

SlowFast - 开源视频理解框架提供多种先进模型架构

GithubPySlowFast开源项目深度学习神经网络模型视频理解计算机视觉

PySlowFast是FAIR开发的开源视频理解代码库，提供高效训练的先进视频分类模型。支持SlowFast、Non-local Neural Networks、X3D和Multiscale Vision Transformers等多种架构。该框架便于快速实现和评估视频研究创新，涵盖分类、检测等任务。PySlowFast兼具高性能和轻量级特点，适用于广泛的视频理解研究。

awesome-tiny-object-detection - 微小目标检测研究前沿技术与资源汇总

Github人工智能小目标检测开源项目深度学习目标检测计算机视觉

该项目汇集微小目标检测领域的前沿研究成果和资源。内容涵盖普通微小目标、微小人脸和微小行人检测等多个子领域,同时提供相关数据集、综述文章和挑战赛信息。项目为研究人员和从业者提供了解该领域最新进展的重要参考。

videoWater - AI驱动的视频剪辑软件显著提高创作效率

AI快剪Github多功能开源项目效率提升自动化视频剪辑

AI快剪是一款多功能视频剪辑软件，整合了剪辑、合成、去重、特效、配音、字幕和水印等功能。适用于视频搬运、混剪和电影解说等领域，操作简便，新手易上手。支持Windows和Mac平台，界面设计直观，提供多样模板和设计工具，有效提升视频创作效率。软件功能不断更新，为创作者提供全面的视频制作解决方案。

YOLOv6 - 高性能目标检测框架支持多场景应用

GithubYOLOv6开源项目模型训练深度学习目标检测计算机视觉

YOLOv6是一款高效的目标检测框架，提供从轻量级到大型的多种模型选择。它在速度和精度上取得平衡，支持量化和移动端部署，适用于各种实时检测场景。最新版本还引入了分割功能，扩展了应用范围。YOLOv6不仅适用于工业领域，还可广泛应用于安防、交通等多个领域。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com