Project Icon

watsor

实时视频流物体检测的开源项目

Watsor是一个开源的视频监控项目,利用深度学习实现实时物体检测。它支持多种硬件加速器,通过MQTT协议报告检测结果,并可通过HTTP广播带检测结果的视频流。适用于CCTV等需要视频流物体检测的场景。主要功能包括智能检测、检测区域限制、硬件加速、MQTT集成和多格式视频编码。

Open-Sora-Plan - 视频生成与分析技术
3D注意力模型AI视频生成CausalVideoVAEGithubOpen-Sora Plan开源项目昇腾AI计算系统热门
Open-Sora-Plan 是由北大-兔展AIGC联合实验室发起的开源项目,旨在复刻并优化Sora模型,采用华为昇腾AI计算系统进行训练和推理。该项目通过3D全注意力架构,提升视频质量与处理速度,还支持视频压缩和文本到视频的生成。项目包含丰富的资源和版本,持续更新,欢迎社区贡献和Pull request。
FCOS - 完全卷积单阶段对象检测技术
FCOSGithubResNet-50卷积神经网络开源项目性能提升目标检测
FCOS算法是一种完全卷积的单阶段对象检测方法,通过避免使用锚点框,提高了检测性能和速度。在COCO minival数据集上,FCOS实现了46FPS和40.3的AP评分,并在各种模型和硬件上表现出色,包括ResNe(x)t和MobileNet等。与Faster R-CNN相比,FCOS在ResNet-50平台上表现更佳(38.7对36.8的AP),且训练和推理时间更短。该项目已基于Detectron2实现,并引入了多项优化和改进。
yolov10n - YOLOv10n:实时对象检测的创新技术
COCO数据集GithubHuggingfacePyTorch模型YOLOv10实时物体检测开源项目模型计算机视觉
YOLOv10n项目展示了对象检测的实时进展,结合计算机视觉与对象识别算法。其基于PyTorch的实现并支持COCO数据集用于训练与推理,保证了性能和应用的广泛性。简单的安装和模块调用,提供了快速的目标物体检测及识别功能,支持优化模型上传至相关平台,提升模型精度与效率。
yolort - 简易高效的YOLOv5目标检测工具
GithubONNXTensorRTYOLOv5yolort对象检测开源项目
yolort项目致力于简化和优化YOLOv5的训练与推理。采用动态形状机制,结合预处理和后处理,支持LibTorch、ONNX Runtime、TVM、TensorRT等多种后端的轻松部署。项目遵循简洁设计理念,安装与使用便捷,支持通过PyPI和源码安装。提供丰富的推理接口示例和详细文档,使目标检测更为轻松,适用于广泛的应用场景。
boxmot - BoxMOT:支持分割、目标检测和姿态估计的多对象跟踪模块
BoxMOTGithubYolov8多目标跟踪姿态估计开源项目目标检测
BoxMOT项目提供可插拔的多对象跟踪模块,支持分割、目标检测和姿态估计。提供适用于各种硬件配置的跟踪方法,包括CPU和GPU。兼容多种ReID模型及Yolov8、Yolo-NAS、YOLOX等目标检测模型,并通过快速实验脚本提高实验效率。
deepstream_python_apps - 为NVIDIA DeepStream SDK提供Python绑定和丰富的示例应用
AI应用DeepStream SDKGithubNVIDIAPython绑定开源项目视频分析
这个开源项目为NVIDIA DeepStream SDK提供Python绑定和丰富的示例应用。它支持构建视频分析流水线,包括对象检测、跟踪和分割等功能。开发者可通过Python接口访问DeepStream的元数据结构,实现高效视频处理。项目提供了从基础到高级的多种示例应用,涵盖不同场景,为开发人员提供了实用的参考资源。
yolov10m - 高效的实时目标检测系统
COCO数据集GithubHuggingfacePyTorchYOLOv10开源项目模型目标检测计算机视觉
YOLOv10m是一个开源的目标检测项目,利用PyTorch模型和COCO数据集实现高效的计算机视觉解决方案。用户可以方便地进行训练、验证,并将模型上传至库,非常适合多种技术水平的使用者进行实时目标检测应用。
ai-video-search-engine - 智能视频内容检索与分析系统
AI视频搜索引擎GithubJigsawStack向量搜索开源项目视频内容索引视频转录
AI Video Search Engine项目是一种创新型视频搜索引擎,采用先进AI技术实现视频内容的深度索引和智能检索。该系统能够精确定位视频中的特定信息,提供上下文相关的搜索结果,并具备视频摘要生成和智能对话功能。项目整合了Supabase、Hasura和JigsawStack等技术,为视频内容检索提供高效、精准的解决方案,适用于教育、研究和信息获取等领域。
multispectral-object-detection - 多光谱图像融合的高效目标检测方法
GithubTransformerYOLOv5多光谱目标检测开源项目计算机视觉跨模态融合
该项目提出了Cross-Modality Fusion Transformer (CFT)多光谱目标检测方法,利用Transformer架构融合RGB和热红外图像信息。CFT在FLIR、LLVIP等数据集上取得了优秀的检测结果,尤其在夜间场景表现突出。这为多光谱目标检测提供了一种新的解决方案。
a9-v720 - 智能家庭摄像头开源控制方案
A9 V720GithubIP摄像头WIFI配置固件更新开源项目视频流
本项目为A9 V720 Naxclow摄像头开发了开源控制方案,实现录像列表查看、文件下载、实时视频流观看和Wi-Fi网络连接等功能。方案还包含假服务器功能,可拦截摄像头通信。支持红外夜视和图像翻转等操作,并提供详细使用说明和硬件信息。该方案为用户提供了更灵活的智能家庭摄像头控制和访问选择。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号