Project Icon

frigate

本地化AI对象检测与IP摄像头无缝集成解决方案

Frigate是一款为Home Assistant设计的本地NVR,利用OpenCV和TensorFlow实现实时对象检测。支持Google Coral加速器,大幅提升性能。通过自定义组件紧密集成Home Assistant,优化资源使用和性能。采用低开销运动检测与独立进程的对象检测,支持MQTT通讯,基于对象检测的视频记录,24/7录像及RTSP重传,提供低延迟实时视图。

phrame - 通过监听周围对话生成独特的视觉艺术作品的AI应用
DockerGithubOpenAIPhrame开源项目艺术生成语音识别
Phrame通过监听周围对话,生成独特的视觉艺术作品。它的功能包括从对话生成AI艺术品、实时更新、远程控制和支持多种生成AI图像服务。用户界面友好,适用于桌面和移动设备,并通过WebSockets实现实时更新和远程控制。用户能通过语音命令管理画廊,浏览、收藏和删除图像,并访问和管理日志。隐私保护严格,所有转录内容仅在本地设备处理和保存。
face-api - AI人脸检测与识别、年龄性别情感预测,适用于浏览器和NodeJS
FaceAPIGithubNodeJSTensorFlow/JS人脸识别开源项目浏览器
该项目基于TensorFlow/JS,提供高级人脸检测、旋转跟踪、识别人脸、预测年龄、性别和情感功能,适用于浏览器和NodeJS环境。项目提供在线演示、详细文档和教程,以及多种使用场景的示例代码,帮助开发者快速上手和集成。无论是静态图片还是实时摄像头数据处理,均能提供精准高效的结果。
CompreFace - 功能全面的开源人脸识别系统
APICompreFaceDockerGithub人脸识别开源开源项目
CompreFace是一个功能丰富的开源人脸识别系统,提供REST API接口,支持多种人脸相关服务。该系统基于Docker构建,可在CPU或GPU上运行,适用于本地服务器或云端部署。CompreFace采用FaceNet和InsightFace等先进技术,无需专业知识即可轻松集成和使用。系统还包含角色管理功能,方便控制访问权限。
multispectral-object-detection - 多光谱图像融合的高效目标检测方法
GithubTransformerYOLOv5多光谱目标检测开源项目计算机视觉跨模态融合
该项目提出了Cross-Modality Fusion Transformer (CFT)多光谱目标检测方法,利用Transformer架构融合RGB和热红外图像信息。CFT在FLIR、LLVIP等数据集上取得了优秀的检测结果,尤其在夜间场景表现突出。这为多光谱目标检测提供了一种新的解决方案。
darkflow - 实时物体检测与分类工具,支持多种YOLO模型
GithubYOLOdarkflowobject detectiontensorflow开源项目训练模型
Darkflow是一个用于实时物体检测和分类的开源项目,兼容Python3、Tensorflow、Numpy和OpenCV。用户可以通过pip安装、构建Cython扩展或使用自定义标签进行训练和推理。项目还提供Android演示和支持保存加载protobuf文件,适合跨平台应用。
FCOS - 完全卷积单阶段对象检测技术
FCOSGithubResNet-50卷积神经网络开源项目性能提升目标检测
FCOS算法是一种完全卷积的单阶段对象检测方法,通过避免使用锚点框,提高了检测性能和速度。在COCO minival数据集上,FCOS实现了46FPS和40.3的AP评分,并在各种模型和硬件上表现出色,包括ResNe(x)t和MobileNet等。与Faster R-CNN相比,FCOS在ResNet-50平台上表现更佳(38.7对36.8的AP),且训练和推理时间更短。该项目已基于Detectron2实现,并引入了多项优化和改进。
home-gallery - AI驱动的自托管开源相册,支持智能图像和人脸识别
AI图像识别GithubHomeGallery开源开源项目网络相册自托管
HomeGallery是一款自托管的开源网络相册,专为个人照片和视频浏览设计。它集成了AI驱动的图像和人脸识别技术,支持标签管理和移动端访问。该项目特点包括快速响应、离线媒体支持和强大的查询功能。其他亮点有相似图像搜索、地理位置反查和PWA支持。HomeGallery注重用户隐私,适用于Linux、Mac和Windows等多个平台,是计算机爱好者的理想选择。
DVR-Scan - 开源视频运动事件检测工具
DVR-ScanGithub动作检测命令行工具开源软件开源项目视频分析
DVR-Scan是一款开源的视频分析工具,专门用于检测视频文件中的运动事件。它可识别视频中的运动区域,并将每个事件保存为独立视频片段。该工具支持多平台,包括Windows、Linux和Mac。DVR-Scan提供区域编辑器功能,允许用户选择特定扫描区域,还可绘制运动边界框。它通过pip简单安装,为安全摄像头录像分析提供了高效解决方案。
Fast-BEV - 新一代鸟瞰视角感知系统
Fast-BEVGithub开源项目深度学习自动驾驶计算机视觉鸟瞰图感知
Fast-BEV是一种先进的鸟瞰视角感知系统,专注于3D目标检测和BEV语义分割。该项目针对自动驾驶等应用场景进行了优化,提供多种模型配置和CUDA、TensorRT加速支持。Fast-BEV不仅在性能和速度方面表现卓越,还提供了完整的安装指南、数据准备流程和训练方法,为研究人员和开发者提供了强大的工具。作为领先的感知算法和计算机视觉解决方案,Fast-BEV为鸟瞰视角感知任务设立了新的标准。
jetson-inference - 深度学习部署与实时视觉识别
GithubNVIDIA JetsonPyTorchTensorRT实时视觉开源项目深度学习
NVIDIA Jetson设备上的深度学习推理和实时视觉处理库。使用TensorRT优化GPU网络运行,支持C++和Python, 以及PyTorch模型训练。功能包括图像分类、物体检测、语义分割等,适用于多种应用场景,如实时摄像头流和WebRTC网络应用。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号