mmcv

OpenMMLab开源计算机视觉基础库

MMCV OpenMMLab 计算机视觉深度学习 PyTorch Github 开源项目

MMCV是一个开源的计算机视觉基础库，提供图像和视频处理、数据转换、CNN架构等功能。支持多平台，包括Linux、Windows和macOS。库中包含高质量的CPU和CUDA操作实现，并提供完整版和精简版两种安装选项。MMCV需要Python 3.7+环境，与PyTorch深度学习框架兼容。

opencv-course - OpenCV与Python实现计算机视觉全面指南

GithubOpenCVPython人脸识别图像处理开源项目计算机视觉

本项目提供了一个4小时的Python OpenCV课程，内容涵盖从基础安装到高级应用。课程主题包括图像和视频处理基础、颜色空间转换、边缘检测、人脸检测与识别等。课程还涉及Caer库用于高性能AI研究，以及BITWISE操作、直方图计算和阈值处理等高级主题。最后，学员将完成一个使用深度学习对《辛普森一家》角色进行分类的项目。这个全面的课程旨在帮助Python开发者迅速掌握OpenCV和计算机视觉技能，并提供详细的时间戳，方便学习者快速定位所需内容。

VideoProcessingFramework - GPU加速视频处理框架提供编解码和格式转换功能

GPU加速GithubNVIDIAPyNvVideoCodecVideoProcessingFramework开源项目视频处理

VideoProcessingFramework是一个开源的视频处理框架，由C++库和Python绑定组成。它利用GPU硬件加速实现高效的视频解码、编码、转码以及色彩空间和像素格式转换。该框架支持将GPU内存中的视频帧直接导出为PyTorch张量，避免了额外的数据传输。适用于Linux和Windows平台，依赖NVIDIA驱动、CUDA和FFMPEG。目前正逐步被功能类似但API更简洁的PyNvVideoCodec库取代。

pytorch_memlab - PyTorch CUDA内存分析与优化工具

CUDAGithubPyTorchpytorch_memlab内存管理开源项目性能分析

pytorch_memlab是一个针对PyTorch的CUDA内存管理工具,提供内存分析器和内存报告器等功能。它可以帮助开发者诊断内存溢出问题,理解底层内存机制。该工具支持逐行内存分析、张量内存使用报告,以及将CUDA张量临时移至CPU内存等特性。pytorch_memlab能够协助开发者优化内存使用,提升PyTorch项目性能。

mllm - 轻量级移动设备多模态大语言模型推理引擎

AI推理引擎Githubmultimodal LLM开源项目移动设备边缘计算量化

mllm是一款针对移动和边缘设备优化的多模态大语言模型推理引擎。该引擎采用纯C/C++实现，无外部依赖，支持ARM NEON和x86 AVX2指令集，并提供4位和6位整数量化。开发者可利用mllm构建智能个人助理、基于文本的图像搜索、屏幕视觉问答等移动应用，实现本地推理而无需上传敏感数据。

learnopencv - 从OpenCV编程到实践深度学习技巧

AIGithubLearnOpenCV开源项目教程深度学习计算机视觉

LearnOpenCV.com 博客提供了众多关于计算机视觉、深度学习及人工智能的最新技术和代码实例。该平台聚焦于为AI学习者及技术实践者提供丰富的资源和项目实践，帮助用户全面掌握并应用AI技术。

SmartOpenCV - Android平台的增强型计算机视觉库

GithubOpenCVSmartOpenCV图像处理开源项目端侧智能计算机视觉

SmartOpenCV是一个用于Android平台的增强型OpenCV库，解决了官方SDK在图像预览中的问题。无需修改SDK源码，只需替换xml标签，即可自动适应摄像头参数、横竖屏切换及预览帧大小。该库支持USB摄像头，提供友好的API接口，方便开发者灵活控制预览显示。SmartOpenCV与官方SDK解耦，确保项目能够轻松升级至最新版本。

MIMDet - 掩码图像建模应用于目标检测的开源项目

GithubMIMDet卷积神经网络实例分割开源项目物体检测视觉变换器

MIMDet是一个利用掩码图像建模技术的开源项目，能够提升预训练的Vanilla Vision Transformer在目标检测中的表现。此框架采用混合架构，用随机初始化的卷积体系取代预训练的大核Patchify体系，实现多尺度表示无需上采样。在COCO数据集上的表现亮眼，使用ViT-Base和Mask R-CNN模型时，分别达到51.7的框AP和46.2的掩码AP；使用ViT-L模型时，成绩分别是54.3的框AP和48.2的掩码AP。

neoml - 跨平台多语言支持的端到端机器学习框架

ABBYYGithubNeoMLONNX开源项目机器学习框架神经网络

NeoML是一个端到端机器学习框架，可用于构建、训练和部署模型，适用于计算机视觉和自然语言处理任务，如图像预处理、分类、OCR和数据提取。支持100多种神经网络层类型和20多种传统机器学习算法，兼容CPU和GPU，并支持ONNX格式。适用的编程语言包括Python、C++、Java和Objective-C，且可运行于Windows、Linux、macOS、iOS和Android平台。

CCTag - 检测和定位同心圆标记的高效工具库

CCTagCUDAGPUGithub开源项目检测计算机视觉

CCTag库是一款用于检测和定位同心圆标记的高效工具，兼容CPU和GPU实现。基于CVPR 2016会议论文，该库在严苛条件下表现出色。支持CUDA 8.0及更新版本，建议使用平面支撑材料以保证检测准确性。提供详细文档和持续集成支持，适用于Windows和Linux系统。

llm.c - 纯C和CUDA实现的高效轻量级语言模型训练框架

CUDAC语言GPU训练GithubLLM开源项目

llm.c是一个使用纯C和CUDA实现的高效轻量级语言模型训练框架。该项目不依赖PyTorch或cPython等大型框架，通过简洁代码实现GPT-2和GPT-3系列模型的预训练。llm.c支持单GPU、多GPU和多节点训练，提供详细教程和实验示例。项目在保持代码可读性的同时追求高性能，适用于教育和实际应用。此外，llm.c支持多种硬件平台，并有多个编程语言的移植版本。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com