#图像处理

mediapy - 用于Jupyter的图像和视频处理库
mediapy图像处理视频处理JupyterPythonGithub开源项目
mediapy是一个为IPython和Jupyter notebook环境开发的图像和视频处理库。它提供简洁的API用于读取、写入和显示多种格式的媒体文件。该库支持基本的图像处理和视频帧操作,并通过集成ffmpeg实现高效的视频编解码。mediapy适用于数据科学和机器学习中的媒体数据处理与可视化。
opencv-course - OpenCV与Python实现计算机视觉全面指南
OpenCVPython计算机视觉图像处理人脸识别Github开源项目
本项目提供了一个4小时的Python OpenCV课程,内容涵盖从基础安装到高级应用。课程主题包括图像和视频处理基础、颜色空间转换、边缘检测、人脸检测与识别等。课程还涉及Caer库用于高性能AI研究,以及BITWISE操作、直方图计算和阈值处理等高级主题。最后,学员将完成一个使用深度学习对《辛普森一家》角色进行分类的项目。这个全面的课程旨在帮助Python开发者迅速掌握OpenCV和计算机视觉技能,并提供详细的时间戳,方便学习者快速定位所需内容。
Harbeth - Swift图像处理库 支持GPU加速和实时相机滤镜
图像处理MetalGPU加速滤镜SwiftGithub开源项目
Harbeth是基于Metal的Swift图像处理库,提供GPU加速和实时相机捕捉功能。库内置100多种滤镜,涵盖混合、模糊、像素处理等模块。支持iOS和macOS平台,兼容UIKit/AppKit及SwiftUI。可为图像和视频添加滤镜效果,支持自定义LUT滤镜。此外还具备实时相机捕捉和流畅视频播放能力。
ffn - 专为大脑组织体积EM数据集实例分割的神经网络
Flood-Filling Networks实例分割神经网络TensorFlow图像处理Github开源项目
Flood-Filling Networks (FFNs) 是一种专为复杂大型形状实例分割设计的神经网络模型,特别适用于大脑组织的体积电子显微镜数据集。FFN模型在处理大规模、高分辨率的神经影像数据时表现出色,能够准确识别和分割复杂的神经元结构。该开源项目在FIB-25数据集上展现了优秀性能,为神经科学研究提供了强大的分割工具,适合需要高精度神经元分割的研究人员使用。
GIBBON - MATLAB生物工程建模与有限元分析开源工具箱
GIBBONMATLAB工具箱生物工程有限元分析图像处理Github开源项目
GIBBON是开源MATLAB工具箱,集成图像处理、几何建模和有限元分析功能。支持高级分割、CAD设计、网格生成和晶格结构设计。与TetGen和FEBio等开源软件兼容,为生物工程提供灵活建模环境。适用于复杂几何、多物理场仿真和逆向工程,支持反向有限元分析。
eynollah - 结合深度学习和启发式算法的文档布局分析工具
Eynollah文档布局分析深度学习启发式算法图像处理Github开源项目
Eynollah是一款文档布局分析工具,支持多达10种分割类别,包括文本区域、页眉和图像等。它具有图像优化、文本行分割和阅读顺序检测等功能,结合了深度学习和启发式算法。Eynollah输出符合PAGE-XML标准,可作为OCR-D处理器使用。该项目主要面向历史文献分析,适用于需要精确文档布局分析的研究和应用场景。
Simd - 开源图像处理与机器学习库 支持多平台SIMD指令优化
Simd Library图像处理机器学习SIMD优化跨平台Github开源项目
Simd是一个开源的图像处理和机器学习库,专为C和C++开发者设计。它提供像素转换、图像缩放、滤波、统计分析、运动检测、对象识别和神经网络等高性能算法。该库针对x86/x64的SSE、AVX、AVX-512、AMX和ARM的NEON等SIMD指令集进行了优化。Simd提供C API和C++接口,支持动态和静态链接,兼容32位和64位的Windows及Linux平台。
colour-checker-detection - Python库实现色卡检测算法及相关工具
色彩检查器检测Python包开源软件图像处理机器学习Github开源项目
这是一个开源Python库,专注于实现色卡检测算法和相关工具。库支持分割和基于YOLOv8的机器学习推理两种检测方法,主要用于ColorChecker Classic 24色卡的识别。项目提供丰富示例和API文档,可应用于图像处理和颜色校正等领域。采用BSD-3-Clause许可证发布,适用于研究和商业用途。
caire - 内容感知的智能图像缩放库
Caire图像处理内容感知缩放算法Go语言Github开源项目
Caire是一个基于缝合线裁剪算法的开源图像缩放库。它能智能识别和保留图像中的重要内容,同时支持人脸检测、保护蒙版等功能。Caire提供命令行界面,可批量处理图像并输出多种格式。该库适用于图像缩小和放大,是一个功能全面的图像处理工具。
OmniFusion - 整合多模态数据的先进人工智能系统
OmniFusion多模态AI模型图像处理自然语言处理深度学习Github开源项目
OmniFusion是一个整合多模态数据的人工智能系统,基于Mistral-7B核心和CLIP-ViT-L视觉编码器。通过创新的适配器机制,该系统能够处理图像等多种数据形式,在图像描述和视觉问答等任务中展现出优秀性能。OmniFusion由AIRI研究所FusionBrain团队与Sber AI合作开发,目前主要处理图像数据,未来计划扩展到音频等更多模态。
Blind-Motion-Deblurring-Survey - 深度学习运动去模糊技术研究综述及发展趋势
深度学习运动去模糊图像处理人工智能计算机视觉Github开源项目
本项目全面回顾了深度学习在运动去模糊领域的研究进展。通过系统分析150余篇相关论文,总结了30多种盲运动去模糊算法。对当前先进方法在4个数据集上进行了对比实验,揭示了现有技术的不足,并探讨了未来发展方向。项目还收录了CVPR 2024最新去模糊研究成果,为该领域研究人员提供了重要参考。
opencvsharp - 多平台.NET OpenCV封装库 实现计算机视觉
OpenCvSharp计算机视觉图像处理.NET跨平台Github开源项目
OpenCvSharp是一个开源的.NET OpenCV封装库,支持Windows、UWP和Ubuntu等多个平台。它模仿OpenCV C/C++ API风格,提供自动资源管理和格式转换功能。开发者可通过NuGet包轻松使用该库实现图像处理和计算机视觉应用。OpenCvSharp为.NET生态系统带来了OpenCV的强大功能,促进了跨平台计算机视觉开发。
Handright - Python实现的中文手写模拟库 实现自然逼真效果
HandrightPython库中文手写模拟图像处理字体扰动Github开源项目
Handright是一个Python库,用于模拟中文手写。该库通过对字形和笔画进行随机扰动,生成自然的手写效果。Handright支持自定义背景、字体和文本,提供简单的接口。它适用于需要模拟手写的各种场景,如创建手写风格的文档或图像。
Face-X - 全面的开源人脸识别与处理平台
Face-X人脸识别开源项目计算机视觉图像处理Github
Face-X是一个综合性的开源人脸识别和处理平台,集成了多种先进算法。该项目提供人脸滤镜、图像处理、口罩检测等功能,还支持人脸卡通化、表情动画等创新应用。Face-X为开发者提供了丰富的人脸相关任务解决方案,并鼓励开源社区参与贡献。
ITK - N维科学图像处理与分析的开源跨平台工具包
ITK图像处理开源软件医学影像NumFOCUSGithub开源项目
ITK是专门用于N维科学图像处理、分割和配准的开源跨平台工具包。它为医学图像处理、计算机视觉等领域提供了强大的分析功能。ITK同时支持C++和Python编程,拥有丰富的文档和示例资源,适用于教学、科研及商业应用。该项目获得NumFOCUS赞助,采用Apache 2.0开源许可证发布。
sharp - 快速高效的Node.js图像处理库 支持多种Web图像格式
sharp图像处理Node.js模块libvips性能优化Github开源项目
sharp是一个基于Node-API的高效图像处理库,专注于Web图像优化。它可将常见格式的大型图像转换为适合Web使用的JPEG、PNG、WebP、GIF和AVIF格式,并支持调整尺寸。通过集成libvips,sharp在处理速度上优于ImageMagick和GraphicsMagick,同时确保色彩空间、ICC配置文件和透明通道的准确处理。除调整大小外,sharp还提供旋转、提取、合成和伽马校正等功能,是Web开发中处理图像的有力工具。
imgproxy - 高效安全的开源图像处理服务器
imgproxy图像处理安全性性能优化服务器Github开源项目
imgproxy是一个开源的图像处理服务器,专注于图像的调整、处理和转换。它以安全性、速度和简洁性为核心,支持实时调整图像尺寸并能处理大量请求。作为Web应用中图像处理代码的替代方案,imgproxy尤其适合处理远程图像。该项目采用libvips库提高处理效率,并实施多重安全措施以防范潜在风险。
imaginary - Go语言开发的高性能图像处理HTTP微服务
图像处理HTTP微服务Dockerlibvips性能优化Github开源项目
imaginary是一个基于Go语言的高性能图像处理HTTP微服务。它支持调整大小、裁剪、旋转等多种图像操作,并提供简洁的HTTP API。该服务集成了API授权、URL签名和流量控制等安全特性,可从多种来源读取图像。借助libvips库,imaginary实现了低内存占用和高性能,适合大规模图像处理场景。
images - 开源可部署的高性能图像处理服务
wsrv.nl图像处理libvipsnginxDockerGithub开源项目
weserv/images是一个开源的图像处理服务,基于libvips和nginx技术构建。该项目提供高效的图像处理功能,支持自有服务器和Docker部署。它集成了Cloudflare CDN缓存、Redis速率限制和OpenDNS过滤等功能,并提供完整的API文档。作为一个灵活可扩展的解决方案,weserv/images适用于不同规模的图像处理需求。
YoloDotNet - 基于C#的Yolov8和Yolov10实时目标检测库
YoloDotNet对象检测深度学习图像处理性能优化Github开源项目
YoloDotNet是基于.NET 8的C#库,支持Yolov8和Yolov10模型进行实时目标检测。该库集成ML.NET和ONNX运行时,并支持CUDA GPU加速,提供分类、目标检测、OBB检测、分割和姿态估计等功能。YoloDotNet在CPU和GPU上均可高效运行,适用于各种计算机视觉应用场景。
instruction-tuned-sd - 基于指令微调的Stable Diffusion图像编辑模型
Stable Diffusion指令微调图像处理卡通化低级图像处理Github开源项目
该项目探索了一种指令微调Stable Diffusion模型的方法,使其能够根据输入图像和特定指令进行图像编辑。结合FLAN和InstructPix2Pix的思想,项目通过构建指令数据集和训练,提升了模型执行图像转换任务的能力。研究涵盖卡通化和低级图像处理,并开源了相关代码、模型和数据集。
android-gif-drawable - Android GIF动画渲染和控制库
AndroidGIFDrawable动画图像处理Github开源项目
android-gif-drawable是一个用于Android应用中渲染和控制GIF动画的开源库。它通过JNI调用GIFLib实现高效渲染,提供自定义View和Drawable组件,支持多种GIF加载方式。库功能包括动画控制、元数据获取等,适用于API 17+设备。该项目为开发者提供了灵活高效的GIF动画处理方案。
thumbor - AI驱动的智能图像处理服务 实时裁剪调整和优化
thumbor图像处理AI驱动开源项目HTTP服务器Github
thumbor是一款开源的智能图像处理服务,支持实时裁剪、调整大小、应用滤镜和优化图像。它集成AI技术实现智能检测,兼容多种存储方案和编程语言。凭借高性能和可扩展性,thumbor已被全球数百家公司采用,是开发高性能网站的有力工具。
ImageSharp - 开源跨平台2D图形库 高效图像处理解决方案
ImageSharp图像处理跨平台2D图形库.NETGithub开源项目
ImageSharp是一款功能全面的开源跨平台2D图形库,为图像处理提供简洁强大的API。其灵活可扩展的设计适用于设备、云和IoT等多种场景。基于.NET 8构建,ImageSharp提供详细文档和示例,便于开发者快速上手和扩展功能。作为一个开源项目,它不仅支持常见的图像操作,还允许自定义扩展,在各种应用场景中表现出色。
multi-delogo - 视频水印去除工具 支持多位置标记和自动检测
multi-delogo视频去水印开源软件图像处理自动识别Github开源项目
multi-delogo是一个开源的视频水印去除应用,具备多位置标记和自动检测功能。该工具可去除视频中的logo和水印,即使位置变化也能处理。它对文字水印的识别和去除效果较好。multi-delogo支持Windows、Linux和Mac OS平台,可通过不同方式安装使用。项目托管在GitHub上,欢迎用户反馈和贡献。
Automatic-leaf-infection-identifier - 自动植物叶片病害识别系统
植物病害检测图像处理机器学习叶片分析农业技术Github开源项目
该项目是一个基于机器视觉和机器学习的自动叶片病害识别系统。系统使用图像处理算法对叶片图像进行分割和特征提取,通过SVM分类器将叶片分类为健康或感染。它能够早期检测植物病害,有助于及时采取防控措施。项目包含完整代码实现,提供数据集创建、模型训练和图形界面等功能。
Image_Processing - 全面的图像处理实践指南与代码实现
图像处理数字图像处理插值图像变换边缘检测Github开源项目
Image_Processing项目提供了从基础到高级的图像处理实践指南。涵盖图像插值、几何变换、边缘检测等多个主题,通过丰富的代码示例帮助开发者掌握各种图像处理技术。该项目是入门图像处理的理想学习资源,适合希望系统学习图像处理的开发人员。
segformer-b4-finetuned-ade-512-512 - 512x512分辨率下SegFormer的高效Transformer语义分割实现
图像处理ADE20kHuggingfaceSegFormerGithub开源项目语义分割Transformer模型
本项目展示了SegFormer模型如何应用在ADE20k数据集上,以512x512分辨率进行微调。该模型采用分层Transformer编码器与轻量级全MLP解码头的设计,并在ImageNet-1k预训练后用于语义分割。其适用于多个基准测试如ADE20K和Cityscapes,为视觉分割提供强大而灵活的工具。用户可以使用该模型进行图像的语义分割,或选择适合特定任务的微调版本。
metadata-extractor - 多媒体文件元数据提取Java库
metadata-extractorJava库元数据读取图像处理多媒体文件Github开源项目
metadata-extractor是一个Java库,用于从各种媒体文件中读取元数据。支持Exif、IPTC、XMP等格式,可处理JPEG、TIFF、WebP等文件类型。该库能解码多个相机制造商的专有makernote数据,为开发者提供元数据提取功能。
zero123plus-v1.1 - 高效的图像转换与创意生成
pipelineDiffusersHuggingface图像处理torch开源项目模型Githubcuda
该项目利用最新的Diffusers 0.20.2和Torch 2库,实现高效的图像生成。借助Euler Ancestral Discrete Scheduler,提升图像转换的精度。提供参数调节和CUDA优化,提高运行效率,适合需要细致控制图像生成的创意设计应用。
stallion-dreams-pony-realistic-v1-sdxl - 文字到图像的真实感小马生成模型
Stallion Dreams文本生成图像图像处理开源项目模型GithubHuggingface照片现实主义Stable Diffusion
项目利用Stable Diffusion技术,专为生成真实感小马图像而设计,提供文字到图像的转换功能。模型使用diffusers库,在生成写实图像方面表现优异,适合对逼真效果有需求的创作者和开发者。
segformer-b0-finetuned-ade-512-512 - SegFormer-b0模型实现高效语义分割
模型Github语义分割开源项目Huggingface图像处理SegFormer计算机视觉深度学习
SegFormer-b0是一个在ADE20k数据集上微调的语义分割模型,采用512x512分辨率。其特点是结合了层次化Transformer编码器和轻量级MLP解码头,在语义分割任务中表现优异。模型经过ImageNet-1k预训练后,添加解码头并在特定数据集上微调。研究者可直接应用于语义分割,或根据需求选择针对性微调的版本。
Florence-2-large - 多任务视觉AI的统一解决方案
图像处理计算机视觉多任务学习Huggingface模型人工智能GithubFlorence-2开源项目
Florence-2是一个由微软开发的视觉基础模型,能够处理多种视觉和视觉-语言任务。该模型通过解释简单的文本提示,可以执行图像描述、目标检测和分割等任务。Florence-2基于FLD-5B数据集进行训练,在零样本和微调场景下均表现优异。模型提供不同规模的版本,支持多种视觉任务,为研究人员和开发者提供了一个versatile的视觉AI工具。
depth-anything-small-hf - 基于大规模无标注数据的先进深度估计模型
图像处理零样本学习深度估计Huggingface模型GithubDepth Anything开源项目视觉模型
Depth Anything是一款基于DPT架构和DINOv2骨干网络的创新深度估计模型。通过对约6200万张图像的训练,该模型在相对和绝对深度估计领域均实现了突破性成果。它不仅支持零样本深度估计,还能适应多样化的场景图像。研究人员和开发者可以通过简洁的pipeline或灵活的自定义类,轻松实现高精度的图像深度估计。
dinov2-base - 基于Vision Transformer的自监督视觉特征学习模型
特征提取图像处理HuggingfaceDINOv2模型Vision TransformerGithub开源项目自监督学习
DINOv2-base是Facebook AI研究团队开发的基于Vision Transformer的自监督视觉模型。该模型在大规模图像数据集上预训练,无需标注数据即可学习强大的视觉特征表示。DINOv2-base可应用于图像分类、目标检测等多种视觉任务,支持直接特征提取或针对特定任务进行微调。作为开源项目,它为计算机视觉研究和应用提供了灵活而有力的基础。
Florence-2-base - 多任务视觉处理的统一基础模型
图像处理计算机视觉多任务学习Huggingface模型人工智能GithubFlorence-2开源项目
Florence-2是一个视觉基础模型,可处理多种视觉和视觉语言任务。该模型通过解释文本提示执行图像描述、物体检测和分割等功能。Florence-2利用FLD-5B数据集进行训练,在零样本和微调场景下均表现优异。它支持图像描述、物体检测、区域描述等多项任务,为视觉应用提供了统一的基础架构。