Logo

#图像修复

Logo of lama
lama
LaMa 使用傅立叶卷积技术,提供高效的图像修复服务,尤其擅长处理大尺寸遮罩和周期性结构的修复。项目支持多种格式和分辨率,适应各类复杂场景。通过多平台融合,开放源代码和在线体验,LaMa 旨在推动图像处理技术的创新和应用。
Logo of watermark-removal
watermark-removal
这个开源项目利用机器学习的图像修复技术来去除图像中的水印,使结果与原始图像几乎没有区别。项目受到Contextual Attention和Gated Convolution研究的启发,并采用Tensorflow 1.15.0和neuralgym工具包。用户可以通过Google Colab轻松运行项目,按照提供的详细操作步骤和下载链接来清除图像水印。
Logo of BrushNet
BrushNet
BrushNet是一种新型图像修复模型,采用双分支扩散结构,可集成到预训练扩散模型中。通过分离遮罩图像特征和噪声潜在表示,并对预训练模型实施像素级控制,提高了图像修复效果。该模型适用于通用场景和特定应用,为图像编辑和生成提供了新的解决方案。
Logo of Diffree
Diffree
Diffree是一个基于扩散模型的文本引导对象添加系统。该项目通过OABench数据集训练,能够仅依靠文本指令准确预测新对象位置并添加到图像中,同时保持背景一致性。Diffree在对象添加成功率、背景协调性和空间布局方面表现优异,为图像编辑和内容创作提供了新的可能。
Logo of DiffBIR
DiffBIR
DiffBIR是一种基于扩散模型的盲图像修复方法,可处理多种图像退化问题,如盲超分辨率、盲人脸修复和盲图像去噪。该方法采用两阶段架构,先进行退化移除,再利用IRControlNet重建图像。DiffBIR在真实世界图像上展现出优异的修复效果,能生成高质量、真实的细节。项目提供开源代码、预训练模型和详细使用说明。
Logo of pytorch-inpainting-with-partial-conv
pytorch-inpainting-with-partial-conv
这是Liu等人论文《Image Inpainting for Irregular Holes Using Partial Convolutions》的非官方PyTorch实现。项目提供了基于部分卷积的不规则孔洞图像修复方法,包含数据预处理、模型训练、微调和测试的完整流程。尽管尚未完全复现原论文结果,但已展示了部分测试集的修复效果。此实现为研究人员和开发者提供了探索这一图像修复技术的基础。
Logo of InstructIR
InstructIR
InstructIR项目利用人类书写的自然语言指令,引导神经模型进行全能型图像修复。该模型在图像去噪、去雨、去模糊、去雾和提升低光图像等多个任务上实现了最新成果,并在多个基准测试中比现有方法提升了+1dB,树立了文本引导图像修复与增强的新标准。
Logo of edge-connect
edge-connect
EdgeConnect是一种新的图像修复方法,通过生成对抗网络模型提高细节再现。该方法包含两个步骤:首先生成图像中缺失区域的边缘,然后根据生成的边缘信息填补图像。此方法适用于Places2、CelebA及Paris Street-View等数据集。EdgeConnect引入新的边缘生成和图像补全技术,使修复结果更为真实自然。该项目基于Python和PyTorch实现,支持CUDA加速,提供完整的训练、测试和评估指南,并且免费提供预训练模型下载使用。
Logo of CAT
CAT
CAT是一种创新的图像恢复模型,采用矩形窗口自注意力机制扩大特征提取范围。模型通过水平和垂直矩形窗口并行聚合特征,实现窗口间交互。结合CNN的局部特性,CAT在全局-局部特征耦合方面表现出色。实验证实该方法在多种图像恢复任务中超越了现有技术水平。
Logo of ImageColorizer
ImageColorizer
ImageColorizer提供多种AI驱动的照片处理功能,包括黑白照片着色、老照片修复、图像增强、面部修饰和照片清理。该工具能为黑白图像添加逼真色彩,修复模糊和损坏照片,提升图像质量,并可去除不需要的元素。操作简单直观,无需专业技能,适合各类用户使用。
Logo of Watermark-Removal-Pytorch
Watermark-Removal-Pytorch
该项目实现了基于深度图像先验的水印去除技术,无需训练数据即可处理已知和未知水印。该方法通过简单API调用,支持图像编辑等任务。项目采用PyTorch开发,提供MPS加速,包含使用说明和结果展示。
Logo of inpaint
inpaint
Inpaint是一个开源C++库,实现图像修复和完成功能。它侧重于大面积图像重建和对象移除,能够恢复或修复图像区域,使修改后的图像看起来自然。该库针对大区域重建进行了优化,可有效去除图像中不需要的元素。Inpaint支持多平台构建,并提供交互式工具用于图像编辑和修复。
Logo of comfyui-inpaint-nodes
comfyui-inpaint-nodes
ComfyUI Inpaint Nodes项目提供先进的图像补绘功能,支持Fooocus inpaint、LaMa和MAT等多模型。项目包含多个用于inpaint和outpaint区域预填充的节点工具,如扩展和填充掩码、模糊处理等,以确保平滑的过渡。还包括后处理节点,如去噪和合成掩码,并附有详细的示例工作流和安装指南。
Logo of PowerPaint
PowerPaint
PowerPaint是一个高质量多功能图像修复模型,支持文本引导的目标修复、目标移除、形状引导的目标插入和图像外扩等任务。通过针对不同修复任务设计的特定提示来实现精确效果。最新版本PowerPaint v2-1已经开源,修正了训练过程中的一些问题。用户可以通过Gradio界面进行对象修复和扩展,并兼容ControlNet。
Logo of Real-ESRGAN
Real-ESRGAN
Real-ESRGAN是一个开源的AI图像超分辨率增强项目。该项目采用纯合成数据训练,可提升各类图像和视频质量。Real-ESRGAN提供多个预训练模型,适用于通用、动漫、人脸等场景,支持4倍及以上放大。项目包含Python脚本和便携式可执行文件,方便快速使用。此外,Real-ESRGAN开放训练代码,允许在自定义数据集上进行微调。
Logo of Cleanup.pictures
Cleanup.pictures
Cleanup.pictures是一款基于AI技术的在线图像编辑工具,能够快速移除照片中的物体、人物、文字和瑕疵。操作简单直观,几次点击即可实现专业级图像修复效果。该工具广泛适用于摄影、创意、房地产和电商等领域。提供免费版和专业版,支持处理不同分辨率的图像。
Logo of inpaint-anything
inpaint-anything
Inpaint Anything是一款结合Segment Anything分割技术和稳定扩散修复能力的AI图像编辑工具。通过简单点击创建精确蒙版,提高修复效率和质量。支持SAM 2、SAM-HQ和FastSAM等多种模型,适用于多种图像类型。工具提供蒙版扩展、裁剪和迭代修复等调整选项,实现灵活强大的图像编辑。
Logo of NAFNet
NAFNet
NAFNet是一种无需非线性激活函数的图像修复网络,通过简单的基线超过现有SOTA方法并显著降低计算成本。在GoPro数据集上,该网络的图像去模糊性能达到33.69 dB PSNR,在SIDD数据集上的图像去噪性能为40.30 dB PSNR,均显著超越前代SOTA性能。NAFNet适用于图像去噪、去模糊和立体图像超分辨率等任务。
Logo of Infusion
Infusion
InFusion项目提出了一种创新的3D场景修复方法,通过学习扩散先验的深度完成来修复3D高斯体。该技术实现了对不完整3D场景的高质量修复,能够处理复杂的遮挡情况。InFusion为3D重建和虚拟现实等领域提供了新的解决方案,项目开源了推理代码和预训练模型,为相关研究和开发提供了重要资源。
Logo of AOT-GAN-for-Inpainting
AOT-GAN-for-Inpainting
AOT-GAN for Inpainting项目提出了一种创新的图像修复模型,旨在解决高分辨率图像中大面积缺失区域的修复问题。该模型结合了聚合上下文变换(AOT)块和SoftGAN技术,分别增强了上下文推理能力和纹理合成质量。AOT块能够有效捕捉远距离上下文信息和丰富的特征模式,而SoftGAN则通过改进判别器训练,提高了真实和合成图像细节的识别能力。这种方法在面部、物体和场景图像的高质量修复上取得了显著成效。
Logo of PixelFixer
PixelFixer
PixelFixer是一款智能图像编辑应用,专注于照片修复和对象移除。该应用运用先进技术,可一键优化照片,修正缺陷,智能去水印,清除不需要的元素,并自动补充缺失部分。操作简单,用户可通过PixelFixer轻松完善照片,获得专业级效果。目前,PixelFixer已在App Store发布,即将登陆Google Play商店,为用户提供跨平台的智能图像编辑服务。
Logo of Inpaint-iOS
Inpaint-iOS
Inpaint-iOS是一款本地运行的图像修复应用,基于CoreML技术,支持iOS设备和M系列Mac。无需云端处理,即可实现图像编辑和修复。应用持续更新,不断增加新功能并优化性能,致力于提供高效便捷的图像处理体验。