Project Icon

image-restoration-sde

创新图像恢复方法 结合SDE和扩散模型的IR-SDE与Refusion

该项目提出IR-SDE和Refusion两种图像恢复方法。IR-SDE采用均值回复随机微分方程,在多项任务中达到最优性能。Refusion整合潜空间扩散模型,可处理大尺寸真实图像。这些技术适用于合成和实际数据集,有效解决图像去雨、去雾、去阴影等问题。项目开源完整PyTorch实现代码,并提供预训练模型和使用指南。

图像复原 SDE
[IR-SDE](ICML 2023)和[Refusion](CVPRW 2023)的官方 PyTorch 实现。

Ziwei Luo, Fredrik K. Gustafsson, Zheng Zhao, Jens Sjölund, Thomas B. Schön
乌普萨拉大学信息技术系

使用均值回归随机微分方程进行图像复原 [权重和结果]
IR-SDE

Refusion: 使用潜空间扩散模型实现大尺寸真实图像复原 [权重和结果]

Refusion 这两种方法都可用于合成和真实世界数据集。你可以在这个**项目页面**找到更多详情和结果。

更新

[2024.04.15] 更新了一种后验采样方法以获得更好的图像生成效果。详见论文使用受控视觉语言模型进行真实世界中的照片级图像复原
[2023.10.02] 我们提出了一种新的通用图像复原框架,通过控制视觉语言模型实现 [点击这里]
[2023.07.06] IR-SDE 和 Refusion 的所有结果和预训练模型分别在 链接1链接2 提供。
[2023.04.25] 🎉🎉🎉 我们的 IR-SDE 论文被 ICML 2023 接收 🎉🎉🎉
[2023.04.23] 我们发布了各种任务的代码(包括 IR-SDERefusionLatent-Refusion)。
[2023.04.17] 🎉🎉🎉 我们的方法 Refusion 是 NTIRE 2023 图像阴影去除挑战赛的获胜方案 [论文]

依赖

  • 操作系统: Ubuntu 20.04
  • nvidia :
    • cuda: 11.7
    • cudnn: 8.5.0
  • python3
  • pytorch >= 1.13.0
  • Python 包: pip install -r requirements.txt

如何使用我们的代码?

这里我们以图像去雨任务为例,但可以通过替换数据集来改变为任何问题。去噪-SDE/ODE 的代码将在稍后发布!

我们在 4 块 Nvidia TITAN XP GPU 上从头开始重新训练了去雨模型,发现它在 Rain100H 上甚至在 PSNR 方面也达到了新的 SOTA:

方法PSNRSSIMLPIPSFID
IR-SDE31.650.90410.04718.64
Restormer31.460.904--
MPRNet30.410.89060.15861.59
PReNet29.460.89900.12852.67

注意我们没有调整任何参数,评估时使用的是最后保存的检查点。

所有任务的预训练模型在这里提供,其他 SOTA 方法的性能可以在这里找到。

Refusion 模型

注意,如果你想训练/测试 Refusion 模型,唯一的变化是将 "ir-sde.yml" 替换为 "refusion.yml"。更多详情请参考每个任务目录中的 "demo.sh" bash 脚本。

数据集准备

我们使用 Rain100H 数据集进行训练(总共 1,800 张图像)和测试(100 张图像)。

下载训练测试数据集,并以雨天图像和无雨图像分别存放在不同目录的方式处理,如下所示:

#### 训练数据集 ####
datasets/rain/trainH/GT
datasets/rain/trainH/LQ


#### 测试数据集 ####
datasets/rain/testH/GT
datasets/rain/testH/LQ

然后进入 codes/config/deraining 目录,修改 options/train/ir-sde.ymloptions/test/ir-sde.yml 中的数据集路径。

训练

训练的主要代码在 codes/config/deraining 中,IR-SDE 的核心算法在 codes/utils/sde_utils.py 中。

你可以按照以下 bash 脚本训练模型:

cd codes/config/deraining
# 单GPU:
python3 train.py -opt=options/train/ir-sde.yml

# 分布式训练,需要修改选项文件中的gpu_ids
python3 -m torch.distributed.launch --nproc_per_node=2 --master_poer=4321 train.py -opt=options/train/ir-sde.yml --launcher pytorch

模型和训练日志将保存在log/derain_sde/目录下。 你可以通过运行tail -f log/derain_sde/train_derain_sde_***.log -n 100实时查看日志。

评估

要评估我们的方法,请修改基准路径和模型路径,然后运行

cd codes/config/deraining
python test.py -opt=options/test/ir-sde.yml

我们还在这里提供了不同任务的结果。

Gradio

我们在app.py文件中提供了一个用于测试您自己图像的应用。在此之前,您需要下载预训练权重并修改test_sde_derain.yml中的模型路径。然后只需运行python app.py,就可以打开http://localhost:7860来测试模型。(我们还在images目录中提供了3张来自Rain100H的雨天图像)。

部分结果

IR-SDE

高分辨率非均匀去雾

Refusion

图像阴影去除

Refusion

插值

我们还在codes/demos/interpolation.py中提供了一个插值演示,用于在两张图像之间进行插值,使用方法如下:

cd codes/demos
python interpolation.py -s 源图像路径 -t 目标图像路径 --save 保存目录

插值示例:

IR-SDE

引用

如果我们的代码对您的研究或工作有帮助,请考虑引用我们的论文。 以下是BibTeX引用:

@article{luo2023image,
  title={Image Restoration with Mean-Reverting Stochastic Differential Equations},
  author={Luo, Ziwei and Gustafsson, Fredrik K and Zhao, Zheng and Sj{\"o}lund, Jens and Sch{\"o}n, Thomas B},
  journal={International Conference on Machine Learning},
  year={2023},
  organization={PMLR}
}

@inproceedings{luo2023refusion,
  title={Refusion: Enabling Large-Size Realistic Image Restoration with Latent-Space Diffusion Models},
  author={Luo, Ziwei and Gustafsson, Fredrik K and Zhao, Zheng and Sj{\"o}lund, Jens and Sch{\"o}n, Thomas B},
  booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops},
  pages={1680--1691},
  year={2023}
}

联系方式

电子邮件:ziwei.luo@it.uu.se

--- 感谢您的关注! ---

访问者

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号