Project Icon

DiffIR

创新扩散模型提升图像修复效率

DiffIR是一种专为图像修复设计的创新扩散模型。它结合了紧凑的图像修复先验提取网络、动态图像修复变换器和去噪网络,相比传统扩散模型实现了更快速、稳定的图像恢复。在多项图像修复任务中,DiffIR展现出最先进的性能,同时大幅降低计算成本,为图像修复技术开辟了新的发展方向。

DiffIR:高效的图像恢复扩散模型(ICCV2023)

论文 | 项目页面 | 预训练模型

新闻

  • 2023年12月19日: 我们提出了基于参考的DiffIR(DiffRIR),以缓解图像编辑(如修复和扩展)过程中生成区域和保留区域之间的纹理、亮度和对比度差异。所有训练和推理代码以及预训练模型(x1、x2、x4)已在Github上发布。
  • 2023年9月10日: 对于真实世界的超分辨率,我们发布了x1和x2预训练模型。
  • 2023年9月6日: 对于真实世界的超分辨率和SRGAN,我们可以测试没有GT图像的LR图像推理
  • 2023年8月31日: 对于真实世界的超分辨率和SRGAN任务,我们更新了2倍超分辨率训练文件。
  • 2023年8月28日: 对于真实世界的超分辨率任务,我们发布了更注重感知而非失真的预训练模型RealworldSR-DiffIRS2-GANV2训练文件,可用于AIGC生成图像的超分辨率。
  • 2023年7月20日: 训练和测试代码以及预训练模型已发布!

摘要: 扩散模型(DM)通过将图像合成过程建模为去噪网络的连续应用,实现了最先进的性能。然而,与图像合成不同,图像恢复(IR)有强烈的约束,要求生成的结果与真实图像一致。因此,对于IR来说,传统DM在大型模型上运行大量迭代来估计整个图像或特征图是低效的。为解决这个问题,我们提出了一种高效的IR扩散模型(DiffIR),它由紧凑的IR先验提取网络(CPEN)、动态IR转换器(DIRformer)和去噪网络组成。具体来说,DiffIR有两个训练阶段:预训练和训练DM。在预训练中,我们将真实图像输入CPEN${S1}$以捕获紧凑的IR先验表示(IPR)来指导DIRformer。在第二阶段,我们训练DM仅使用低质量图像直接估计与预训练CPEN${S1}$相同的IRP。我们观察到,由于IPR只是一个紧凑的向量,DiffIR可以使用比传统DM更少的迭代次数来获得准确的估计,并生成更稳定和逼真的结果。由于迭代次数很少,我们的DiffIR可以采用CPEN$_{S2}$、DIRformer和去噪网络的联合优化,这可以进一步减少估计误差的影响。我们在几个IR任务上进行了广泛的实验,在消耗更少计算成本的同时实现了最先进的性能。


安装

对于修复任务,请参见pip.sh以安装运行DiffIR所需的依赖项。

对于基于GAN的单图像超分辨率,请参见pip.sh以安装运行DiffIR所需的依赖项。

对于真实世界的超分辨率,请参见pip.sh以安装运行DiffIR所需的依赖项。

对于运动去模糊,请参见pip.sh以安装运行DiffIR所需的依赖项。

训练和评估

修复、基于GAN的单图像超分辨率、真实世界超分辨率和运动去模糊的训练和测试说明在各自的目录中提供。这里有一个包含超链接的摘要表,方便导航:

任务训练说明测试说明DiffIR的预训练模型
图像修复链接链接下载
基于GAN的单图像超分辨率链接链接下载
真实世界超分辨率链接链接下载
运动去模糊链接链接下载

结果

实验针对不同的图像处理任务进行,包括图像修复、基于GAN的单图像超分辨率、真实世界超分辨率和运动去模糊。

图像修复(点击展开)
基于GAN的单图像超分辨率(点击展开)
真实世界超分辨率(点击展开)
运动去模糊(点击展开)

引用

如果您使用DiffIR,请考虑引用:

@article{xia2023diffir,
  title={Diffir: Efficient diffusion model for image restoration},
  author={Xia, Bin and Zhang, Yulun and Wang, Shiyin and Wang, Yitong and Wu, Xinglong and Tian, Yapeng and Yang, Wenming and Van Gool, Luc},
  journal={ICCV},
  year={2023}
}

联系方式

如有任何问题,请联系zjbinxia@gmail.com

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号