Awesome-diffusion-model-for-image-processing

扩散模型在图像处理领域的最新进展与应用汇总

本项目汇总了扩散模型在图像处理领域的最新研究进展，涵盖图像复原、增强、编码和质量评估等方面。重点关注图像超分辨率、修复和去噪等任务，提供全面的调查报告和定期更新的研究成果。项目收录了大量相关开源代码和数据集资源，为研究人员提供了重要的参考信息。

Github

论文

介绍相关项目

DragDiffusion - 基于扩散模型的交互式图像编辑工具

DragDiffusionGithub交互式人工智能图像编辑开源项目扩散模型

DragDiffusion结合扩散模型和交互式编辑，允许用户通过拖拽操作修改图像。支持真实和生成图像编辑，集成LoRA训练、自定义VAE和FreeU技术，提高编辑质量和效率。这个研究项目为图像处理提供了新的方法和工具。

Awesome-Controllable-T2I-Diffusion-Models - 可控文本到图像扩散模型研究进展综述

Diffusion ModelsGithub个性化生成主体驱动生成可控生成开源项目文本到图像生成

该项目汇集了文本到图像扩散模型中可控生成的前沿研究。内容涵盖个性化生成、空间控制、高级文本条件生成等多个方向,并总结了多条件生成和通用可控生成方法。项目为研究人员和开发者提供了全面了解可控T2I扩散模型最新进展的资源,有助于促进该领域的发展。

DiffIR - 创新扩散模型提升图像修复效率

DiffIRGithubICCV2023图像恢复开源项目扩散模型深度学习

DiffIR是一种专为图像修复设计的创新扩散模型。它结合了紧凑的图像修复先验提取网络、动态图像修复变换器和去噪网络，相比传统扩散模型实现了更快速、稳定的图像恢复。在多项图像修复任务中，DiffIR展现出最先进的性能，同时大幅降低计算成本，为图像修复技术开辟了新的发展方向。

Diffusion_models_from_scratch - 完整实现扩散模型的开源框架与教程

Diffusion模型GithubImageNetU-Net图像生成开源项目预训练模型

该项目提供了一个完整的扩散模型实现框架，包含DDPM、DDIM和无分类器引导模型。项目特点包括：基于ImageNet 64x64数据集的预训练模型、详细的环境配置和数据准备指南、全面的训练和推理脚本，以及多种模型架构和优化策略。开发者可以利用此框架轻松训练自定义扩散模型或使用预训练模型生成图像。

DocDiff - 基于残差扩散模型的轻量级文档图像增强工具

DocDiffGithub图像处理开源项目扩散模型文档增强深度学习

DocDiff是一个基于残差扩散模型的轻量级文档增强工具，用于文档去模糊、去噪、二值化和去水印等任务。该模型在128*128分辨率上训练仅需12GB显存。除文档处理外，DocDiff还适用于自然场景图像处理和语义分割。项目提供完整代码和预训练模型，便于快速实现和应用。

HiDiffusion - 无需训练即可提升扩散模型分辨率和速度的方法

AI绘图GithubHiDiffusion图像生成开源项目扩散模型高分辨率

HiDiffusion是一种提高预训练扩散模型分辨率和速度的方法，无需额外训练。通过添加单行代码即可集成到现有扩散管道中。它支持文本到图像、图像到图像和修复等多种任务，适用于Stable Diffusion XL、Stable Diffusion v2等主流模型。HiDiffusion还兼容ControlNet等下游任务，为图像生成提供更高质量和效率。

awesome-stable-diffusion - 针对Stable Diffusion人工智能模型全面的资源与软件指南

AI模型GUI界面GithubStable Diffusion人工智能绘图开源项目资源库

awesome-stable-diffusion是一个针对Stable Diffusion人工智能模型的综合性资源和软件集合，提供一系列从GUI到CLI界面的安装指南，并支持NVIDIA GPU、Apple Silicon和AMD GPU等多平台。项目不仅提供必要的模型权重文件，还详述如何运行模型，同时提供多种经过更新和维护的分支版本，满足用户对功能和性能的不同需求。

custom-diffusion - 文本到图像扩散模型微调方法

Custom DiffusionGithubStable Diffusion图像生成多概念定制开源项目文本到图像扩散模型

该项目提供了一种高效的文本到图像扩散模型微调方法。只需调整部分模型参数，即可在短时间内完成训练，并减少存储需求。项目还支持多概念组合，附带新数据集和完整的训练步骤。适用于多种类别和应用场景。

LayerDiffuse - 基于潜在透明度的图层扩散技术突破图像处理新境界

AI绘图GithubLayerDiffuse图像处理开源项目潜在透明度透明图层扩散

LayerDiffuse是一个开源图像处理项目，专注于利用潜在透明度实现透明图层扩散。目前支持Stable Diffusion WebUI和Diffusers CLI平台，未来将扩展到Gradio、Colab和Huggingface Space。项目计划发布数据集和训练代码，为图像处理领域提供新的技术方案。通过创新的图层处理工具，LayerDiffuse开启了图像创作的无限可能。

flash-diffusion - 用于加速条件扩散模型的高效蒸馏技术

Flash DiffusionGithubLoRA加速技术图像生成开源项目扩散模型

Flash Diffusion是一种用于加速预训练扩散模型图像生成的蒸馏方法。该技术高效、快速、通用且兼容LoRA，在COCO数据集上实现了少步骤图像生成的先进性能。Flash Diffusion只需几小时GPU训练时间和较少可训练参数，适用于文本生成图像、图像修复、换脸和超分辨率等多种任务。它支持UNet和DiT等不同骨干网络，能够显著减少采样步骤，同时保持高质量的图像生成效果。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能，包括文生视频、动态画面和形象生成等，帮助用户快速上手，创造专业级内容。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台，用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品，帮助用户探索创意灵感。

讯飞文书

讯飞文书依托讯飞星火大模型，为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能，满足事务性工作的高频需求，帮助撰稿人节省精力，提高效率，优化工作与生活。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com