#Stable Diffusion

sd-webui-llul - Stable Diffusion WebUI局部放大插件提升AI绘画细节

LLuL潜在空间局部放大Stable Diffusion图像生成Github开源项目

LLuL是Stable Diffusion WebUI的扩展插件，实现潜在空间中的图像局部放大。它提供简单的界面，让创作者能选择特定区域进行高质量放大，同时保持整体构图。插件支持权重调节和蒙版功能，增强了AI绘画的细节控制和画质表现。通过LLuL，AI生成图像的局部细节得到提升，整体画面质量显著改善。

taesd - 轻量级自动编码器：高速解码Stable Diffusion潜在空间

TAESDStable DiffusionAI绘图自动编码器潜在空间Github开源项目

TAESD是一款小巧的自动编码器，采用与Stable Diffusion VAE相同的潜在API。它能高效地将Stable Diffusion潜在空间解码为全尺寸图像。TAESD兼容SD1/2、SDXL、SD3和FLUX.1等多种模型，已整合到主流AI绘画工具中。该工具适用于实时预览图像生成过程和替代官方VAE的场景。尽管在细节还原方面稍有欠缺，TAESD通过轻微的质量损失换取了显著的速度和便利性提升。

sd-webui-controlnet - 为Stable Diffusion WebUI增添高度可控的图像生成功能

ControlNetStable DiffusionWebUIAI绘图图像生成Github开源项目

sd-webui-controlnet扩展为Stable Diffusion WebUI集成了ControlNet功能。它支持多种控制模型和预处理器,实现像素级精确控制,兼容高分辨率修复和上采样脚本。用户可调整提示词与控制网络的权重,还可使用参考图像进行无模型控制。该扩展显著提升了Stable Diffusion的可控性,为AI图像生成开启更多可能性。

sd-webui-agent-scheduler - Stable Diffusion图像生成工作流管理插件

AgentSchedulerStable Diffusion图像生成工作流WebUI扩展Github开源项目

AgentScheduler是一款为Stable Diffusion Web UI设计的扩展插件，用于优化图像生成工作流。它具备任务队列管理、参数编辑、多检查点批量生成等功能，并支持API访问和回调。该插件兼容A1111和Vladmandic最新版本，安装使用便捷，可有效提升AI图像生成效率。

OneButtonPrompt - 智能化稳定扩散提示生成工具

OneButtonPromptAI绘图提示词生成Stable Diffusion自动化工具Github开源项目

OneButtonPrompt是一款智能提示生成工具，适用于Automatic1111、ComfyUI和RuinedFooocus等稳定扩散平台。它可自动生成完整提示，满足不同水平用户需求。支持TXT2IMG、IMG2IMG和ControlNET等功能，并提供预设、工作流辅助和无限变体生成。用户可借此探索多样化的AI图像创作，体验丰富的艺术风格和概念。

PASD - 像素感知稳定扩散模型用于图像超分辨率和风格化

Stable Diffusion图像超分辨率个性化风格化人工智能计算机视觉Github开源项目

PASD是一个基于像素感知稳定扩散模型的开源项目，专注于图像超分辨率和风格化处理。该技术能将低分辨率图像转换为高质量的高分辨率版本，同时支持老照片修复、图像上色和风格转换等多种任务。PASD的核心优势在于其像素级的感知能力，可以在各种复杂的图像处理过程中保持细节的完整性。

stable-diffusion-webui-ux - 高度可定制的Stable Diffusion Web界面

Stable Diffusion用户界面AI绘图图像生成定制化Github开源项目

stable-diffusion-webui-ux是一个基于Gradio库的Stable Diffusion Web界面。它实现了DOM样式优化、事件委托、微模板引擎等功能，提高了界面性能。此外，项目集成了工作区定制、无限图像浏览等特性，并支持提示矩阵、注意力机制、文本反转等高级功能，为AI图像生成提供了全面的工具集。

Fooocus - AI图像生成软件简单操作高质量输出

FooocusAI绘图文生图开源软件Stable DiffusionGithub开源项目

Fooocus是一款结合Stable Diffusion开源特性和Midjourney简易操作的AI图像生成软件。它自动优化内部流程,用户只需关注提示词和图像即可。软件支持放大、变化和局部重绘等功能,具有独特的提示词处理引擎。Fooocus适用于Windows、Linux和Mac平台,最低需4GB显存。安装便捷,界面直观,为AI艺术创作提供便利。

ComfyUI - 模块化Stable Diffusion工作流设计与执行工具

ComfyUIAI绘图Stable Diffusion工作流GPUGithub开源项目

ComfyUI是一个开源的Stable Diffusion工作流设计工具。它采用图形化界面，支持通过节点和流程图创建复杂的AI图像生成流程。ComfyUI兼容多种Stable Diffusion模型，包括SD1.x、SD2.x和SDXL等。该工具具有异步队列系统和智能内存管理，优化了资源使用。ComfyUI还集成了LoRA、ControlNet等技术，可保存和加载完整工作流，为用户提供灵活的AI图像生成体验。

lora-scripts - Stable Diffusion模型训练全能工具包

SD-TrainerLoRAStable Diffusion训练工具WebUIGithub开源项目

SD-Trainer为Stable Diffusion模型训练提供了全面解决方案。这个开源项目整合了图形界面、一键式环境配置和多种训练脚本，支持LoRA和Dreambooth等技术。通过WebUI，用户可以轻松管理训练流程，使用Tensorboard跟踪进度，并借助标签编辑器优化数据集。SD-Trainer简化了模型训练过程，让创作者和开发者能够更高效地定制Stable Diffusion模型。

stable-diffusion-webui-chinese - 为Stable Diffusion WebUI提供的中文界面扩展

Stable DiffusionWebUI汉化AI绘画扩展Github开源项目

Stable Diffusion WebUI中文扩展项目提供完整的界面翻译，涵盖ControlNet、Lora Block Weight等多个流行扩展。支持通过WebUI扩展或直接复制模板安装，旨在简化中文用户使用Stable Diffusion的体验。该项目定期更新，确保与最新版本兼容，为AI绘画爱好者提供便捷的本地化解决方案。

Cones-V2 - 多主体自定义图像合成的创新方法

Cones 2图像合成残差嵌入布局引导采样Stable DiffusionGithub开源项目

Cones-V2是一种新型图像合成技术，通过文本编码器微调学习残差嵌入，实现多主体自定义图像生成。每个主体仅需5KB存储空间，并采用布局引导采样方法实现精确排列。基于Stable Diffusion模型，Cones-V2可生成场景、宠物、玩具和人物等多样化高质量图像。

ArtSpew - 高效生成大规模随机AI艺术图像的开源工具

ArtSpewStable DiffusionAI绘图随机图像生成高速渲染Github开源项目

ArtSpew是一个基于Stable Diffusion技术的开源AI艺术生成工具。该项目能快速创建大量随机或主题性图像,适合艺术创意探索和灵感获取。支持SD1.5和SDXL模型,提供批量生成和随机提示词等功能。ArtSpew可用于创意寻找和大规模图像实验,为AI艺术创作提供新的可能性。

stable-diffusion-webui-extensions - 管理和发现AI绘画功能的平台

Stable Diffusion扩展索引GitHubpull request标签Github开源项目

stable-diffusion-webui-extensions是Stable Diffusion Web UI的扩展索引库。该项目提供集中管理和发现新扩展的平台，开发者可提交扩展，用户可选择AI绘画功能。通过JSON格式和标签系统，项目简化了扩展的提交和管理流程，保证扩展质量。用户可浏览安装扩展，增强Stable Diffusion Web UI功能。

kohya_ss - Stable Diffusion模型训练图形界面工具

Kohya's GUIStable Diffusion训练参数LoRACUDAGithub开源项目

kohya_ss是一个开源的Stable Diffusion模型训练工具,提供图形用户界面。用户可以通过界面设置训练参数,生成所需的命令行指令。支持多个操作系统,具备LoRA训练和样本图像生成等功能。该工具简化了Stable Diffusion模型的自定义训练流程,有助于AI图像生成。

sygil-webui - 基于Stable Diffusion的开源图像生成界面

Stable DiffusionAI绘图图像生成WebUI机器学习Github开源项目

sygil-webui是基于Stable Diffusion的开源Web界面，集成了文本生成图像、图像编辑等功能。项目支持GFPGAN和RealESRGAN图像增强，提供生成预览和CPU运行选项。适用于Windows和Linux系统，界面友好，可自定义程度高。

stable-diffusion-nvidia-docker - 基于Docker的Stable Diffusion简易部署方案

Stable DiffusionAI绘图DockerGPU多GPU支持Github开源项目

该项目为Stable Diffusion模型提供基于Docker的部署方案，适用于Ubuntu和Windows系统。通过简单的Web UI界面，用户可在GPU设备上轻松运行Stable Diffusion，支持多GPU推理、图像到图像转换和图像修复功能。项目集成了Stable Diffusion 2.0模型，为AI图像生成技术的使用提供便捷途径。

stable-diffusion-webui-forge - 增强版AI图像生成平台 -，打造更快、更强大的深度学习体验

Stable DiffusionWebUI ForgeAI绘图开发平台实验功能Github开源项目

Stable Diffusion WebUI Forge是原版SD WebUI的增强平台，专注于资源优化和推理加速。该项目集成了FreeU V2、ControlNet和IP-Adapter等先进特性，支持一键安装和多版本CUDA/PyTorch兼容。Forge旨在为开发者提供更友好的环境，同时为用户带来高效的AI图像生成体验。

TemporalKit - 优化Stable Diffusion视频的时间稳定性和连贯性

TemporalKitStable Diffusion视频处理关键帧EbSynthGithub开源项目

TemporalKit是Stable Diffusion的扩展插件,旨在提高AI生成视频的时间稳定性。该工具支持关键帧提取、图像处理和EbSynth集成,可生成流畅连贯的视频效果。它简化了视频处理流程,支持批量处理,并提供详细教程。TemporalKit适合需要提升AI视频质量的创作者使用,有助于生成更加稳定和连贯的视频内容。

Awesome-Chinese-Stable-Diffusion - 综合中文Stable Diffusion资源集锦模型应用数据集教程

Stable Diffusion中文模型文生图开源AI绘画Github开源项目

这个项目汇集了丰富的中文Stable Diffusion资源，涵盖开源模型、应用、数据集和教程。收录了10多个开源中文文生图模型，包括SkyPaint、Pai-Diffusion、Taiyi等重要模型，以及阿里云、达摩院等机构的相关成果。覆盖通用领域和特定场景如古诗配图、二次元动漫等。旨在为中文社区提供全面的SD资源，推动AI艺术创作与研究的发展。项目内容不断更新，欢迎社区参与贡献。

PhotoMaker - AI逼真人像照片定制生成工具

PhotoMakerAI绘图图像生成自定义人像Stable DiffusionGithub开源项目

PhotoMaker是一款创新的AI图像生成工具,能在几秒内定制生成高度逼真的人像照片。它保持了优秀的身份保真度,同时兼顾多样性和高质量输出。作为适配器,PhotoMaker可与其他基础模型和LoRA模块无缝协作。该工具支持真实照片和风格化生成,为创作提供灵活空间。PhotoMaker操作简单,无需额外训练即可实现个性化,为AI驱动的图像生成领域带来积极影响。

rich-text-to-image - 富文本格式提升文本到图像生成的精确控制

Rich-Text-to-Image文本生成图像AI绘图Stable DiffusionICCV 2023Github开源项目

Rich-Text-to-Image项目利用富文本格式信息增强文本到图像生成的控制能力。该项目通过字体大小、颜色、样式和脚注等格式实现精确的颜色渲染、局部风格控制和详细区域合成。这种方法支持token显式重新加权，可与Stable Diffusion等主流模型集成，提供更精细的图像生成控制。项目开源了代码实现，并提供在线演示和相关论文，为文本到图像生成领域开辟了新的研究方向。

ProFusion - 高效定制化文本到图像生成的无正则化方法

ProFusionAI绘图文本生成图像自定义模型Stable DiffusionGithub开源项目

ProFusion是一个创新的文本到图像生成框架，专为定制预训练大规模模型而设计。该框架仅需一张测试图像和单个GPU，即可为独特概念生成多样创意图像。ProFusion采用无正则化方法，有效保留图像细节，并能构建定制数据集用于训练免调整的AI助手。此外，它还支持处理复杂输入，同时生成文本说明和图像，无需额外微调。

gen-cv - 综合AI图像生成处理与分析的开源加速器

Vision AI图像处理Azure Machine LearningStable DiffusionOpenAIGithub开源项目

gen-cv是一个丰富的开源资源库，集合了多种图像生成、处理和分析的示例。该项目整合了Azure Machine Learning、Computer Vision、OpenAI和Stable Diffusion等先进技术，涵盖引导式图像生成、视频分析、头像创建和模型微调等领域。通过提供实用示例，gen-cv旨在帮助开发者探索和实现先进的计算机视觉解决方案，推动AI视觉技术的应用和创新。

swift-coreml-diffusers - Swift应用中集成Core ML实现Stable Diffusion模型

SwiftCore MLStable DiffusioniOSmacOSGithub开源项目

swift-coreml-diffusers项目展示如何在Swift应用中集成Apple的Core ML Stable Diffusion实现。该应用支持macOS和iOS设备，采用DPM-Solver++调度器提高性能。首次启动时自动下载量化Core ML模型，可利用CPU、GPU和Neural Engine加速。项目适合快速迭代开发，也可作为在Apple设备上实现AI图像生成的示例代码。

stable-diffusion-deploy - 开源项目助力AI艺术生成模型的部署与扩展

MuseAI绘图Lightning AppsStable Diffusion生产环境部署Github开源项目

项目利用Lightning Apps框架，演示了稳定扩散模型在实际生产环境中的部署流程。核心功能涵盖负载均衡、GPU推理加速、性能评估及微服务协调。通过整合多租户架构、React.js界面、动态GPU处理和弹性扩展等技术，该项目为AI艺术创作领域提供了一套完整的开源解决方案。

Stable-Diffusion-WebUI-TensorRT - TensorRT优化Stable Diffusion在NVIDIA RTX GPU上的性能

TensorRTStable DiffusionNVIDIA GPU性能优化AI绘图Github开源项目

这个扩展通过TensorRT优化引擎，显著提升了Stable Diffusion在NVIDIA RTX GPU上的性能。它兼容SD 1.5、2.1、SDXL和SDXL Turbo等多个版本。扩展提供了简便的默认引擎生成和快速启用功能，同时支持LoRA转换与应用。为满足不同需求，扩展提供多种引擎类型，可适应各种分辨率和批量大小。高级用户还可进行个性化设置，灵活调整性能参数。

compel - 文本嵌入系统的提示权重调整工具

Compel文本嵌入提示词权重Stable Diffusion关键词混合Github开源项目

Compel是一个文本提示权重调整工具，用于transformer类型的文本嵌入系统。通过简洁的语法，用户可以重新分配提示字符串各部分的权重，从而调整生成的嵌入张量。该工具兼容Hugging Face的StableDiffusionPipeline，支持批处理、文本反转和SDXL模型，为AI图像生成提供精细控制。

sd-webui-animatediff - Stable Diffusion WebUI的AI视频创作扩展

AnimateDiffStable DiffusionWebUIControlNetAI视频生成Github开源项目

sd-webui-animatediff为Stable Diffusion WebUI提供了强大的AI视频创作功能。该扩展集成AnimateDiff技术，使创建GIF动画与生成静态图像一样简便。它支持ControlNet和提示词旅行等高级特性，并具有多项性能优化选项。作为一个versatile工具，sd-webui-animatediff不仅兼容WebUI，还可用于Forge平台，为AI视频制作提供了全面的解决方案。

swift-diffusion - Swift重新实现的Stable Diffusion模型

Swift DiffusionAI绘图Stable Diffusion移动设备优化深度学习Github开源项目

Swift重新实现的单文件Stable Diffusion模型，包含CLIP文本处理、UNet扩散和解码器等核心组件。项目致力于在移动设备上运行Stable Diffusion，通过内存优化和性能提升，实现与原始Python版本相当的效果。目前已完成主要模型移植，为移动AI应用开发提供新的可能。

sd-forge-layerdiffuse - 基于Stable Diffusion的透明图层生成扩展

sd-forge-layerdiffuseSDXL透明图像生成VAEStable DiffusionGithub开源项目

sd-forge-layerdiffuse是一个Stable Diffusion WebUI扩展，用于生成透明图像和图层。通过VAE管道和LoRA模型，它将SDXL或SD1.5转换为透明图像生成器。支持前景、背景和混合图像生成，能处理半透明效果和复杂细节。该扩展提供了比简单背景去除更先进的透明图像处理方法。

X-Adapter - 实现旧版扩散模型插件通用兼容的适配器

X-Adapter扩散模型插件兼容Stable DiffusionControlNetGithub开源项目

X-Adapter是一个通用适配器，使旧版扩散模型（如SD1.5）的预训练插件能够直接与升级后的模型（如SDXL）兼容，无需重新训练。该项目支持ControlNet、LoRA等多种插件，提供了设置指南、推理代码和使用示例，提高了模型升级后的灵活性和效率。这为研究人员和开发者提供了实用的工具和资源。

sd-webui-infinite-image-browsing - Stable Diffusion webui图像浏览与管理扩展

Stable Diffusion图像浏览AI绘图扩展功能文件管理Github开源项目

sd-webui-infinite-image-browsing是Stable Diffusion webui的扩展插件，提供高性能图像浏览和管理功能。支持ComfyUI、Fooocus等多种AI软件，具备图像搜索、收藏、全屏预览和文件操作等特性。该扩展还提供多语言支持、隐私保护和批量下载功能，适用于AI生成图像的管理和浏览。

ComfyUI-AutomaticCFG - 优化CFG参数的AI图像生成增强插件

ComfyUIAI绘图CFG优化自动缩放Stable DiffusionGithub开源项目

ComfyUI-AutomaticCFG是一个为ComfyUI设计的开源插件，通过自动调节CFG参数优化AI图像生成过程。该插件引入了抗烧毁机制、负面提示权重和注意力修改器等功能，提高了生成效率和图像质量。它还提供多种预设和自定义选项，支持用户创作多样化的AI图像。这个项目适合各类用户使用，可以显著提升AI图像生成的稳定性和效率。

adetailer - Stable Diffusion WebUI自动掩码和修复增强扩展

ADetailerStable Diffusion图像处理AI绘图自动遮罩Github开源项目

ADetailer是Stable Diffusion WebUI的扩展插件，提供自动掩码和修复功能。它支持人脸、手部和人物等多种检测模型，允许自定义检测阈值和掩码处理。该工具兼容ControlNet，支持多种修复模式，可有效提升图像细节。ADetailer简化了图像处理流程，是一个功能强大的AI辅助图像编辑工具。

PaddleHub - 多领域应用的跨平台AI模型服务平台

PaddleHubAI模型ERNIE-ViLGStable DiffusionHugging FaceGithub开源项目

PaddleHub提供超过400种高质量AI模型，覆盖计算机视觉、自然语言处理和语音识别等领域。用户仅需3行代码即可进行模型预测，同时支持模型即服务，通过简单命令即可部署。最新版本v2.3.0引入了ERNIE-ViLG、Disco Diffusion和Stable Diffusion等模型，并支持在HuggingFace平台上发布。PaddleHub兼容Linux、Windows和MacOS，适合多平台开发。

Fooocus：轻松上手、低显存要求，带来简易高效的图像生成体验

2024年08月03日

Easy Diffusion: 简单易用的AI图像生成工具

2024年08月29日

StableSwarmUI: 一个强大而易用的Stable Diffusion Web界面

2024年08月30日

理解Prompt:AI时代的关键技能

2024年08月30日

Dream Textures: 革命性的Blender AI纹理生成插件

2024年08月30日

Dream Textures: 为Blender带来Stable Diffusion的强大AI生成能力

2024年08月30日

Stability Matrix: 多平台包管理器和Stable Diffusion推理界面

2024年08月30日

Photoshot: 开源AI头像生成器应用

2024年08月30日

LCM：苹果Mac终于可以跑SD了，几秒一张XL，喂饭级教学！

2024年08月03日

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com