#Stable Diffusion
sd-webui-llul - Stable Diffusion WebUI局部放大插件提升AI绘画细节
LLuL潜在空间局部放大Stable Diffusion图像生成Github开源项目
LLuL是Stable Diffusion WebUI的扩展插件,实现潜在空间中的图像局部放大。它提供简单的界面,让创作者能选择特定区域进行高质量放大,同时保持整体构图。插件支持权重调节和蒙版功能,增强了AI绘画的细节控制和画质表现。通过LLuL,AI生成图像的局部细节得到提升,整体画面质量显著改善。
taesd - 轻量级自动编码器:高速解码Stable Diffusion潜在空间
TAESDStable DiffusionAI绘图自动编码器潜在空间Github开源项目
TAESD是一款小巧的自动编码器,采用与Stable Diffusion VAE相同的潜在API。它能高效地将Stable Diffusion潜在空间解码为全尺寸图像。TAESD兼容SD1/2、SDXL、SD3和FLUX.1等多种模型,已整合到主流AI绘画工具中。该工具适用于实时预览图像生成过程和替代官方VAE的场景。尽管在细节还原方面稍有欠缺,TAESD通过轻微的质量损失换取了显著的速度和便利性提升。
sd-webui-controlnet - 为Stable Diffusion WebUI增添高度可控的图像生成功能
ControlNetStable DiffusionWebUIAI绘图图像生成Github开源项目
sd-webui-controlnet扩展为Stable Diffusion WebUI集成了ControlNet功能。它支持多种控制模型和预处理器,实现像素级精确控制,兼容高分辨率修复和上采样脚本。用户可调整提示词与控制网络的权重,还可使用参考图像进行无模型控制。该扩展显著提升了Stable Diffusion的可控性,为AI图像生成开启更多可能性。
sd-webui-agent-scheduler - Stable Diffusion图像生成工作流管理插件
AgentSchedulerStable Diffusion图像生成工作流WebUI扩展Github开源项目
AgentScheduler是一款为Stable Diffusion Web UI设计的扩展插件,用于优化图像生成工作流。它具备任务队列管理、参数编辑、多检查点批量生成等功能,并支持API访问和回调。该插件兼容A1111和Vladmandic最新版本,安装使用便捷,可有效提升AI图像生成效率。
OneButtonPrompt - 智能化稳定扩散提示生成工具
OneButtonPromptAI绘图提示词生成Stable Diffusion自动化工具Github开源项目
OneButtonPrompt是一款智能提示生成工具,适用于Automatic1111、ComfyUI和RuinedFooocus等稳定扩散平台。它可自动生成完整提示,满足不同水平用户需求。支持TXT2IMG、IMG2IMG和ControlNET等功能,并提供预设、工作流辅助和无限变体生成。用户可借此探索多样化的AI图像创作,体验丰富的艺术风格和概念。
PASD - 像素感知稳定扩散模型用于图像超分辨率和风格化
Stable Diffusion图像超分辨率个性化风格化人工智能计算机视觉Github开源项目
PASD是一个基于像素感知稳定扩散模型的开源项目,专注于图像超分辨率和风格化处理。该技术能将低分辨率图像转换为高质量的高分辨率版本,同时支持老照片修复、图像上色和风格转换等多种任务。PASD的核心优势在于其像素级的感知能力,可以在各种复杂的图像处理过程中保持细节的完整性。
stable-diffusion-webui-ux - 高度可定制的Stable Diffusion Web界面
Stable Diffusion用户界面AI绘图图像生成定制化Github开源项目
stable-diffusion-webui-ux是一个基于Gradio库的Stable Diffusion Web界面。它实现了DOM样式优化、事件委托、微模板引擎等功能,提高了界面性能。此外,项目集成了工作区定制、无限图像浏览等特性,并支持提示矩阵、注意力机制、文本反转等高级功能,为AI图像生成提供了全面的工具集。
Fooocus - AI图像生成软件 简单操作 高质量输出
FooocusAI绘图文生图开源软件Stable DiffusionGithub开源项目
Fooocus是一款结合Stable Diffusion开源特性和Midjourney简易操作的AI图像生成软件。它自动优化内部流程,用户只需关注提示词和图像即可。软件支持放大、变化和局部重绘等功能,具有独特的提示词处理引擎。Fooocus适用于Windows、Linux和Mac平台,最低需4GB显存。安装便捷,界面直观,为AI艺术创作提供便利。
ComfyUI - 模块化Stable Diffusion工作流设计与执行工具
ComfyUIAI绘图Stable Diffusion工作流GPUGithub开源项目
ComfyUI是一个开源的Stable Diffusion工作流设计工具。它采用图形化界面,支持通过节点和流程图创建复杂的AI图像生成流程。ComfyUI兼容多种Stable Diffusion模型,包括SD1.x、SD2.x和SDXL等。该工具具有异步队列系统和智能内存管理,优化了资源使用。ComfyUI还集成了LoRA、ControlNet等技术,可保存和加载完整工作流,为用户提供灵活的AI图像生成体验。
lora-scripts - Stable Diffusion模型训练全能工具包
SD-TrainerLoRAStable Diffusion训练工具WebUIGithub开源项目
SD-Trainer为Stable Diffusion模型训练提供了全面解决方案。这个开源项目整合了图形界面、一键式环境配置和多种训练脚本,支持LoRA和Dreambooth等技术。通过WebUI,用户可以轻松管理训练流程,使用Tensorboard跟踪进度,并借助标签编辑器优化数据集。SD-Trainer简化了模型训练过程,让创作者和开发者能够更高效地定制Stable Diffusion模型。
stable-diffusion-webui-chinese - 为Stable Diffusion WebUI提供的中文界面扩展
Stable DiffusionWebUI汉化AI绘画扩展Github开源项目
Stable Diffusion WebUI中文扩展项目提供完整的界面翻译,涵盖ControlNet、Lora Block Weight等多个流行扩展。支持通过WebUI扩展或直接复制模板安装,旨在简化中文用户使用Stable Diffusion的体验。该项目定期更新,确保与最新版本兼容,为AI绘画爱好者提供便捷的本地化解决方案。
Cones-V2 - 多主体自定义图像合成的创新方法
Cones 2图像合成残差嵌入布局引导采样Stable DiffusionGithub开源项目
Cones-V2是一种新型图像合成技术,通过文本编码器微调学习残差嵌入,实现多主体自定义图像生成。每个主体仅需5KB存储空间,并采用布局引导采样方法实现精确排列。基于Stable Diffusion模型,Cones-V2可生成场景、宠物、玩具和人物等多样化高质量图像。
ArtSpew - 高效生成大规模随机AI艺术图像的开源工具
ArtSpewStable DiffusionAI绘图随机图像生成高速渲染Github开源项目
ArtSpew是一个基于Stable Diffusion技术的开源AI艺术生成工具。该项目能快速创建大量随机或主题性图像,适合艺术创意探索和灵感获取。支持SD1.5和SDXL模型,提供批量生成和随机提示词等功能。ArtSpew可用于创意寻找和大规模图像实验,为AI艺术创作提供新的可能性。
stable-diffusion-webui-extensions - 管理和发现AI绘画功能的平台
Stable Diffusion扩展索引GitHubpull request标签Github开源项目
stable-diffusion-webui-extensions是Stable Diffusion Web UI的扩展索引库。该项目提供集中管理和发现新扩展的平台,开发者可提交扩展,用户可选择AI绘画功能。通过JSON格式和标签系统,项目简化了扩展的提交和管理流程,保证扩展质量。用户可浏览安装扩展,增强Stable Diffusion Web UI功能。
kohya_ss - Stable Diffusion模型训练图形界面工具
Kohya's GUIStable Diffusion训练参数LoRACUDAGithub开源项目
kohya_ss是一个开源的Stable Diffusion模型训练工具,提供图形用户界面。用户可以通过界面设置训练参数,生成所需的命令行指令。支持多个操作系统,具备LoRA训练和样本图像生成等功能。该工具简化了Stable Diffusion模型的自定义训练流程,有助于AI图像生成。
sygil-webui - 基于Stable Diffusion的开源图像生成界面
Stable DiffusionAI绘图图像生成WebUI机器学习Github开源项目
sygil-webui是基于Stable Diffusion的开源Web界面,集成了文本生成图像、图像编辑等功能。项目支持GFPGAN和RealESRGAN图像增强,提供生成预览和CPU运行选项。适用于Windows和Linux系统,界面友好,可自定义程度高。
stable-diffusion-nvidia-docker - 基于Docker的Stable Diffusion简易部署方案
Stable DiffusionAI绘图DockerGPU多GPU支持Github开源项目
该项目为Stable Diffusion模型提供基于Docker的部署方案,适用于Ubuntu和Windows系统。通过简单的Web UI界面,用户可在GPU设备上轻松运行Stable Diffusion,支持多GPU推理、图像到图像转换和图像修复功能。项目集成了Stable Diffusion 2.0模型,为AI图像生成技术的使用提供便捷途径。
stable-diffusion-webui-forge - 增强版AI图像生成平台 -,打造更快、更强大的深度学习体验
Stable DiffusionWebUI ForgeAI绘图开发平台实验功能Github开源项目
Stable Diffusion WebUI Forge是原版SD WebUI的增强平台,专注于资源优化和推理加速。该项目集成了FreeU V2、ControlNet和IP-Adapter等先进特性,支持一键安装和多版本CUDA/PyTorch兼容。Forge旨在为开发者提供更友好的环境,同时为用户带来高效的AI图像生成体验。
TemporalKit - 优化Stable Diffusion视频的时间稳定性和连贯性
TemporalKitStable Diffusion视频处理关键帧EbSynthGithub开源项目
TemporalKit是Stable Diffusion的扩展插件,旨在提高AI生成视频的时间稳定性。该工具支持关键帧提取、图像处理和EbSynth集成,可生成流畅连贯的视频效果。它简化了视频处理流程,支持批量处理,并提供详细教程。TemporalKit适合需要提升AI视频质量的创作者使用,有助于生成更加稳定和连贯的视频内容。
Awesome-Chinese-Stable-Diffusion - 综合中文Stable Diffusion资源集锦 模型应用数据集教程
Stable Diffusion中文模型文生图开源AI绘画Github开源项目
这个项目汇集了丰富的中文Stable Diffusion资源,涵盖开源模型、应用、数据集和教程。收录了10多个开源中文文生图模型,包括SkyPaint、Pai-Diffusion、Taiyi等重要模型,以及阿里云、达摩院等机构的相关成果。覆盖通用领域和特定场景如古诗配图、二次元动漫等。旨在为中文社区提供全面的SD资源,推动AI艺术创作与研究的发展。项目内容不断更新,欢迎社区参与贡献。
PhotoMaker - AI逼真人像照片定制生成工具
PhotoMakerAI绘图图像生成自定义人像Stable DiffusionGithub开源项目
PhotoMaker是一款创新的AI图像生成工具,能在几秒内定制生成高度逼真的人像照片。它保持了优秀的身份保真度,同时兼顾多样性和高质量输出。作为适配器,PhotoMaker可与其他基础模型和LoRA模块无缝协作。该工具支持真实照片和风格化生成,为创作提供灵活空间。PhotoMaker操作简单,无需额外训练即可实现个性化,为AI驱动的图像生成领域带来积极影响。
rich-text-to-image - 富文本格式提升文本到图像生成的精确控制
Rich-Text-to-Image文本生成图像AI绘图Stable DiffusionICCV 2023Github开源项目
Rich-Text-to-Image项目利用富文本格式信息增强文本到图像生成的控制能力。该项目通过字体大小、颜色、样式和脚注等格式实现精确的颜色渲染、局部风格控制和详细区域合成。这种方法支持token显式重新加权,可与Stable Diffusion等主流模型集成,提供更精细的图像生成控制。项目开源了代码实现,并提供在线演示和相关论文,为文本到图像生成领域开辟了新的研究方向。
ProFusion - 高效定制化文本到图像生成的无正则化方法
ProFusionAI绘图文本生成图像自定义模型Stable DiffusionGithub开源项目
ProFusion是一个创新的文本到图像生成框架,专为定制预训练大规模模型而设计。该框架仅需一张测试图像和单个GPU,即可为独特概念生成多样创意图像。ProFusion采用无正则化方法,有效保留图像细节,并能构建定制数据集用于训练免调整的AI助手。此外,它还支持处理复杂输入,同时生成文本说明和图像,无需额外微调。
gen-cv - 综合AI图像生成处理与分析的开源加速器
Vision AI图像处理Azure Machine LearningStable DiffusionOpenAIGithub开源项目
gen-cv是一个丰富的开源资源库,集合了多种图像生成、处理和分析的示例。该项目整合了Azure Machine Learning、Computer Vision、OpenAI和Stable Diffusion等先进技术,涵盖引导式图像生成、视频分析、头像创建和模型微调等领域。通过提供实用示例,gen-cv旨在帮助开发者探索和实现先进的计算机视觉解决方案,推动AI视觉技术的应用和创新。
swift-coreml-diffusers - Swift应用中集成Core ML实现Stable Diffusion模型
SwiftCore MLStable DiffusioniOSmacOSGithub开源项目
swift-coreml-diffusers项目展示如何在Swift应用中集成Apple的Core ML Stable Diffusion实现。该应用支持macOS和iOS设备,采用DPM-Solver++调度器提高性能。首次启动时自动下载量化Core ML模型,可利用CPU、GPU和Neural Engine加速。项目适合快速迭代开发,也可作为在Apple设备上实现AI图像生成的示例代码。
stable-diffusion-deploy - 开源项目助力AI艺术生成模型的部署与扩展
MuseAI绘图Lightning AppsStable Diffusion生产环境部署Github开源项目
项目利用Lightning Apps框架,演示了稳定扩散模型在实际生产环境中的部署流程。核心功能涵盖负载均衡、GPU推理加速、性能评估及微服务协调。通过整合多租户架构、React.js界面、动态GPU处理和弹性扩展等技术,该项目为AI艺术创作领域提供了一套完整的开源解决方案。
Stable-Diffusion-WebUI-TensorRT - TensorRT优化Stable Diffusion在NVIDIA RTX GPU上的性能
TensorRTStable DiffusionNVIDIA GPU性能优化AI绘图Github开源项目
这个扩展通过TensorRT优化引擎,显著提升了Stable Diffusion在NVIDIA RTX GPU上的性能。它兼容SD 1.5、2.1、SDXL和SDXL Turbo等多个版本。扩展提供了简便的默认引擎生成和快速启用功能,同时支持LoRA转换与应用。为满足不同需求,扩展提供多种引擎类型,可适应各种分辨率和批量大小。高级用户还可进行个性化设置,灵活调整性能参数。
compel - 文本嵌入系统的提示权重调整工具
Compel文本嵌入提示词权重Stable Diffusion关键词混合Github开源项目
Compel是一个文本提示权重调整工具,用于transformer类型的文本嵌入系统。通过简洁的语法,用户可以重新分配提示字符串各部分的权重,从而调整生成的嵌入张量。该工具兼容Hugging Face的StableDiffusionPipeline,支持批处理、文本反转和SDXL模型,为AI图像生成提供精细控制。
sd-webui-animatediff - Stable Diffusion WebUI的AI视频创作扩展
AnimateDiffStable DiffusionWebUIControlNetAI视频生成Github开源项目
sd-webui-animatediff为Stable Diffusion WebUI提供了强大的AI视频创作功能。该扩展集成AnimateDiff技术,使创建GIF动画与生成静态图像一样简便。它支持ControlNet和提示词旅行等高级特性,并具有多项性能优化选项。作为一个versatile工具,sd-webui-animatediff不仅兼容WebUI,还可用于Forge平台,为AI视频制作提供了全面的解决方案。
swift-diffusion - Swift重新实现的Stable Diffusion模型
Swift DiffusionAI绘图Stable Diffusion移动设备优化深度学习Github开源项目
Swift重新实现的单文件Stable Diffusion模型,包含CLIP文本处理、UNet扩散和解码器等核心组件。项目致力于在移动设备上运行Stable Diffusion,通过内存优化和性能提升,实现与原始Python版本相当的效果。目前已完成主要模型移植,为移动AI应用开发提供新的可能。
sd-forge-layerdiffuse - 基于Stable Diffusion的透明图层生成扩展
sd-forge-layerdiffuseSDXL透明图像生成VAEStable DiffusionGithub开源项目
sd-forge-layerdiffuse是一个Stable Diffusion WebUI扩展,用于生成透明图像和图层。通过VAE管道和LoRA模型,它将SDXL或SD1.5转换为透明图像生成器。支持前景、背景和混合图像生成,能处理半透明效果和复杂细节。该扩展提供了比简单背景去除更先进的透明图像处理方法。
X-Adapter - 实现旧版扩散模型插件通用兼容的适配器
X-Adapter扩散模型插件兼容Stable DiffusionControlNetGithub开源项目
X-Adapter是一个通用适配器,使旧版扩散模型(如SD1.5)的预训练插件能够直接与升级后的模型(如SDXL)兼容,无需重新训练。该项目支持ControlNet、LoRA等多种插件,提供了设置指南、推理代码和使用示例,提高了模型升级后的灵活性和效率。这为研究人员和开发者提供了实用的工具和资源。
sd-webui-infinite-image-browsing - Stable Diffusion webui图像浏览与管理扩展
Stable Diffusion图像浏览AI绘图扩展功能文件管理Github开源项目
sd-webui-infinite-image-browsing是Stable Diffusion webui的扩展插件,提供高性能图像浏览和管理功能。支持ComfyUI、Fooocus等多种AI软件,具备图像搜索、收藏、全屏预览和文件操作等特性。该扩展还提供多语言支持、隐私保护和批量下载功能,适用于AI生成图像的管理和浏览。
ComfyUI-AutomaticCFG - 优化CFG参数的AI图像生成增强插件
ComfyUIAI绘图CFG优化自动缩放Stable DiffusionGithub开源项目
ComfyUI-AutomaticCFG是一个为ComfyUI设计的开源插件,通过自动调节CFG参数优化AI图像生成过程。该插件引入了抗烧毁机制、负面提示权重和注意力修改器等功能,提高了生成效率和图像质量。它还提供多种预设和自定义选项,支持用户创作多样化的AI图像。这个项目适合各类用户使用,可以显著提升AI图像生成的稳定性和效率。
adetailer - Stable Diffusion WebUI自动掩码和修复增强扩展
ADetailerStable Diffusion图像处理AI绘图自动遮罩Github开源项目
ADetailer是Stable Diffusion WebUI的扩展插件,提供自动掩码和修复功能。它支持人脸、手部和人物等多种检测模型,允许自定义检测阈值和掩码处理。该工具兼容ControlNet,支持多种修复模式,可有效提升图像细节。ADetailer简化了图像处理流程,是一个功能强大的AI辅助图像编辑工具。
PaddleHub - 多领域应用的跨平台AI模型服务平台
PaddleHubAI模型ERNIE-ViLGStable DiffusionHugging FaceGithub开源项目
PaddleHub提供超过400种高质量AI模型,覆盖计算机视觉、自然语言处理和语音识别等领域。用户仅需3行代码即可进行模型预测,同时支持模型即服务,通过简单命令即可部署。最新版本v2.3.0引入了ERNIE-ViLG、Disco Diffusion和Stable Diffusion等模型,并支持在HuggingFace平台上发布。PaddleHub兼容Linux、Windows和MacOS,适合多平台开发。
相关文章
Fooocus:轻松上手、低显存要求,带来简易高效的图像生成体验
2024年08月03日
Easy Diffusion: 简单易用的AI图像生成工具
2024年08月29日
StableSwarmUI: 一个强大而易用的Stable Diffusion Web界面
2024年08月30日
理解Prompt:AI时代的关键技能
2024年08月30日
Dream Textures: 革命性的Blender AI纹理生成插件
2024年08月30日
Dream Textures: 为Blender带来Stable Diffusion的强大AI生成能力
2024年08月30日
Stability Matrix: 多平台包管理器和Stable Diffusion推理界面
2024年08月30日
Photoshot: 开源AI头像生成器应用
2024年08月30日
LCM:苹果Mac终于可以跑SD了,几秒一张XL,喂饭级教学!
2024年08月03日