#Stable Diffusion

sd-webui-bilingual-localization - Stable Diffusion双语UI扩展,提升用户操作体验
Stable Diffusionweb UIbilingual localization翻译安装Github开源项目
这个项目为Stable Diffusion web UI提供双语本地化扩展,支持动态标题翻译和灵活的正则表达式模式。用户可以通过两种安装方法来使用该扩展,且兼容现有语言包插件,无需重新导入。该扩展有效防止全局污染,确保界面元素的精确翻译。
x-stable-diffusion - Stable Diffusion 模型的加速技术的汇编
Stable DiffusionStochastic.ai图片生成优化部署Github开源项目
该项目包含多种加速Stable Diffusion模型的技术,旨在更高效生成图像并节省资源。通过示例图像和详细的基准测试,用户可以轻松选择最佳技术。借助stochasticx命令行工具,用户可以快速在本地部署模型。项目还支持在Google Colab上运行,提供包括AITemplate、nvFuser、FlashAttention和TensorRT在内的多种优化工具。
diffusionbee-stable-diffusion-ui - 为Mac用户提供简便的Stable Diffusion本地运行工具,支持多模型和无依赖一键安装
Diffusion BeeStable DiffusionMacOS图像处理机器学习Github开源项目
Diffusion Bee在Mac上简便运行Stable Diffusion,支持Intel和M1/M2芯片,无需其他软件或技术知识,采用一键安装,确保数据隐私。主要功能涵盖图像生成、多模型支持、图像放大和历史记录,提供全面便捷的图像生成体验。
AI-Render - Blender的附加组件,通过Stable Diffusion生成AI图像
AI RenderStable DiffusionBlenderAI艺术图像生成Github开源项目
AI Render是一个Blender的附加组件,通过Stable Diffusion生成AI图像,无需本地运行代码。支持Windows、Mac和Linux系统,兼容Blender 3.0.0及以上版本。查看安装指南、演示和教程视频,还可以生成动画或批处理图像。访问GitHub提交反馈和建议,加入社区分享作品和想法。
Radiata - 基于Diffusers的全方位稳定扩散和TensorRT加速工具
RadiataStable DiffusionTensorRTControlNetGitGithub开源项目
Radiata 是一个基于 diffusers 的稳定扩散 WebUI,提供稳定扩散、稳定扩散 XL 和 TensorRT 加速等功能。通过简单的 Git 和 Python 安装步骤,可以快速部署并享受高效的模型推理体验。同时支持 ControlNet 插件和 Lora & Lycoris 模型扩展,增强工具的灵活性和功能性。适用于 Windows 和 Linux 系统,详细文档参见官方网站。
ComfyBox - 无代码生成和管理Stable Diffusion图像界面
ComfyBoxStable DiffusionComfyUI无代码UI构建工作流管理Github开源项目
ComfyBox 是一个前端工具,用于在Stable Diffusion中创建图像生成界面,无需编写代码。通过集成ComfyUI,提供了强大的扩展性,用户可以轻松导入现有工作流程,并支持多工作流程管理、队列提示和历史浏览功能。适用于桌面和移动设备,但项目仍在建设中,功能尚未完全实现,工作流程格式可能随测试阶段变动。
daam - 解释稳定扩散模型的跨注意力归因图方法
DAAMStable DiffusionHugging FacePyTorchColabGithub开源项目
这篇文章介绍了一种基于跨注意力机制的方法——注意力归因图(DAAM),用于解析稳定扩散模型。内容包括DAAM在命令行界面和库中的实际应用示例,以及在HuggingFace平台上的在线演示。文章展示了如何生成与单词关联的热力图,支持Stable Diffusion XL (SDXL)和Diffusers 0.21.1版本的模型。还提供了PyTorch安装指南和DAAM快速入门教程,帮助用户实现和探索模型结果。文章中还包括相关视频资源和扩展工具的链接,供用户参考。
diffusiondb - 大规模文本生成图像数据集,促进多领域研究
DiffusionDBStable Diffusion文本生成图像数据集生成模型Github开源项目
DiffusionDB 是一个大规模文本生成图像数据集,包含1400万张由Stable Diffusion生成的图像,以真实用户的提示和超参数为基础。该数据集为研究生成模型与提示词的关系、检测深度伪造和设计人机交互工具提供了丰富资源,分为 DiffusionDB 2M 和 DiffusionDB Large 两个子集,满足不同需求。模块化的数据集结构使得用户可以高效加载所需部分。
Attend-and-Excite - 文本到图像扩散模型中的注意力机制优化
Attend-and-ExciteStable DiffusionAI图像生成跨注意力Github开源项目
研究表明,当前的文本到图像生成模型在特定语义表达方面存在不足。为解决这一问题,提出了基于注意力机制的语义护理(Generative Semantic Nursing, GSN)方法。此方法通过在推理过程中调整模型的交叉注意单元,使生成的图像更准确地反映输入文本中的多个对象和属性。相比其他方法,该技术在各种文本提示下表现出更高的语义忠实度,并提供详细的实现步骤和代码,以便研究人员进行实验与复现。
sd-webui-inpaint-anything - 扩展使用 Segment Anything 中的蒙版在浏览器 UI 上执行稳定的扩散修复
Stable DiffusionSegment AnythingInpaint AnythingWeb UIAUTOMATIC1111Github开源项目
Inpaint Anything扩展在AUTOMATIC1111的Stable Diffusion Web UI上利用Segment Anything生成的掩码进行修复。通过简单指向所需区域来指定掩码,提高掩码创建的效率和准确性。该扩展支持v1.3.0及以上版本,提供详细的安装、运行、模型下载和高级功能指南。支持对动画风格图像和复杂模型的处理,显著节省时间和精力,提高修复质量。
lora - 使用低秩自适应技术进行快速稳定扩散模型微调
LoRAStable DiffusionDreamboothHuggingfacePivotal TuningGithub开源项目
该项目使用低秩自适应技术进行快速稳定扩散模型微调,比dreambooth方法快两倍,支持inpainting,并且生成非常小的模型文件(1MB~6MB),便于共享和下载。兼容diffusers库,提供多向量核心调优反演功能,并实现更好的性能。项目集成了Huggingface Spaces,增加了LoRA合并、Resnet应用和转换脚本功能。通过仅微调模型的残差,该方法显著缩小模型大小,同时保持高保真度,适用于需要快速高效微调的用户。
voltaML-fast-stable-diffusion - 使用AITemplate加速的Stable Diffusion WebUI和API
VoltaMLStable DiffusionAITemplateWebUIAPIGithub开源项目
VoltaML-fast-stable-diffusion是一个使用AITemplate加速的Stable Diffusion WebUI和API,提供简洁易用的界面,支持PyTorch和AITemplate推理,兼容Windows和Linux,并提供详细文档。利用Docker轻松部署,拥有积极的社区支持。
SEINE - 短视频到长视频生成的SEINE模型,支持生成过渡效果和视频预测
SEINE视频生成视频扩散模型Stable DiffusionVchitectGithub开源项目
SEINE模型是一个专为短视频到长视频生成设计的视频扩散模型,支持过渡效果和视频预测。作为Vchitect视频生成系统的一部分,SEINE基于稳定扩散v1.4模型,支持从文本生成视频的框架LaVie。用户通过配置脚本可生成不同条件下的视频,文档中提供了详细的设置和使用说明。项目提供模型下载链接,并展示了实际的输入图像和输出视频效果。代码以Apache-2.0开源许可发布,可用于学术研究和商业用途。
Stable-Diffusion-Android - 多环境支持的快速图片生成器
Stable DiffusionAI绘图AI HordeHugging Face InferenceOpenAIGithub开源项目
Stable Diffusion AI是一款可以快速从文本或图片生成高质量图像的应用,支持AI Horde、Stable-Diffusion-WebUI、SwarmUI、Hugging Face Inference API、OpenAI、Stability AI等多种服务器环境以及本地模式,提供丰富的生成参数和图片管理功能。
LightDiffusionFlow - Stable Diffusion Web UI参数轻松导入导出工具
Stable DiffusionAUTOMATIC1111LightFlow插件参数导入导出Github开源项目
LightDiffusionFlow是一个为AUTOMATIC1111的Stable Diffusion Web UI设计的插件,提供便捷的参数导入导出功能。它可从图像中解析png信息并恢复参数,理论上兼容所有插件。无需特殊要求,安装简便,支持SD WebUI v1.5及以上版本,建议使用v1.6及以上版本以确保最佳兼容性。欢迎加入LightFlow社区探索更多功能并提出您的创意。
custom-diffusion - 文本到图像扩散模型微调方法
Custom DiffusionStable Diffusion文本到图像扩散模型图像生成多概念定制Github开源项目
该项目提供了一种高效的文本到图像扩散模型微调方法。只需调整部分模型参数,即可在短时间内完成训练,并减少存储需求。项目还支持多概念组合,附带新数据集和完整的训练步骤。适用于多种类别和应用场景。
text2cinemagraph - 文本描述生成电影图像的全自动方法
Text2CinemagraphStable DiffusionPyTorchOptical Flow PredictionODISEGithub开源项目
该项目提供了一种由文本描述生成映画图的全自动方法。通过Stable Diffusion技术,从自然图像和视频数据集中提取语义信息,预测并传递运动到艺术风格图像中,生成电影图像。详细说明了环境设置、预训练模型下载及推理和训练指南,适用于高级图像处理和动画生成的用户。
diffusion-classifier - 利用大规模文本到图像生成模型实现零样本分类
Diffusion ClassifierStable Diffusionzero-shot分类生成模型ICCV 2023Github开源项目
本项目展示了如何利用大型文本图像生成模型如Stable Diffusion进行零样本分类,无需额外训练。该生成分类方法在多项基准测试中表现优越,超过其他扩散模型的知识提取方法。通过从ImageNet的类条件扩散模型中提取标准分类器,该模型即使在仅使用弱增强的情况下也表现出强大的分类性能和分布转移的稳健性。本研究推进了生成模型在下游任务中的应用,是对多模态组合推理能力的重要探索。
BentoDiffusion - 如何使用BentoML部署和运行Stable Diffusion模型的教程
BentoMLStable DiffusionSDXL Turbo图像生成模型部署Github开源项目
本项目示例展示如何使用BentoML部署和运行Stable Diffusion模型,适用于图像生成和操作系统应用开发。需具备Python 3.9+和BentoML基础知识,并可利用Nvidia GPU进行本地测试。内容涵盖依赖安装、服务运行和BentoCloud部署,提供多个模型选择如ControlNet、Latent Consistency Model和Stable Diffusion 2等。
SHARK - 跨平台机器学习分发解决方案
SHARKTurbineStable Diffusiontorch-mlirVulkanGithub开源项目
SHARK是一个高性能的机器学习分发平台,支持Windows、Linux和macOS,兼容AMD和Nvidia硬件,优化图像和文本生成的效率和稳定性。利用最新的Turbine技术,促进更快速的模型部署和稳定性能体验。详细指南帮助初学者和开发者快速上手,支持稳定扩散、BERT、GPT2等热门模型。
clip-interrogator - 一种提示工程工具
CLIP Interrogator人工智能图像生成Stable DiffusionOpenAIGithub开源项目
CLIP Interrogator结合了OpenAI的CLIP和Salesforce的BLIP,优化生成与给定图像相匹配的文本提示。支持Stable Diffusion和DreamStudio等文本到图像模型。现已作为Stable Diffusion Web UI扩展供使用,并支持在Colab、HuggingFace和Replicate上运行。用户可通过Python虚拟环境安装,并根据系统VRAM配置自定义优化。提供多种预训练CLIP模型供选择,满足不同需求。
fastsdcpu - CPU优化的Stable Diffusion,提高图像生成效率
Stable DiffusionFastSD CPUOpenVINOAdversarial Diffusion DistillationLatent Consistency ModelsGithub开源项目
FastSD CPU 是一种基于 Latent Consistency Models 和 Adversarial Diffusion Distillation 的增强型 Stable Diffusion 版本,专为提升 CPU 上的图像生成速度。它提供桌面 GUI、WebUI 和 CLI 接口,兼容 Windows、Linux、Mac 和 Android 系统,支持 256、512、768、1024 分辨率图像,并集成 OpenVINO 加速功能,显著提高推理速度和内存优化。
stable-diffusion-webui-docker - 便捷运行Stable Diffusion,提供多样UI选择
Stable DiffusionDockerAUTOMATIC1111ComfyUIUI界面Github开源项目
Stable Diffusion WebUI Docker项目通过简洁界面,帮助用户在本地设备上轻松运行Stable Diffusion。详细的设置和使用说明请见wiki。项目支持AUTOMATIC1111、ComfyUI等多种UI,并提供详尽功能。用户可通过文本生成图像、图像编辑等功能进行创作。项目鼓励社区贡献,但请先在讨论区提出问题和计划。软件协议禁止生成违法或有害内容,详细规则请查阅许可文件。
Auto1111SDK - 轻量级Python库,支持Stable Diffusion图像生成和编辑
Auto 1111 SDKStable DiffusionPython库图像生成图像编辑Github开源项目
Auto 1111 SDK是一个轻量级Python库,使用Stable Diffusion模型进行图像生成、放大和编辑。它与Automatic 1111 Web UI完美集成,提供文本到图像、图像到图像、修补和外延等多种管道处理功能,支持多种采样器和模型下载。集成了Civit AI,方便直接从网站下载模型。用户可在Colab上通过示例体验该SDK,并参考官方提供的安装和快速上手指南。
AIGC_Interview - AIGC求职指南,了解基础知识与核心技能
AIGC面试指南ChatGPTStable DiffusionGithub开源项目提示词工程师
AIGC求职面试指南提供全面的基础知识、提示词工程、大模型、ChatGPT等内容,帮助求职者掌握必备技能,获取宝贵经验。指南持续更新,包括算法与提示词方向的面试体验、学习资源和知识库,使求职者无论新手还是有经验,都能找到实用信息,实现职业发展和提升。
sd-parseq - 优化Stable Diffusion动画生成的参数调节工具,支持音频同步
ParseqStable DiffusionDeforum参数序列器Automatic1111Github开源项目
Parseq是一个为Deforum扩展设计的参数序列器,允许用户通过脚本化的插值方式控制Stable Diffusion的参数,从而生成动画并实现音频同步。Parseq支持复杂的表达式语言,能够处理变焦、平移及3D旋转等输入参数,并提供前端存储和本地处理的便利。它与Automatic1111的Stable Diffusion界面集成简便,显著简化动画制作流程,并支持模块化管理和分享工作。
dream-factory - 支持多GPU的AI艺术多线程生成工具
AI生成艺术多GPU支持Github开源项目Dream FactoryStable DiffusionAutomatic1111
Dream Factory是一个多线程GUI管理工具,适用于批量生成AI艺术作品,支持多种Stable Diffusion版本和扩展。通过与Automatic1111后端的集成,实现了自动化和远程管理,以及强大的自定义提示文件格式。适合有大量提示创意并希望快速生成各种艺术风格作品的用户。
sd-scripts - Stable Diffusion模型训练与生成的综合脚本工具库
Stable Diffusion机器学习图像生成模型训练LoRAGithub开源项目
sd-scripts是一个专为Stable Diffusion模型开发的脚本库,集成了多种训练方法如DreamBooth、微调、LoRA和Textual Inversion。此外,它还提供了图像生成和模型转换功能。该项目包含训练脚本、数据准备工具和配置选项,有助于优化AI艺术创作流程。
Perp-Neg-stablediffusion - Perp-Neg算法突破二维扩散模型限制实现三维生成
Perp-NegStable DiffusionAI绘图图像生成3D模型Github开源项目
Perp-Neg-stablediffusion项目开发了新型负面提示算法,将二维扩散模型扩展至三维领域,缓解了Janus问题。该技术改进了Stable Diffusion的图像生成能力,并实现了三维物体生成。项目开源代码允许研究者探索Perp-Neg在图像合成和三维建模等领域的应用。
ml-stable-diffusion - 在Apple设备上实现高效稳定的AI图像生成
Core MLStable DiffusionAI绘图模型转换性能优化Github开源项目
ml-stable-diffusion是一个开源项目,旨在优化Stable Diffusion模型在Apple设备上的运行。它包含用于模型转换的Python工具和用于iOS/macOS应用集成的Swift包。通过权重压缩等技术,该项目显著提升了性能和内存效率,使开发者能够在Apple平台应用中实现高质量的AI图像生成。
HCP-Diffusion - Stable Diffusion模型训练与优化工具集
HCP-DiffusionStable Diffusion文本到图像生成LoRADreamArtist++Github开源项目
HCP-Diffusion是基于Diffusers库开发的Stable Diffusion模型工具集。它整合了多种文本到图像生成的训练方法,包括Prompt-tuning和Textual Inversion等。该工具集引入了DreamArtist++技术,支持一次性文本到图像生成。HCP-Diffusion提供层级LoRA、模型集成和自定义优化器等功能,为AI研究和开发提供全面的模型训练与推理支持。
SLiMe - 基于Stable Diffusion的单样本图像分割方法
SLiMe图像分割Stable DiffusionPyTorch深度学习Github开源项目
SLiMe是一种基于Stable Diffusion的单样本图像分割方法,通过单个训练样本实现准确分割。项目提供PyTorch实现,包含训练、测试和数据处理指南。SLiMe在PASCAL-Part和CelebAMask-HQ数据集上表现优异,为图像分割研究提供新思路。项目开源代码,支持自定义数据集训练和测试。SLiMe采用图像分块处理技术,提高分割精度。研究者可基于此探索更多单样本学习应用场景。
DRLX - 强化学习框架优化扩散模型
DRLX扩散模型强化学习分布式训练Stable DiffusionGithub开源项目
DRLX是一个基于强化学习的扩散模型分布式训练库。它与Hugging Face的Diffusers库集成,支持多GPU和多节点训练。DRLX兼容Stable Diffusion等模型,实现DDPO算法训练。该库采用即插即用设计,训练模型可直接用于原始管道。DRLX集成了美学评分奖励模型和PickAPic提示词生成功能,为扩散模型研究提供了全面的工具集。
sd-webui-deforum - Stable Diffusion的动画生成扩展
DeforumStable DiffusionAUTOMATIC1111WebUIAI绘图Github开源项目
sd-webui-deforum是AUTOMATIC1111's webui的官方扩展,为Stable Diffusion增添动画生成功能。该扩展支持3D模式、关键帧设置和数学函数,可用于创建各种动画效果。它易于安装,提供实时预览功能和详细使用指南。项目在GitHub上持续更新,并在Discord社区中拥有活跃用户群。
sd-webui-reactor - Stable Diffusion AI换脸扩展 支持多人脸替换与性别识别
ReActor人脸替换Stable DiffusionWebUI扩展AI图像处理Github开源项目
ReActor是Stable Diffusion生态系统中的AI换脸扩展。它支持多人脸替换、性别识别、面部优化和图像超分辨率等功能。通过API和ComfyUI集成实现灵活调用。兼容主流SD WebUI版本,对硬件要求低。可应用于AI艺术创作、影视后期制作等多个领域。
PaddleHub - 多领域应用的跨平台AI模型服务平台
PaddleHubAI模型ERNIE-ViLGStable DiffusionHugging FaceGithub开源项目
PaddleHub提供超过400种高质量AI模型,覆盖计算机视觉、自然语言处理和语音识别等领域。用户仅需3行代码即可进行模型预测,同时支持模型即服务,通过简单命令即可部署。最新版本v2.3.0引入了ERNIE-ViLG、Disco Diffusion和Stable Diffusion等模型,并支持在HuggingFace平台上发布。PaddleHub兼容Linux、Windows和MacOS,适合多平台开发。