sd-controlnet-mlsd

结合M-LSD直线检测优化Stable Diffusion的图像生成

Github 开源项目条件输入 M-LSD Huggingface Stable Diffusion 扩散模型 ControlNet 模型

该项目介绍了ControlNet神经网络结构，通过加入M-LSD直线检测等条件来控制大规模扩散模型，适用于Stable Diffusion。ControlNet能够在小数据集下进行稳健学习，且可在个人设备上快速训练。项目提供了多种检查点，涵盖边缘检测、深度估计和关键点检测，丰富了大规模扩散模型的控制方式，有助于推进相关应用的发展，最佳效果在Stable Diffusion v1-5结合使用时体现。

Github

Huggingface

介绍相关项目

BentoDiffusion - 如何使用BentoML部署和运行Stable Diffusion模型的教程

BentoMLGithubSDXL TurboStable Diffusion图像生成开源项目模型部署

本项目示例展示如何使用BentoML部署和运行Stable Diffusion模型，适用于图像生成和操作系统应用开发。需具备Python 3.9+和BentoML基础知识，并可利用Nvidia GPU进行本地测试。内容涵盖依赖安装、服务运行和BentoCloud部署，提供多个模型选择如ControlNet、Latent Consistency Model和Stable Diffusion 2等。

x-stable-diffusion - Stable Diffusion 模型的加速技术的汇编

GithubStable DiffusionStochastic.ai优化图片生成开源项目部署

该项目包含多种加速Stable Diffusion模型的技术，旨在更高效生成图像并节省资源。通过示例图像和详细的基准测试，用户可以轻松选择最佳技术。借助stochasticx命令行工具，用户可以快速在本地部署模型。项目还支持在Google Colab上运行，提供包括AITemplate、nvFuser、FlashAttention和TensorRT在内的多种优化工具。

stable-diffusion-xl-base-1.0 - 先进的AI文本转图像生成模型，实现高质量图像创作

AI绘图GithubHuggingfaceSDXLStable Diffusion开源项目扩散模型文本生成图像模型

Stable Diffusion XL 1.0基础模型是一款开源的AI文本转图像工具，采用潜在扩散技术，能根据文字描述生成高质量图像。该模型性能显著提升，适用于艺术创作、教育和研究等领域。它支持多种框架，为开发者提供灵活的应用选择。作为开源项目，它展现了AI图像生成的最新进展，不仅能创建高质量图像，还支持图像修改功能。

stable-diffusion-2-1 - 高分辨率AI文本生成图像模型，支持多样化创作

GithubHuggingfaceStable Diffusion人工智能开源项目文本生成图像机器学习模型深度学习

Stable Diffusion v2-1是Stability AI开发的文本到图像生成AI模型。基于潜在扩散技术，它能将文本描述转化为最高768x768分辨率的高质量图像。该模型提供多个专用变体，包括深度感知和图像修复等。主要应用于艺术创作、设计和研究领域，但存在一些局限性，如无法生成可读文本。Stable Diffusion v2-1仅供研究用途，不应用于生成有害或违法内容。

stable-diffusion-v1-4 - 先进的AI文本转图像模型

GithubHuggingfaceStable Diffusion人工智能开源项目扩散模型文本生成图像模型深度学习

Stable Diffusion v1-4是一个基于潜在扩散技术的AI模型,能将文本描述转化为高质量图像。它结合自动编码器和CLIP文本编码器,在大规模数据集上训练,可生成多样化的写实和艺术风格图像。该模型为研究人员和创意工作者提供了新的视觉创作工具,开启了AI辅助艺术创作的可能性。但值得注意的是,模型存在一些局限性,如无法生成可读文本,且在复杂组合任务上表现不佳。

StreamDiffusion - 高性能实时AI图像生成框架

AI绘图GithubStreamDiffusion图像处理实时生成开源项目深度学习

StreamDiffusion是一个开源的高性能AI图像生成框架,专为实时交互应用设计。它采用流批处理、残差无分类引导等创新技术,大幅提升了扩散模型的生成速度。在RTX 4090显卡上,使用SD-turbo模型可实现每秒106帧的文生图速度,LCM-LoRA与KohakuV2模型组合也能达到每秒38帧。该项目为开发实时AI图像生成应用提供了有力支持。

x-flux - Flux模型的LoRA和ControlNet微调脚本

AI绘图ControlNetDeepSpeedFluxGithubLoRA开源项目

该项目为Flux图像生成模型提供LoRA和ControlNet微调脚本。使用DeepSpeed实现高效训练,并提供预训练检查点。包含详细的训练和推理指南,以及低内存模式和加速配置示例。项目计划未来发布更多ControlNet权重模型和IP-Adapters。

CyberRealistic - 通过Stable Diffusion技术实现高细节的真实图像生成

AI绘图CyberRealisticGithubHuggingface开源项目文本到图像模型照片级真实感高细节

CyberRealistic V2使用Stable Diffusion和Diffusers技术实现高细节图像生成，这项技术特别适合那些需要精美视觉效果的创意作品。

LLM-groundedDiffusion - 优化文本到图像合成的提示理解能力

GPT-4GithubHuggingFaceLLM-grounded DiffusionStable DiffusionTMLR开源项目

本项目通过将大型语言模型（LLM）与文本到图像扩散模型结合，提高了提示理解能力。LLM负责解析文本请求，生成中间表示如图像布局，最终通过稳定扩散模型生成高质量图像。项目支持多种生成方法和开源模型，用户可自行设置实现自托管，从而节约API调用成本。项目更新频繁，包括支持高分辨率生成和集成SDXL精炼器等功能。

ADI-Stable-Diffusion - 基于ONNXRuntime的Stable Diffusion推理框架

C++GithubONNXRuntimeStable Diffusion开源开源项目推理引擎

ADI-Stable-Diffusion是一个C++库和命令行工具,利用ONNXRuntime加速Stable Diffusion模型推理。该项目具有小巧的包体积和高性能,支持多种采样方法和调度器,适用于不同版本的Stable Diffusion模型。它为开发者提供了便捷的工程部署方案,可用于构建灵活的图像生成和编辑应用。

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号