UniControl

优化多任务条件生成的统一扩散模型

UniControl项目展示了一种新的多任务条件生成模型，支持多种语言提示，通过增强的预训练文本到图像扩散模型和任务感知的HyperNet，实现高精度图像生成和多任务适应。实验结果表明，UniControl在多个单任务控制方法上表现更佳，是可控视觉生成领域的重要进展。

访问官网

control_v11e_sd15_ip2p - 更好地控制扩散模型的图像处理能力

ControlNetGithubHuggingface图像生成开源项目扩散模型条件输入模型稳态扩散

本项目利用ControlNet v1.1提供了一种神经网络结构，能够通过附加条件控制预训练的大型扩散模型，与Stable Diffusion兼容。其支持指令化像素到像素的控制，通过边缘图、分割图和关键点等条件输入丰富图像生成方式。即便在小规模数据集下，ControlNet也能在个人设备上快速训练，相关源码及文档可在HuggingFace平台获取，适用于多种图像生成任务，提升图像处理灵活性。

LooseControl - 通用深度条件生成控制技术

AI绘图ControlNetGithubLooseControl图像生成开源项目深度条件控制

LooseControl是一种提升ControlNet能力的深度条件生成控制技术，实现了更通用的深度条件控制。该开源项目提供UI界面和Python API，支持基于粗略深度图的图像生成和风格保持编辑。LooseControl适用于多种场景，为计算机视觉和图像生成领域提供了新的研究方向。

Awesome-Controllable-Generation - 可控生成技术前沿 ControlNet到DreamBooth及最新进展

Github人工智能可控生成开源项目扩散模型文本到图像深度学习

该项目收集了扩散模型中可控生成的前沿论文和资源,涵盖ControlNet、DreamBooth等开创性工作及图像、视频、3D生成的最新应用。内容包括精细合成控制、主题驱动生成和复杂布局操作等技术,汇集80余篇精选论文,全面覆盖可控生成领域的多种技术和应用,为相关研究者提供重要参考。

ControlNeXt - 高效可控生成框架实现图像视频多样化控制

ControlNeXtGithub人工智能可控生成图像生成开源项目视频生成

ControlNeXt是一个创新的可控生成框架，支持图像和视频的多样化控制。该项目大幅减少可训练参数，提高收敛速度和效率。基于Stable Diffusion等先进模型，ControlNeXt实现了包括人体姿态控制在内的多种生成任务。此外，它还可与LoRA等技术结合，提供更灵活、稳定的生成体验。

ControlNetPlus - 多条件控制的AI图像生成与编辑工具

AI绘图ControlNet++GithubSDXL图像生成图像编辑开源项目

ControlNetPlus是一款支持多种控制条件的AI图像生成和编辑工具。该项目采用创新架构，可处理10多种控制条件并生成高分辨率图像，同时支持多条件输入而不增加计算负载。经SDXL全面实验，ControlNetPlus在控制能力和图像质量方面表现出色。ProMax版本还提供图块去模糊、变化和超分辨率等高级编辑功能。此外，ControlNetPlus可与其他开源SDXL模型和Lora模型兼容，为图像生成和编辑提供了灵活的解决方案。

sd-controlnet-scribble - 控制扩散模型增强：利用涂鸦图像实现条件控制

ControlNetGithubHuggingfaceStable Diffusion图像生成开源项目条件控制模型神经网络

ControlNet通过引入涂鸦图像等额外输入条件，为预训练的扩散模型提供条件控制，提升其生成能力。即使在训练数据集较少的情况下，该网络仍能保持良好的学习效果。模型支持在个人设备上训练，并可借助计算集群扩展到大规模数据集。此外，Stable Diffusion等扩散模型可与ControlNet结合，增强条件输入灵活性并拓展其应用领域。

sd-webui-controlnet - 为Stable Diffusion WebUI增添高度可控的图像生成功能

AI绘图ControlNetGithubStable DiffusionWebUI图像生成开源项目

sd-webui-controlnet扩展为Stable Diffusion WebUI集成了ControlNet功能。它支持多种控制模型和预处理器,实现像素级精确控制,兼容高分辨率修复和上采样脚本。用户可调整提示词与控制网络的权重,还可使用参考图像进行无模型控制。该扩展显著提升了Stable Diffusion的可控性,为AI图像生成开启更多可能性。

ControlLLM - 通过图搜索增强大语言模型工具使用能力实现复杂任务解决

ControlLLMGithub任务分解图搜索多模态工具大语言模型开源项目

ControlLLM框架通过图搜索方法提升大语言模型的多模态工具使用能力。其核心包括任务分解器、基于图的思维范式和执行引擎，有效解决复杂任务。该框架在图像、音频和视频处理等领域展现出高准确性和效率，为大语言模型应用开辟新途径。

control_v11p_sd15s2_lineart_anime - 动漫风格线稿的控制性扩散模型

ControlNetGithubHuggingfaceStable Diffusion开源项目文本到图像生成条件控制模型线稿动漫

该项目通过ControlNet为扩散模型添加条件输入，专注于动漫风格线条艺术。ControlNet适应性强，能在小数据集上稳健学习特定任务条件。结合Stable Diffusion v1-5，可以提升模型处理边缘图、分割图和关键点的能力，有助于扩展大规模扩散模型的应用。

Awesome-Controllable-T2I-Diffusion-Models - 可控文本到图像扩散模型研究进展综述

Diffusion ModelsGithub个性化生成主体驱动生成可控生成开源项目文本到图像生成

该项目汇集了文本到图像扩散模型中可控生成的前沿研究。内容涵盖个性化生成、空间控制、高级文本条件生成等多个方向,并总结了多条件生成和通用可控生成方法。项目为研究人员和开发者提供了全面了解可控T2I扩散模型最新进展的资源,有助于促进该领域的发展。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com