#AI绘图

unpaint - C++实现的高性能Stable Diffusion图像合成工具
UnpaintStable DiffusionAI绘图图像合成DirectMLGithub开源项目
Unpaint是一款C++实现的Stable Diffusion图像合成工具,支持txt2img、img2img、inpainting等基本功能和ControlNet增强功能。该工具在单进程中运行整个图像生成过程,无需依赖Python,简化了部署流程。Unpaint基于DirectML,兼容NVIDIA和AMD GPU等硬件。用户可从本地或HuggingFace安装模型,便于将Stable Diffusion集成到各类应用中。
PromptGallery-stable-diffusion-webui - Stable Diffusion WebUI扩展 提示词管理与预览工具
Prompt Gallerystable-diffusion-webuiAI绘图扩展插件提示词库Github开源项目
PromptGallery-stable-diffusion-webui扩展为Stable Diffusion WebUI提供提示词库管理、预览图片管理、组合提示词生成和角色系统功能。支持自定义提示词库和预览图片生成,有助于提高AI绘画效率。该插件适合需要高效管理和使用提示词的AI绘画爱好者。
RealScaler - 开源AI驱动的图像视频超分辨率工具
RealScalerAI绘图图像增强视频优化深度学习Github开源项目
RealScaler是基于RealESRGAN技术的开源Windows应用,专注于图片和视频的超分辨率处理。它提供直观的用户界面,支持多种AI模型和文件格式,具备自动图像分割合并、多GPU支持等功能。该工具可同时处理多个文件,并支持原始与放大图像间的插值。RealScaler持续优化,旨在提供高效、高质量的图像和视频增强体验。
IJCAI2023-CoNR - 基于神经渲染的动漫角色动画生成技术
CoNR动画角色表神经渲染AI绘图深度学习Github开源项目
IJCAI2023-CoNR项目开发了一种协作式神经渲染技术,可将手绘动漫角色设定图转换为舞蹈视频。该技术结合超密集姿态序列和角色设定图,实现高质量动画生成。这项研究为动漫创作提供了新工具,可能显著改变传统动漫制作流程。项目已开源代码和数据集,并提供在线演示和教程,便于研究者和开发者探索应用。
langchain4j-aideepin - 融合大语言模型和Langchain4j的开源RAG智能对话系统
LangChain4j-AIDeepinRAG大语言模型知识库AI绘图Github开源项目
LangChain4j-AIDeepin是一个基于大语言模型和Langchain4j框架的开源RAG系统。该项目提供多会话、图片生成、知识库和智能搜索等功能,支持多种AI模型和搜索引擎。系统包含用户端和管理端,采用Java和Vue3技术栈开发,支持离线部署。这是一个功能丰富、灵活可定制的AI应用开发平台。
ComfyUI_Cutoff - ComfyUI精确控制提示词影响范围的插件
ComfyUICutoffAI绘图提示词处理CLIPGithub开源项目
ComfyUI_Cutoff插件通过四个新节点实现提示词的精确控制。它允许用户定义影响区域、设置目标词和调整权重,从而限制特定属性对提示词子集的影响。这种方法特别适用于处理'蓝色头发,黄色眼睛'等复杂提示词,确保属性准确应用到相应对象。通过提供更细致的提示词调整能力,该插件有助于生成更符合预期的图像。
ComfyFlowApp - 将ComfyUI工作流转化为易用的Web应用
ComfyFlowAppComfyUIAI绘图工作流Web应用Github开源项目
ComfyFlowApp是ComfyUI的扩展工具,可将复杂的工作流转化为易用的Web应用。该工具降低了ComfyUI的使用门槛,使非专业用户能轻松进行AI图像处理。ComfyFlowApp适用于企业内部协作和远程团队合作,提高了AI图像处理的工作效率。
img-prompt - 图像提示词编辑工具 简化AI绘图创作过程
AI绘图提示词编辑器Stable DiffusionMidjourneyDALL·EGithub开源项目
IMGPrompt是一个面向Stable Diffusion、Midjourney和DALL·E等AI绘图工具的提示词编辑器。它具有简洁的界面,提供提示词标签化、互动编辑和分类展示功能,便于用户组合提示词。工具完全本地化运行,支持中文显示,无需依赖外部服务,有效提升了AI绘图创作的效率。
coloringbookgenerator - 利用文本到图像技术生成创意填色书
AI绘图SafetensorsColoring Book Generator开源项目模型下载模型Huggingfacestable-diffusionGithub
项目结合稳定扩散和LoRA技术,实现了文本到图像的生成,适用于创作儿童填色书。使用稳定扩散XL基础模型生成DIY填色书,并支持Safetensors格式权重,确保高效运行,适合多种文本到图像转换场景。
CyberRealistic - 通过Stable Diffusion技术实现高细节的真实图像生成
高细节Github模型开源项目文本到图像AI绘图照片级真实感HuggingfaceCyberRealistic
CyberRealistic V2使用Stable Diffusion和Diffusers技术实现高细节图像生成,这项技术特别适合那些需要精美视觉效果的创意作品。
Florence-2-SD3-Captioner - 图像到文本转换的先进工具
AI绘图开源项目自然语言处理图像描述模型HuggingfaceVolkswagen BeetletransformersGithub
Florence-2-SD3-Captioner是一个强大的图像到文本转换工具,支持通过结合多个数据集如google/docci、ProGamerGov/synthetic-dataset等,来生成详尽的图像描述。该工具能够在CUDA设备上高效运行,可处理多种格式的RGB图像。只需提供任务提示和文本,即可获得精确详细的内容描述。
controlnet-seg-room - 室内设计图像生成与自定义元素控制
Github模型控制网Diffusers开源项目AI绘图室内设计Huggingface
controlnet-seg-room项目使用控制网络和细分图训练生成室内设计图像,用户可通过条件信息实现对房间对象的精细控制。项目结合来自BLIP和UperNet模型的元数据,以TPUv4和JAX框架优化,后转为PyTorch以配合Diffusers库,支持图像转换和修复,便于定制设计风格与房型,支持创意设计实现。
NostalgicWorld - 复古与怀旧艺术图像生成项目
怀旧AI绘图diffusers艺术模型Github开源项目LadyNostalgiaHuggingface
NostalgicWorld项目专注于复古与怀旧主题艺术图像的生成。通过多个模型的结合,如Lady Nostalgia和IncredibleWorld2,该项目捕捉经典风格,提供高质量图像生成体验。用户可通过文本提示生成多样化的图像,从复古风到现代动漫艺术。项目注重多模型融合,提高图像质量,提供独特的创意体验。
Chip_n_DallE - 细致化的文本到图像生成模型
深度学习合成模型HuggingfaceGithubAnime开源项目模型图像生成AI绘图
Chip_n_DallE结合了aBagOfChips模型(包含Kitsch-In-Sync v2和GoodLife)与DallEAnime模型,通过细致化文本到图像生成。该组合提升了图像的现实感和细腻度,并适应多种风格。模型在动漫、肖像和场景等领域表现突出,尤其是在高分辨率和细节表现方面。通过超级合并权重分析,该模型为用户提供独特的图像创作体验。
Chance: Visual Intelligence - 视觉智能搜索,让世界触手可及
AI工具Chance AI视觉智能AI绘图图像识别增强现实
Chance: Visual Intelligence通过视觉智能技术提供便捷的视觉搜索,帮助识别艺术品、建筑和宠物等,获取详尽信息和背景故事。平台致力于连接视觉世界,提升内容参与体验,并提供无算法推荐的清晰信息流和音频辅助功能。
RunDiffusion - 云端快速实现AI艺术创作,无需代码
AI工具RunDiffusionAI绘图Automatic1111Stable Diffusion云端服务
RunDiffusion 提供无需代码的云端AI工具,支持 Multiple AI应用如 Automatic1111、Fooocus 和 ComfyUI。用户在90秒内即可获得私人工作空间,利用高速GPU配置,适合创作者和企业灵活生成高质量图像,按需付费。
GrandPrix - 复古风格艺术的多用途文本到图像生成模型
Grand PrixClumsy_TrainerHuggingfaceGithub开源项目模型游戏艺术stable-diffusionAI绘图
Grand Prix项目是一个结合Gacha与LadyNostalgia的文本到图像生成模型,通过稳定扩散技术创造复古风格艺术作品。模型可根据文本提示生成个性化图片,广泛应用于游戏艺术和标志设计等领域。
FuzzyHazel - 文本到图像生成的稳定扩散模型及LoRA融合应用
Stable Diffusion下载链接HuggingfaceGithub艺术风格开源项目模型AI绘图模型合并
FuzzyHazel项目致力于探索稳定扩散模型与LoRA技术在文本到图像生成中的应用。通过整合多样化模型,如HazyAbyss、OctaFuzz、MareAcernis等,并使用EasyNegative和pastelmix-lora资源优化,项目展现了多样的高质量图像生成能力。利用权重公式合并模型,提供了对图像生成的细致控管。同时,项目重视图像合并时的色彩、细节和结构的准确性,为高精度图像生成行业提供了新的解决方案,显示出其在AI艺术和设计中的潜力。
stable-diffusion-xl-base-1.0 - 先进的AI文本转图像生成模型,实现高质量图像创作
Huggingface模型SDXL文本生成图像GithubAI绘图扩散模型开源项目Stable Diffusion
Stable Diffusion XL 1.0基础模型是一款开源的AI文本转图像工具,采用潜在扩散技术,能根据文字描述生成高质量图像。该模型性能显著提升,适用于艺术创作、教育和研究等领域。它支持多种框架,为开发者提供灵活的应用选择。作为开源项目,它展现了AI图像生成的最新进展,不仅能创建高质量图像,还支持图像修改功能。
flux-controlnet-canny-v3 - Canny ControlNet的Flux图像生成
AI绘图Stable DiffusionFluxControlNetGithub图像生成开源项目模型Huggingface
此项目提供了Canny ControlNet检查点,支持FLUX.1-dev模型,并可在ComfyUI中使用。ControlNet在1024x1024分辨率下训练,旨在提升图像的真实性和细节表现。可以通过GitHub仓库中的main.py或ComfyUI自定义节点来体验模型。示例结果和输入图像位于“Files and versions”部分,提供直观的模型表现展示。
kencanmix_v1.5 - 稳定扩散与文本到图像生成的优化方案
Google colabHuggingfaceAI绘图diffusers模型stable-diffusionGithub开源项目文本到图像
kencanmix_v1.5通过整合稳定扩散和谷歌Colab,提供了卓越的文本到图像转换能力,示例图片体现了创新的推理技术,为图像生成探索开辟了新的方向。
stable-diffusion-v1-5 - 文本到图像生成的多平台兼容潜在扩散模型
AI绘图模型生成艺术生成对抗网络Stable DiffusionGithub文本到图像Huggingface开源项目
Stable Diffusion v1-5 是一个使用潜在扩散技术的文本到图像生成模型,可生成高逼真度的图像。该模型经过多次优化与微调,兼容Diffusers库及多种用户界面,强调安全性并配备NSFW检查器,适用于研究、艺术创作及设计领域。此模型针对不同GPU环境设计,具有高效的生成性能。
Flux-uncensored - AI图像生成模型 支持无限制成人内容创作
模型LoRANSFW内容开源项目Huggingface图像生成FLUXAI绘图Github
Flux-uncensored是基于FLUX.1-dev的LoRA模型,专用于生成无限制成人内容图像。该模型移除了内容限制,支持通过文本提示生成NSFW和未经审查的内容。Flux-uncensored仅供研究和个人使用,遵循非商业许可。使用时需谨慎并遵守相关法律和道德规范。
stable-diffusion-2-1-base-custom - 基于Stable Diffusion 2.1的自定义扩散模型用于图像生成
图像生成Huggingface模型深度学习Custom DiffusionGithubAI绘图开源项目Stable Diffusion
stable-diffusion-2-1-base-custom是基于Stable Diffusion 2.1的自定义扩散模型,采用Custom Diffusion技术训练。该模型支持diffusers库,能够将文本转换为高质量图像。开发者可以通过Python代码调用模型进行图像生成。作为开源项目,它为AI艺术创作和图像生成应用提供了有力支持。然而,模型的具体训练数据和潜在局限性尚未明确。
stable-diffusion-2 - 高分辨率文本到图像生成模型
Huggingface模型深度学习文本生成图像机器学习GithubAI绘图开源项目Stable Diffusion
Stable Diffusion v2是一款基于潜在扩散模型的文本到图像生成工具,支持768x768高分辨率输出。该模型采用OpenCLIP-ViT/H文本编码器,在LAION-5B数据集上训练而成。它提供多个预训练检查点,包括基础模型、深度条件模型和放大模型,适用于艺术创作、设计和研究等领域。Stable Diffusion v2在图像生成质量和多样性方面有显著提升,为AI图像创作提供了新的可能。
FLUX.1-dev-LoRA-AntiBlur - FLUX.1-dev基础上的深度景深增强LoRA模型
AI绘图模型LoRA图像生成FLUX.1-dev深度景深GithubHuggingface开源项目
FLUX.1-dev-LoRA-AntiBlur是一个基于FLUX.1-dev的LoRA模型,旨在增强图像的深度景深效果。该模型能在保持图像质量的同时显著提升景深,并可与ControlNet等其他组件结合使用。模型使用简便,无需触发词,在diffusers中推荐使用1.0到1.5的缩放比例。用户可以通过Python代码进行本地推理,也可以在Shakker AI平台上在线生成图像。
RealVisXL_V4.0 - 专注真实感的开源AI图像生成模型
模型模型训练Github照片写实开源项目Huggingface图像生成AI绘图RealVisXL
RealVisXL_V4.0是一个开源的AI图像生成模型,致力于创造高度逼真的视觉效果。目前仍处于训练阶段,但已能生成多种类型的图像,包括常规和成人内容。模型支持参数调整,如采样步骤和上采样方法,以优化输出结果。尽管存在潜在的瑕疵,RealVisXL_V4.0仍为创作者提供了一个强大的工具,可用于探索多样化的视觉创作。
Juggernaut-XL-v9 - 融合多种摄影风格的AI图像生成模型
模型模型训练开源项目Huggingface图像生成AI绘图GithubRunDiffusionJuggernaut XL
Juggernaut-XL-v9是基于Stable Diffusion XL开发的高级AI图像生成模型,整合了RunDiffusion Photo v2技术。该模型在皮肤细节、照明和对比度方面表现出色,支持建筑、野生动物、汽车、食品、室内和风景等多种摄影风格,可生成高度细节化和富有电影感的图像。开发团队正着手V10版本更新和Stable Cascade版本开发,致力于增强模型的提示词理解能力和整体图像质量。
Juggernaut-XL-v6 - 多功能SDXL图像生成模型 支持艺术和摄影创作
AI绘图模型RunDiffusion Photo图像生成Github开源项目HuggingfaceJuggernaut XL
Juggernaut-XL-v6是基于SDXL的高级图像生成模型,支持艺术、人像、电影风格、摄影等多种图像类型创作。该模型集成RunDiffusion Photo v1技术,提供强大的图像生成能力。目前仅供非商业用途,可通过RunDiffusion平台的Auto1111 Forge使用,不允许用于API服务。该项目由RunDiffusion团队开发,适合艺术创作者和摄影爱好者使用。
stable-diffusion-3-medium-diffusers - 先进的文本生成图像技术
MMDiTHuggingface模型文本生成图像GithubAI绘图开源项目非商业用途Stable Diffusion 3
Stable Diffusion 3 Medium 是 Stability AI 开发的文本生成图像模型,采用多模态扩散变换器技术。该模型在图像质量、文字渲染和复杂提示理解方面表现出色,同时提高了资源使用效率。它使用三个预训练文本编码器,能够根据文本描述生成高质量图像。该模型开放非商业研究用途,并提供商业授权选项。
ColoringBookRedmond-V2 - 基于SD XL 1.0的高质量着色书图像生成LORA模型
AI绘图模型SD XL 1.0ColoringBookAFGithubLORA着色书Huggingface开源项目
ColoringBookRedmond-V2是基于Stable Diffusion XL 1.0的LORA模型,专为生成高质量着色书图像而设计。经大规模数据集训练,该模型在着色书图像生成方面表现出色。使用'ColoringBookAF'和'Coloring Book'标签即可调用模型创作独特的着色书作品。由开发者artificialguybr创建,并获得Redmond.AI的GPU资源支持。
controlnet-union-sdxl-1.0 - ControlNet++:革新SDXL图像生成与编辑的多功能架构
图像生成图像编辑Huggingface模型ControlNet++GithubAI绘图开源项目Stable Diffusion
ControlNet++为Stable Diffusion XL模型带来全新架构,支持10余种控制条件,实现高分辨率图像生成和精细编辑。项目采用桶训练、海量高质量数据集和多种训练技巧,在保持参数量的同时,实现多条件融合和开源模型兼容。ProMax版本还增添去模糊、变体生成等高级功能,为图像处理提供更多可能性。
nsfw-xl - Stable Diffusion XL的LoRA模型用于生成成人内容
模型模型权重LoRA开源项目HuggingfaceStable DiffusionAI绘图GithubNSFW
nsfw-xl是一个基于Stable Diffusion XL的LoRA模型,用于生成成人内容图像。这个模型可以创建逼真的人物图像,适用于创作各种成人场景。它支持多种图像风格,如模拟胶片、复古效果和高细节渲染,为创作者提供了多样化的创作选择。
sd-turbo - 高效单步文本到图像生成模型
模型Github开源项目Huggingface图像生成AI绘图研究模型实时应用SD-Turbo
SD-Turbo是基于Stable Diffusion 2.1的蒸馏版文本到图像生成模型。采用对抗性扩散蒸馏(ADD)训练方法,能在1-4步内生成高质量图像。适用于实时应用研究、艺术创作和设计工具,支持512x512像素输出。虽可用于非商业和商业用途,但在人脸生成和文字渲染方面存在局限。该模型为研究小型蒸馏文本到图像模型提供了新的可能性。
3D_Render_for_Flux - 优化3D渲染技术和图像生成的应用
Github模型开源项目文本到图像3D renderAI绘图HuggingfaceFLUXdiffusers
基于Flux技术,探索高质量3D渲染和图像生成的潜力。利用特定关键词,可生成逼真的人物、动物及自然景观。无论是构建真实场景还是创作多彩角色,该项目提供了明确的指引满足创作者需求。基础模型由Black Forest Labs开发,并可遵循Apache-2.0许可证下载使用。
DreamWorksRemix - 梦工厂风格文本到图像生成器,适应多种提示
DreamWorks RemixHuggingface开源项目模型AI绘图生成模型GithubDreamWorksDreamWorks Diffusion
项目结合了DreamWorks与DreamWorks Diffusion模型,提供通用的文本到图像生成功能,不仅限于特定风格提示。它能生成带有梦工厂特征的高品质图像,例如节庆场景中的父女、蘑菇王国的公主等。所生成图像具备CGI水平的细节和8k分辨率,区别于传统方法,提供增强的视觉体验。