Project Icon

LECO

扩散模型概念调整的低秩适应技术

LECO是一个基于低秩适应技术的开源项目,专注于扩散模型中概念的擦除、强调和替换。该项目支持多种预训练模型,提供灵活的配置选项,并可在不同GPU平台上运行。通过精心设计的提示词和LoRA权重,LECO不仅可以擦除概念,还能进行概念调整。这为研究人员和开发者提供了探索和改进AI生成模型概念控制能力的有力工具。

LECO ✏️

在Colab中打开

用于从扩散模型中擦除概念的低秩适应。

原始仓库:从扩散模型中擦除概念

项目页面:https://erasing.baulab.info/

(不仅可以擦除概念,还可以通过设计提示词和LoRA权重来强调或交换概念。详情请参见ConceptMod

设置

conda create -n leco python=3.10
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu118
pip install xformers
pip install -r requirements.txt

训练

至少需要8GB显存。

python ./train_lora.py --config_file "./examples/config.yaml"

config.yaml:

prompts_file: "./prompts.yaml"

pretrained_model:
  name_or_path: "stabilityai/stable-diffusion-2-1" # 也可以使用.ckpt或.safetensors模型
  v2: true # 如果模型是v2.x版本则为true
  v_pred: true # 如果模型使用v-prediction则为true

network:
  type: "lierla" # 或 "c3lier"
  rank: 4
  alpha: 1.0

train:
  precision: "bfloat16"
  noise_scheduler: "ddim" # 或 "ddpm", "lms", "euler_a"
  iterations: 500
  lr: 1e-4
  optimizer: "AdamW"
  lr_scheduler: "constant"

save:
  name: "van_gogh"
  path: "./output"
  per_steps: 200
  precision: "bfloat16"

logging:
  use_wandb: false
  verbose: false

other:
  use_xformers: true

prompts.yaml:

- target: "van gogh" # 用于从中擦除正面概念的词
  positive: "van gogh" # 要擦除的概念
  unconditional: "" # 用于与正面概念取差的词
  neutral: "" # 目标条件的起点
  action: "erase" # erase或enhance
  guidance_scale: 1.0
  resolution: 512
  dynamic_resolution: false
  batch_size: 2

更多详细信息请参见示例配置

注意:您可以使用float16,但它不稳定且不推荐。请使用bfloat16或float32。

预训练权重

您可以在AUTOMATIC1111的webui上使用预训练权重。

🤗 HuggingFace: https://huggingface.co/p1atdev/leco

SDv1.5

  • 梵高风格(训练用于在SDv1.5上擦除"梵高风格"的概念)

梵高的自画像油画的结果:

van gogh

生成设置
oil painting of van gogh by himself
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 3870472781, Size: 512x512, Model hash: cc6cb27103, Model: v1-5-pruned-emaonly, Clip skip: 2, AddNet Enabled: True, AddNet Module 1: LoRA, AddNet Model 1: van_gogh_4_last(db68853d039b), AddNet Weight A 1: -1.0, AddNet Weight B 1: -1.0, Script: X/Y/Z plot, X Type: AddNet Weight 1, X Values: "-1, 0, 1", Version: v1.3.0

莫奈的风景画的结果:

monet

生成设置
painting of scenery by monet
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 1284787312, Size: 512x512, Model hash: cc6cb27103, Model: v1-5-pruned-emaonly, Clip skip: 2, AddNet Enabled: True, AddNet Module 1: LoRA, AddNet Model 1: van_gogh_4_last(db68853d039b), AddNet Weight A 1: -1.0, AddNet Weight B 1: -1.0, Script: X/Y/Z plot, X Type: AddNet Weight 1, X Values: "-1, 0, 1", Version: v1.3.0

SDv2.1-768

  • 蒙娜丽莎(训练用于在SDv2.1-768上擦除"蒙娜丽莎"的概念)

戴珠宝的蒙娜丽莎的结果:

mona lisa

生成设置
mona lisa with jewelry
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 3630495347, Size: 512x512, Model hash: 832eb50c0c, Model: v2-1_768-ema-pruned, Clip skip: 2, AddNet Enabled: True, AddNet Module 1: LoRA, AddNet Model 1: mona_lisa2_last(393beb35c4b1), AddNet Weight A 1: -1.0, AddNet Weight B 1: -1.0, Script: X/Y/Z plot, X Type: AddNet Weight 1, X Values: "-1, 0, 1", Version: v1.3.0

可爱猫咪的照片的结果:

mona lisa

生成设置
photo of a cute cat
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 900866192, Size: 512x512, Model hash: 832eb50c0c, Model: v2-1_768-ema-pruned, Clip skip: 2, AddNet Enabled: True, AddNet Module 1: LoRA, AddNet Model 1: mona_lisa2_last(393beb35c4b1), AddNet Weight A 1: -1.0, AddNet Weight B 1: -1.0, Script: X/Y/Z plot, X Type: AddNet Weight 1, X Values: "-1, 0, 1", Version: v1.3.0

WD1.5 beta3

  • 猫耳(训练用于在WD1.5 beta3上将"1girl"替换为"1girl, cat ears")

使用1.0~3.0的权重时,猫耳会被强制添加。

如果使用-1.0~-3.0的权重,猫耳将永远不会出现。

训练设置:请参见配置文件

cat ears

生成设置 ```yaml 杰作,最佳品质,卓越,最佳美学,动漫,1个女孩,校服,上半身,微笑 反向提示词:最差品质,低质量,糟糕的美学,最老的,错误的解剖结构,糟糕的手,文字,错误,缺少手指,多余的数字,更少的数字,裁剪,jpeg伪影,签名,水印,用户名,模糊 步数:20,采样器:Euler a,CFG比例:7,种子:4103955758,尺寸:512x512,模型哈希:d38e779546,模型:wd-beta3-base-fp16,Clip跳过:2,脚本:X/Y/Z图,X类型:AddNet权重1,X值:"0, 2, 3, 4",版本:v1.3.0 ```

非真实(训练以消除"真实"、"现实生活"、"Instagram"在WD1.5 beta3上的效果)

训练设置:参见配置文件。

带有"现实生活,Instagram":

不带"现实生活,Instagram":

参考文献

我深受以下项目的启发,我的工作依赖于这些杰出的项目。我想对这些项目及其开发者表示深深的感谢:

  • 从扩散模型中消除概念

    • ESD演示
  • 用于快速文本到图像扩散微调的低秩适应

  • 用于Stable Diffusion的训练、生成和实用脚本

  • 使用DSL修改扩散模型中的概念

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号