Plush-for-ComfyUI
使用 Groq 或开源 LLM 时,你不需要付费密钥来使用高级提示增强器。你可以免费使用它们(Groq 需要一个免费的密钥)。但如果你想将其与 ChatGPT 或 Claude3 一起使用,则: 如果你需要在 Plush 兼容的环境变量中设置你的 API 密钥或可选的开源密钥,请点击这里 来自Style_Prompt和Style_Prompt + OAI Dall-e3节点的Prompt和Image示例
更新:
2024年7月10日,太平洋标准时间上午11:45 版本未更改
- 优化级联示例: 添加了一个新的示例工作流程:AgentsExample.png,展示了使用Plush Advanced Prompt Enhancer和Plush Tagger节点创建一系列AI代理来提高生成图像提示时的指令遵守程度。另外还添加了Agent-ImageEvaluator.png,以评估图像与提示的吻合度。
- 代理混合示例: 示例工作流程展示了如何使用Plush Advanced Prompt Enhancer和Plush Tagger节点创建一个代理混合系统。研究论文在此
2024年7月6日,太平洋标准时间下午1:37 版本 1.21.11
- Advanced Prompt Enhancer和Style Prompt节点更新
- Advanced Prompt Enhancer:在AI Services列表中增加了LM Studio选择项。这是一个http: POST连接,因此您可以使用在LM Studio服务器屏幕首次启动时显示的聊天完成(例如:
http://localhost:1234/v1/chat/completions
)URL。 - Style Prompt:现在可以使用来自ChatGPT、Grog和Anthropic的远程服务和模型,而之前只能使用ChatGPT。因此,现在需要连接新的AI Chooser节点以选择要使用的服务和模型。Style Prompt的示例工作流程已更新以反映使用此新节点。
2024年5月23日,太平洋标准时间上午8:16 版本 1.21.10
- Advanced Prompt Enhancer和Tagger的次要更新
- 修复了数据顺序问题以适应LM Studio的API更改
- 修改Tagger,因此它不再在处理后的文本块末尾添加句号
2024年5月14日,太平洋标准时间下午4:27 版本 1.21.9
- Advanced Prompt Enhancer和Style Prompt的次要更新
- 添加了新的AI服务:http POST Simplified Data。这是一个http POST类型的连接,需要URL中的
v1/chat/completions
路径。它可以用于那些无法处理OpenAI标准嵌套数据结构的本地应用程序。相反,这使用了一个更平坦的简化数据结构。如果您无法使用其他AI服务方法连接到本地应用程序,特别是如果您遇到500范围内的服务器处理错误,这可能对您有用。 - 移除了在传递图像时自动选择具有视觉能力的ChatGPT模型。Style Prompt和Advanced Prompt Enhancer现在将仅应用您选择的模型。如果您尝试将图像发送到不具有视觉能力的模型,该模型现在只会报告无法处理您的数据。
2024年4月26日,太平洋标准时间上午11:47 版本 1.21.8
- Advanced Prompt Enhancer,现在支持Anthropic (Claude) 和 Grog连接
- Grog是一个免费服务,提供最新高质量开源模型(包括新的Llama 3模型(llama3-70b和llama3-8b)和Mixtral-8x7b)的远程推理平台。
- Anthropic是一项付费服务,提供3个Claude模型的远程推理服务,这些模型被认为与ChatGPT模型大致相当。
- 两项服务都要求您从其网站获取API密钥。Plush要求将API密钥存储在环境变量中(参见此处的说明)
- 新节点:'Tagger' 此节点允许您向任何文本块添加标签。标签可以添加到文本块的开头、中间或结尾。这有助于向AI生成的提示添加lora、加权文本或其他提示特定标签,也可以用于标记任何文本输出。
2024年4月14日,太平洋标准时间下午2:01 版本 1.21.7
- Advanced Prompt Enhancer, 新连接类型: 'OpenAI compatible http POST' 这种连接类型使用web POST连接,而不是OpenAI API对象连接到LLM前端的本地服务器。
- Oobabooga API连接: 此连接现在自动格式化URL以包括
/v1/chat/completions
路径。此连接现在包括用户提交中的指令(角色:系统)和提示(角色:用户),以解决Oobabooga忽略系统指令的问题。
2024年3月24日,太平洋标准时间下午12:16 版本 1.21.6
- Advanced Prompt Enhancer, 新连接类型: Oobabooga Textgen Webui API已经坏了几周,导致出现'None Type'错误。为了解决这个问题,我添加了一种新的Oobabooga连接类型Oobabooga API-URL,它使用http POST连接而不是OpenAI API对象。在LLM选择字段中选择此项,并提供包含路径:
/chat/completions
的URL。例如,这种类型连接的URL看起来像这样:http://127.0.0.1:5000/v1/chat/completions
。然而,使用这种连接方法与Oobabooga TG似乎只能看到提示,而看不到指令或示例。 - 您可以使用密钥与开源LLM产品: 如果您希望使用密钥,可在环境变量中定义一个名为
LLM_KEY
的密钥,与LLM前端、API或其他产品一起使用。虽然这些产品通常是免费的,但有些使用密钥来保证安全和隐私。如果您想使用密钥,只需在环境变量中创建带有密钥的变量,它将自动应用于任何与LLM产品(除ChatGPT外)的连接。如果您在另一个环境变量中有OpenAI ChatGPT密钥,它不会受影响,选择ChatGPT连接类型时将分别使用。
2024年3月19日,太平洋标准时间下午2:36 版本 1.21.5
- Advanced Prompt Enhancer现在可以提供图像文件作为输入,以生成具有"视觉"能力的开源LLM的文本。 许多开源LLM前端现在集成了能解释图像文件的视觉模型(例如Koboldcpp的最新更新)。Advanced Prompt Enhancer现在可以将图像文件发送到这些开源模型以包括在推理过程中。您可以通过“Instruction”输入向模型提供如何解释图像的指示,并且您可以通过“prompt”输入添加要包含在输出中的其他元素。
- Exif Wrangler现在会从JPG照片中提取GPS定位数据。
2024年3月11日,太平洋标准时间下午8:38 版本 1.21.4
- 没有OpenAI API密钥的用户的错误修复:Advanced Prompt Enhancer抛出错误,因为它无法创建其模型列表,除非用户有一个有效的付费OpenAI API密钥。此错误已被修复,没有密钥的用户应该可以正常使用其开源LLM。
2024年3月7日,太平洋标准时间下午11:00 版本 1.21.3
- 新节点:Advanced Prompt Enhancer,可以使用开源LLM: 使用开源LLM(通过前端应用如LM Studio);或使用ChatGPT/ChatGPT-Vision根据您的指令、提示、示例、图像或它们的任意组合来生成提示或其他生成文本。开源连接通过OpenAI API工作,不需要OpenAI账户或密钥。这提供了与LLM前端(如LM Studio)的连接。到目前为止,只在LM Studio上进行了测试,但应适用于任何能够接受OpenAI API对象输入的LLM前端。使用ChatGPT模型(包括GPT视觉模型)确实需要API密钥。更多详情请参见节点的帮助输出中的帮助文件。
- 此节点主要由Alessandro Perilli 设计,点击查看他的综合ComfyUI 'AP工作流'。
2024年2月19日,太平洋标准时间下午12:20 版本 1.20.3
- OAI Dall-e3节点现在可以创建最多8张图片的批次
- OAI Dalle-e3节点现在有一个模拟的‘种子’值:虽然种子值不会影响潜在值或图像,但如果设置为:“随机化”或“增减”,则允许Dall-e节点在每个队列中自动运行。如果您希望拥有默认行为,即每个提示仅运行一次,或其设置被更改,请将种子设置为“固定”。
2024年2月13日,太平洋标准时间下午4:40 版本 1.20
- 一个不需要OpenAI API密钥的新节点,Plush Exif Wrangler: Exif Wrangler将从.jpg(.jpeg)和.png图像中提取Exif和/或AI生成工作流元数据。可以查询.jpg照片的相机设置。ComfyUI的.png文件将显示其工作流中的某些值,包括提示、模型、种子等。其他AI生成器的图像可能会也可能不会显示数据,这取决于它们将元数据存储在哪里。例如,Auto 1111的.jpg会显示存储在其Exif注释中的工作流信息。
- Exif Wrangler提供将您的AI生成或Exif信息保存到文件的选项: 文件存储在 ..ComfyUI/output/PlushFiles中,目录将在您保存第一个Exif文件时创建。
- Exif Wrangler节点可以在没有OpenAI API密钥的情况下使用。
- Plush节点现在包括故障排除输出: 此输出将显示Plush日志功能在文本显示节点中捕获的INFO/WARNING/ERROR数据。日志在您按下队列按钮时开始,并仅涉及单个Plush节点。
- Plush现在创建并维护一个日志文件: Plush-Events.log。它在*..ComfyUI/custom_nodes/Plush-for-ComfyUI/logs*目录中。目录将在您首次运行此版本时创建。
- 一个新的示例工作流集替换了示例工作流目录中的旧版,并添加了Exif Wrangler的示例工作流。
2024年1月21日 @7:09PM PST 撤销部分版本1.16中的改动
- 为促进“少量示例”学习而添加的两个示例集对ChatGPT来说太混乱,我不得不恢复到没有示例。“少量示例”学习是向LLM提供指令和几个所需响应的示例。但风格提示的指令太复杂,无法与示例混合。当我尝试时,ChatGPT完全搞砸了。所以这已经恢复到没有示例。
2024年1月16日 @1:00PM PST 版本1.16
- 版本1.16,修复了未连接的输入和它们生成的“未定义”值,并在提示请求中添加了一组示例。这将促进生成提示的“少量示例”学习。
- 新增了一个示例工作流:StylePromptBaseOnly.png 在 Example_Workflows 目录中,这是一个使用一个KSampler而不使用Refiner的StylePrompt工作流。
2024年1月8日 @6:00pm PST 版本1.15
- 版本1.15,新增了一个UI字段:'prompt_style'和一个'Help'输出到style_prompt节点
- prompt_style:让你在以下之间选择:
- Narrative:一种长篇创意写作方式的提示风格,句子语法正确。这是Dall_e的首选形式。
- Tags:一种简洁的提示风格,没有连接词或语法短语。这是Stable Diffusion和Midjourney的首选形式。
- Help:附加一个文本输入显示节点,获得对style-prompt中各种UI字段的解释。
2024年1月7日 @4:07 PST
- 添加了两个新的开关实用节点 两个开关允许你在多行配置中使用文本原语。一个是三进一出的多行文本开关,另一个是三进一出的多行文本和图像开关。
2024年1月5日 @12:02pm PST: 版本1.10
- Plush-for-ComfyUI不再从.json文件中加载你的API密钥 你现在必须将你的OpenAI API密钥存储在环境变量中。请参见以下说明:
- 在“示例工作流”目录中添加了一个新的示例工作流.png 此工作流反映了Style Prompt节点的新功能。
2023年12月29日 @4:24pm PST:
- 新功能: Plush-for-ComfyUI style_prompt现在可以使用图像文件生成文本提示。图像文件可以单独使用,或与文本提示一起使用。ChatGPT会根据其对输入的评估生成基于图像或图像+提示的文本提示。这不是exif提取,它不会再现生成该图像的原始提示,而是ChatGPT对图像或图像+提示的解释。
Plush包含三个启用了OpenAI的节点。它还包含不需要OpenAI API的节点:两个多行开关、高级提示增强器和一个Exif/AI元数据(提示、种子、模型等)提取器。
样式提示:接受你的:文本提示、图片或文本提示和图片,以及你指定的艺术风格,并生成一个来自ChatGPT3或4的提示,Stable Diffusion和/或Dall-e可以使用该提示生成该风格的图像。
高级提示增强器:接受你的:提示、指令、图片、示例,并生成可以是提示或其他输出(例如标题)的文本输出。该节点可以与某些开源LLM前端(例如LM Studio)或ChatGPT一起使用。
OAI Dall_e 3:接受你的提示和参数,并在ComfyUI中生成一个Dall_e3图像。
切换节点:允许你处理多个多行文本输入。
Exif猛龙:从.jpg(.jpeg)和.png图像中提取Exif和/或AI生成的工作流元数据。
安装:
通过ComfyUI管理器安装:
- 启动管理器。
- 点击安装自定义节点。
- 搜索“Plush”
- 找到“Plush-for-ComfyUI”
- 点击安装。
手动安装:
如果您还没有在Plush for ComfyUI Github页面,请通过链接访问。
点击页面右上角的绿色代码按钮。当标签下拉时,点击URL右侧进行复制。
然后在您的计算机上的命令窗口中导航到 ComfyUI/custom_nodes 文件夹,输入以下命令:
git clone https://github.com/glibsonoran/Plush-for-ComfyUI.git.
cd Plush-for-ComfyUI/
python -m pip install -r requirements.txt
要求:
您的OpenAI API或开源密钥[可选](Exif猛龙、切换节点或在与开源LLM一起使用时不需要高级提示增强器):
-
对于样式提示和Dall-e节点,你需要一个有效的OpenAI API密钥。
-
对于高级提示增强器,如果你打算与ChatGPT、Anthropic或Groq模型一起使用,你将需要一个有效的API密钥;如果你只是与开源LLM一起使用,则不需要。
-
一些开源产品使用免费密钥来提高安全性和隐私性,因此你可以选择创建一个密钥。大多数这些产品不使用密钥,因此如果你没有密钥也不用担心。
-
OpenAI API和Anthropic密钥需要付费账户,如果你想使用开源密钥,它们通常是免费的。Groq API密钥也是免费的。从他们的网站生成密钥。
以下表格列出了Plush识别的环境变量及其包含的API密钥应用方法。
环境变量 Anthropic Groq OpenAI ChatGPT 开源(例如Tabby API) OAI_KEY
X OPENAI_API_KEY
X LLM_KEY
X X X GROQ_API_KEY
X ANTHROPIC_API_KEY
X
- 你应该在OpenAI API密钥的使用上设置一个合理的金额限制,以防止密钥被泄露导致的巨额账单。 你可以在OpenAI网站的账户设置中设置金额限制。
-
安装和使用Plush-for-ComfyUI即表示你接受因密钥泄露所造成的任何损失的责任。 Plush-for-Comfy使用OpenAI推荐的安全措施(环境变量)存储你的密钥,以确保你的安全。
-
关于ChatGPT,你可以选择创建一个特定于Plush的环境变量名为:
OAI_KEY
并在其中存储API密钥,或者若你更喜欢,可以使用OpenAI标准环境变量:OPENAI_API_KEY
。 -
你还可以在环境变量
LLM_KEY
中为开源产品创建密钥。尽管开源产品通常是免费使用的,但有些产品出于安全和隐私考虑会使用密钥。 -
Plush首先寻找'OAI_KEY' 变量,如果没有,则寻找'OPENAI_API_KEY'。使用'OAI_KEY' 变量将允许你为Plush生成一个单独的密钥,并单独追踪这些费用,如果你其它的OpenAI API应用程序使用标准变量。无论哪种方式,如果你想使用ChatGPT作为推理引擎,你需要定义至少一个有效的活动密钥给这两个环境变量之一。对于开源产品,一旦你在'LLM_KEY'中填写了你的密钥值,它将自动应用于所有非ChatGPT连接。上述表格中的环境变量适用于其他受支持的AI服务。
-
如果你需要创建一个新的环境变量,请参阅以下如何创建并将其值设置为你的API密钥的说明:
如何设置环境变量
环境变量是设置在操作系统上而不是应用程序中的变量。它由名称和值组成。对于付费ChatGPT密钥,你可以将变量名设置为:OAI_KEY
或 OPENAI_API_KEY
。如果你使用的是需要或可以使用密钥的开源产品(大多数不需要),请使用环境变量:LLM_KEY
。根据上表中的指引,示例仅涉及'OAI_KEY',但你可以根据上表替换为适合你的环境变量名。
请注意,在设置环境变量后,你需要重新启动计算机才能生效。
Windows设置
选项1:通过cmd提示设置‘OAI_KEY’ 环境变量
在cmd提示中运行以下命令,将
setx OAI_KEY (yourkey)
你可以通过打开新的cmd提示窗口,并键入以下命令来验证此变量是否已设置:
echo %OAI_KEY%
选项2:通过控制面板设置‘OAI_KEY’ 环境变量
-
右键点击Windows启动按钮并选择“系统”,然后选择“高级系统设置”。
-
选择“环境变量...”。
-
从用户变量部分(顶部)选择“新建…”。添加你的名称/键值对('OAI_KEY/'jk-####'),将(yourkey)替换为你的API密钥。
变量名:OAI_KEY 变量值:(yourkey)
Linux / MacOS 设置
选项1:使用zsh设置‘OAI_KEY’ 环境变量
- 在你的终端中运行以下命令,将yourkey替换为你的API密钥:
echo "export OAI_KEY=(yourkey)" >> ~/.zshrc
- 使用新变量更新shell:
source ~/.zshrc
- 使用以下命令确认你已设置环境变量:
echo $OAI_KEY
API密钥的值将作为结果输出。
选项2:使用bash设置‘OAI_KEY’ 环境变量
按照选项1的说明操作,将.zshrc替换为.bash_profile。
你已经完成设置!现在起,Plush可以在启动ComfyUI时加载你的密钥。
更多要求:
-
你需要安装ComfyUI,建议你安装基础和精炼的SDXL模型,因为这些模型是此节点设计和测试的对象,它还似乎与新的OpenDalle模型非常配合。样式提示节点依赖于具有广泛标注了艺术风格和艺术家的图像模型。我认为SDXL的基础和精炼模型最适合这个用途。
-
Plush需要OpenAI Python库版本1.3.5或更高版本。这应该由此包中的"requirements.txt"文件处理。如果你之前使用过与ChatGPT通信的早期节点,你可能拥有早期版本的此库。如果由于某种原因安装Plush 未能升级此库,你可以通过以下命令手动升级:
-
pip install --upgrade openai
在某个目录或虚拟环境中使其应用于ComfyUI使用的Python安装。
-
请注意,在某些情况下,新的OpenAI API与旧的API不兼容,使用旧库的应用程序可能在此次升级后停止运行。
使用方法:
我建议开始时使用SDXL基础和精炼模型的完整版本,这些模型具有与此节点配合良好的艺术风格和艺术家标注。你会在custom_nodes/Plush-for-ComfyUI/Example_workflows目录中找到一个工作流图像。如果你想快速设置,直接将此图像拖到浏览器中的ComfyUI工作区,它将自动加载图表。 新的OpenDalle模型也推荐使用。样式提示不适用于像LCM那样依赖低cfg值的快速打印/涡轮工作流。为了获得正确的风格效果,Stable Diffusion必须实现相当详细的提示的大部分或全部,而这些工作流无法全部拾取。至少在初期,我建议你使用更基本的SDXL工作流和模型。 图示提示的新功能是能够解读图像,并使用新的ChatGPT视觉模型将其转换为稳定扩散提示。如果你决定在输入中使用图像,无论选择哪种GPT模型,都将使用"gpt-4-vision-preview"模型。因为这是唯一能处理图像输入的模型。
你可以使用此功能来:
- 从你喜欢的图像中获取提示创意
- 通过选择不同的艺术风格应用于图像解释来迭代图像主题
- 添加自己的文本提示到图像中,以创作出与你输入图像类似但具有附加视觉元素的图像
- 或者,当然,还可以进行任何其它你能想到的创意过程
风格提示:
输入:
prompt: 你的提示,它不需要冗长或复杂,简洁的提示效果更佳。
image (optional): 在此添加一个"加载图像"或其它带有图像输出的节点。图像将由ChatGPT解读并生成稳定扩散的提示。你可以仅包含图像,或同时包含图像和提示。在后一种情况下,ChatGPT将同时解释提示和图像。当包含图像进行解释时,风格提示将自动使用OpenAI的"Vision"模型(gpt-4-vision-preview),而不是在"GPTmodel"字段中选择的模型。因为这是唯一接受图像输入的ChatGPT模型。
example (optional): 一个你希望ChatGPT生成提示的文本示例。风格提示中有一个默认示例效果很好,但你可以使用此输入覆盖默认示例。示例主要用于写作风格,与提示的主题是否相关并不重要。
输出:
CGPTprompt: ChatGPT为你的图像生成的提示,这应连接到CLIP节点。或者你也可以在风格提示和CLIP节点之间内联一个文本显示节点,或者作为此输出的一个独立分支。在任何情况下,文本显示节点都会显示ChatGPT生成的提示。
CGPTInstruction (optional): 这将显示随提示一起发送给ChatGPT的说明。该说明告诉ChatGPT如何处理提示。每次都是一样的,所以你很快就会发现没必要连接这个输出。
Style Info (optional): 如果style_info UI控制设置为"true",这将输出一个简短的背景信息,描述你选择的艺术风格:显示该风格的重要特征、历史以及一些在该风格中有影响力的艺术家的名字。要使用这个功能需要连接到文本显示框。
Help: 连接一个文本显示节点到这个输出,并按下队列按钮,以查看解释UI输入元素功能的简要帮助文件。
UI输入:
GPTModel (default gpt-4): 生成提示的ChatGPT模型。GPT-4比GPT-3.5 turbo效果更好,但3.5使用成本稍低。新引入了的GPT-4Turbo。
Creative_lattitude (default 0.7): 这非常类似于KSampler中的cfg。这是AI模型在创意解释你的提示、示例和说明时的自由度。较小的数字使模型严格遵循你的输入,较大的数字给它更多的自由来即兴创作。实际范围是0.1到2.0,但我发现1.1或1.2以上是胡言乱语。所以我将范围限制在1.2,甚至我通常不超过0.9。
Tokens (default 500): ChatGPT在提供提示时可以使用的token数量上限。API的付费使用是基于使用的token数量。这并不是ChatGPT会使用的数量,而是它可以使用的数量上限。如果你想严格控制成本,可以尝试最低的token数量来获得好的提示。我通常将其设置为500。
Style (default Photograph): 这是风格提示的核心。我列出了一长串艺术风格可供选择,并且指示ChatGPT根据所选风格来构建提示。节点的效果取决于ChatGPT对艺术风格的理解,对该风格中的艺术家的知识,以及最能与该风格相关的描述元素。
Artist (default 1, range: 0 - 3): 是否包含带有你选择的风格中1到3名艺术家的名字的"风格的"声明。如果设置为1或更高,风格提示在描绘所选风格时效果更好。如果不想包含艺术家,设置为0。
prompt_style (default, Tags): 让你在两种提示风格之间选择:叙述:一种长篇的创意写作风格,有语法正确的句子。这是Dall_e的首选形式。标签:一种简短的风格,没有连接词或语法短语的视觉元素列表。这是稳定扩散和Midjourney的首选形式。
Max_elements (default 10): ChatGPT在生成提示时包含的最大描述元素数量。稳定扩散对提示开头的文本给予最高权重,后续文本的权重逐渐减小。长篇的SD提示最终会产生边际效应下降的情况。这个输入让你控制提示的长度。范围是3到25。我认为6到10效果最好。
Style_info (default false): 如果设置为true,风格提示将向ChatGPT发送第二个请求,让其提供所选风格的描述、历史信息以及一些最有影响力的艺术家的信息。
示例:
提示:鱼眼镜头照片,一位快乐的年轻女子在繁华的市中心街道上,扭曲的透视下她的笑容被放大了,高楼大厦在她周围弯曲成超现实的鱼缸效果,窗户反射着灿烂的午间阳光,周围的人群和交通在边缘处显得如同微型人物,停放的车辆被拉长和扭曲成奇异的形状,头顶的蓝天被扭曲成旋涡状的穹顶,Justin Quinnell风格。
提示:高调摄影,一位黑色时代的女演员,鲜红的唇膏,闪闪发光的钻石首饰,柔焦背景,奢华的毛皮披肩,珍珠般的光效,戏剧性的高对比度阴影和镜面倒影,Terry O'Neill风格。
提示:数字艺术,女性肖像,抽象元素,红发,波尔卡圆点,鲜艳色彩,对比,几何形状,超现实主义,浓烈的妆容,滴漆效果,大眼睛,风格化特征,Patrice Murciano风格,Aya Kato风格。
提示:奇幻艺术,一位光芒四射的年轻女子,她的眼睛散发着神秘的光芒,身披星光披风,站在庞大的都市丛林中,建筑物沐浴在柔和的暮光中,风格化的涂鸦壁画脉动着神秘能量,天上的星座注视着一切,Yoshitaka Amano风格。
(Dall-e3节点) 提示:明暗对比艺术:女性战士,侧面图,低调照明,光影对比,详尽的战袍,动物皮毛,飘逸的黑发,血迹斑斑的脸,胜利的光芒,挑战的风姿,呼气的姿势,阴郁的雷雨天空,远处的闪电,胜利的长矛,穿高跟鞋,皮制手环,羽饰项链,钢制胸甲,战斗条纹,锈迹斑斑的长矛,裂痕的盾牌,泥泞的战场,倒下的敌人,Mario Testino风格。
提示:低调摄影,一位年轻女子,被单一的戏剧性光源照亮,怀抱一只小狗,狗的毛皮在光影间闪烁,在深沉不可穿透的阴影背景下,周围空间充满了柔和的阴影低语,背景中几乎无法辨认的窗户低调存在,光源创造出主体和周围环境的强烈对比,Bill Henson风格。
(Dall-e3节点) 提示:高调摄影,阳光炙烤的索诺兰沙漠景观,巨大的仙人掌轮廓在明亮的无云天空下,弯曲的沙丘在强烈的正午光照下,遥远的山脉变成了幽灵般的轮廓,光影的游戏突显了沙漠的质感,每一粒沙子都在发光,一切都沐浴在灿烂的光芒中,Michael Frye风格。
源文本:
Prompt: 时尚素描,一位身着灰色流动连衣裙、点缀着鲜艳黄色饰品的高挑模特,摆在极简的白色背景前,锐利的线条勾勒出她的轮廓,戏剧化的光影对比突显出面料的质感,她的目光集中而强烈,散发出一种优雅气息,她那神秘的微笑暗示着一个未被讲述的故事,黄色的帽子作为最后的点缀,风格类似于Hayden Williams。
Prompt: 生物形态抽象画,超现实主义肖像,女性形象,高对比度,放大的眼睛,光亮的嘴唇,多彩的色彩飞溅,几何形状,滴落的油漆,单色背景,风格化特征,锐利的阴影,动态的构图,风格类似于Kandinsky和Joan Miró。
Prompt: 长时间曝光摄影,捕捉到一艘孤独的蓝色帆船,帆完全张开,滑行在光滑如镜的海面上,在满月的如梦似幻的光芒下。画面框架突显出夜色海洋深蓝色的浓烈与月光制造的银色路径的微妙对比。 帆船的位置略微偏离中央,向右航行,吸引观众的目光跟随其旅程。黑暗笼罩着整个场景,月亮的倒影成为主要的光源,创造出一种宁静而神秘的氛围。构图简约,强调光影的相互作用,帆船在海洋如镜面的质感,以及海天合一的无限地平线,风格类似于Michael Kenna。
Prompt: 装饰艺术,一位身着优雅几何图案连衣裙的年轻女子,在宝石般的夕阳映衬下,她的剪影犀利,站在整洁的草地山丘顶端,她的眼睛闪烁着城市天际线的倒影,由一座座流线型摩天大楼组成,她的手轻轻握着一个优雅亮片手拿包,头戴羽饰帽,一头短发在低垂的大月光下闪耀,风格类似于Tamara De Lempicka。
Prompt: 祖鲁城市艺术,详细的女性肖像,半剃的头发伴有金色头发,几何图案,强烈的对比,抽象的形状,鲜艳的色彩,滴落的油漆,超现实的构图,富有表现力的眼睛,红唇,波尔卡圆点,现代时尚,风格类似于Kobra, Shepard Fairey。
Prompt: 折纸艺术,一位身穿精美折纸设计、绿宝石色衣服的年轻女子,站在草地山丘上,远处是一座美丽的城市天际线,在湛蓝的纸天空下,太阳投下长长的阴影,整个场景笼罩在柔和的暖光中,风格类似于Robert J. Lang。
Prompt: 时尚艺术,中心站立的一位穿着前卫蓬松薄纱礼服的年轻女子,这件礼服从她的脚下向草地山丘上流动,头戴装饰华丽的巨大羽毛帽,凝望远方,神秘而忧郁的目光,身后是一大片城市天际线作衬托,风格极具戏剧性,类似于Alexander McQueen。
我不会详细介绍这个节点。关键是它接受你的提示并生成一张图像。目前它只能使用dall_e3,因为所需的输入值与dall_e2相差太大,不值得包含dall_e2。dall_e3会生成更好的图像,所以我认为不必兼顾dall_e2。
你应该注意到,在API实现中,Dall_e完全重写了你的提示,以试图控制滥用。这个节点中,dall_e_prompt输出的文本就是这个重写的提示。这会导致一些奇怪的结果,有些提示甚至会生成ComfyUI错误,因为Dall_e报告提示违反了他们的政策。甚至可能涉及一些非常无害的主题。目前,我认为内置于Edge浏览器的Dall_e引擎提供的结果比API更好,但偶尔也会有好运气。