Animagine XL 3.1 项目简介
项目背景
Animagine XL 3.1 是一个专注于动漫风格图像生成的文本到图像模型,作为 Animagine XL V3 系列的更新版,相较于其前身 Animagine XL 3.0 具有更高的图像生成质量。此项目是一个开源项目,旨在为动漫爱好者、艺术家以及内容创作者提供准确且细致的动漫角色图像。
模型详情
- 研发者: Cagliostro Research Lab
- 合作方: SeaArt.ai
- 模型类型: 基于扩散的文本到图像生成模型
- 模型描述: Animagine XL 3.1 能够从文字提示生成高质量的动漫图像,具备增强的手部解剖、概念理解与提示解析能力。
- 许可证: Fair AI Public License 1.0-SD
- 微调基于: Animagine XL 3.0
Gradio & Colab 集成
用户可以通过以下途径试用模型:
使用指南
标签排序
为了获得最佳结果,建议按照结构化的提示模板进行书写,因为模型是基于这种格式训练的:
1girl/1boy, 角色名称, 出自何系列, 其他信息可随意排序。
特殊标签
Animagine XL 3.1 使用特定的标签来引导图像结果,提升质量、评级、创作日期与美感。这些标签可以帮助获得更好的生成效果。
- 质量修饰符:定义从最高到最低的图像质量,从
masterpiece
到worst quality
。 - 评级修饰符:从通用到敏感内容进行标记,如
safe
或sensitive
。 - 年代修饰符:指示图像风格的年代,如
newest
或oldest
。 - 美感标签:根据视觉吸引力进行分类,如
very aesthetic
。
推荐设置
为了生成高美感图像,建议在提示前添加:
masterpiece, best quality, very aesthetic, absurdres
并使用较低的指导参数(CFG 比例 5-7),采样步骤低于 30,以及使用 Euler Ancestral(Euler a)作为采样器。
多分辨率支持
此模型支持生成以下分辨率的图像:
1024 x 1024
(1:1)1152 x 896
(9:7)896 x 1152
(7:9)- 其他分辨率如
1216 x 832
,1344 x 768
等。
训练与超参数
Animagine XL 3.1 使用 2 台 A100 80GB GPU 进行训练,总共耗时约 350 GPU 小时。训练过程包括三个阶段:预训练、第一次微调与第二次微调,各阶段分别使用不同的学习速率和优化器进行优化。
模型局限性
尽管 Animagine XL 3.1 在动漫风格图像生成方面取得了显著进展,但仍存在一些局限性:
- 动漫专注:仅适合生成动漫风格图像,不适用于现实照片。
- 提示复杂性:对短或简单提示的高质量生成支持有限。
- 提示格式:优化Danbooru风格标签,需调整提示格式以获得最佳效果。
- 解剖与手部细节:尽管改善了一些,但可能仍存在不理想的结果。
- NSFW 内容:可能生成 NSFW 内容,需谨慎使用。
总之,Animagine XL 3.1 作为吸睛动漫图片生成的强大工具,为艺术家、设计师以及爱好者提供了更高品质的创作体验。