#文生图
Awesome-Chinese-Stable-Diffusion
这个项目汇集了丰富的中文Stable Diffusion资源,涵盖开源模型、应用、数据集和教程。收录了10多个开源中文文生图模型,包括SkyPaint、Pai-Diffusion、Taiyi等重要模型,以及阿里云、达摩院等机构的相关成果。覆盖通用领域和特定场景如古诗配图、二次元动漫等。旨在为中文社区提供全面的SD资源,推动AI艺术创作与研究的发展。项目内容不断更新,欢迎社区参与贡献。
Awesome-Text-to-Image
项目汇集了文本到图像生成与编辑技术的各类资源,包括定量评估指标、训练数据集、开源代码实现及相关学术论文。内容全面且持续更新,涵盖该领域最新进展,可为研究人员和开发者提供有价值的参考信息。
PixArt-sigma
PixArt-Σ是一个基于Diffusion Transformer的文本到图像生成模型。通过Weak-to-Strong训练方法,该模型支持4K分辨率生成,采用300长度T5 token和SDXL VAE。相比前代PixArt-α,PixArt-Σ具有更强的生成能力。项目提供开源代码、多种分辨率预训练权重、diffusers库集成支持和在线演示。
PaddleMIX
PaddleMIX是基于飞桨的多模态大模型开发套件,支持图像、文本、视频等多种模态,覆盖视觉语言预训练、文生图、文生视频等任务。该套件提供开箱即用的开发体验,支持千亿规模模型训练,适用于金融、教育、电商、医疗等多个领域。PaddleMIX 2.0版本新增了LLaVA、Qwen-VL等模型,优化了训练效率,并提供了丰富的应用工具和流水线,为开发者提供全面的多模态AI解决方案。
ChatGPT-Video-Parsing
该项目是一个多功能Web应用,集成了VIP视频解析、音乐播放、ChatGPT对话和AI绘图等服务。用户可免费获取海量视频资源,享受智能对话和语音交互体验。基于Vue2和SpringBoot开发,项目提供流畅的用户界面和稳定的后端支持,为用户带来便捷的娱乐和AI交互体验。
wai-doll-cn-v2-sdxl
wai-doll-cn-v2-sdxl是基于Stable Diffusion XL的开源模型,专注于生成动漫风格和3DCG图像。该模型融合了二次元艺术与3D计算机图形技术,为创作者提供了多样化的视觉表现工具。作为开源项目,它允许用户进行自定义和二次开发,推动了AI艺术创作的边界。
atomix-pony-anime-xl-v3-sdxl
atomix-pony-anime-xl-v3-sdxl是基于Stable Diffusion XL的文本到图像生成模型,专注于创建动漫风格的小马图像。该模型结合动漫美学和小马特征,可生成独特的小马角色。适用于插画、动画和游戏设计等创意项目,为创作者提供了一个实用的图像生成工具。
sdxl-flash
SDXL Flash作为SDXL的改进版本,在生成速度与图像质量间实现了较好的平衡。虽然生成速度略逊于LCM、Turbo等模型,但输出质量更高。模型推荐参数为6-9步数、2.5-3.5 CFG值,配合DPM++ SDE采样器使用。开发者可借助Diffusers库轻松集成此模型,满足快速高质量图像生成需求。
Fooocus
Fooocus是一款结合Stable Diffusion开源特性和Midjourney简易操作的AI图像生成软件。它自动优化内部流程,用户只需关注提示词和图像即可。软件支持放大、变化和局部重绘等功能,具有独特的提示词处理引擎。Fooocus适用于Windows、Linux和Mac平台,最低需4GB显存。安装便捷,界面直观,为AI艺术创作提供便利。