#文本到图像扩散模型
custom-diffusion - 文本到图像扩散模型微调方法
Custom DiffusionStable Diffusion文本到图像扩散模型图像生成多概念定制Github开源项目
该项目提供了一种高效的文本到图像扩散模型微调方法。只需调整部分模型参数,即可在短时间内完成训练,并减少存储需求。项目还支持多概念组合,附带新数据集和完整的训练步骤。适用于多种类别和应用场景。
TheChosenOne - 基于扩散模型的一致性角色生成非官方实现
The Chosen One文本到图像扩散模型PyTorch实现一致性角色生成Diffuser框架Github开源项目
TheChosenOne项目是《The Chosen One: Consistent Characters in Text-to-Image Diffusion Models》论文的非官方PyTorch实现。该项目使用Diffuser框架,致力于在文本到图像扩散模型中实现一致性角色生成。项目提供训练和推理指南,计划支持ControlNet和局部图像编辑功能。基于diffuser 0.24.0.dev0版本开发,并包含详细的安装和配置说明。
AlignProp - 通过奖励反向传播优化文本到图像扩散模型
AlignProp文本到图像扩散模型奖励反向传播图像生成模型微调Github开源项目
AlignProp是一种创新的文本到图像扩散模型优化方法,通过端到端反向传播奖励梯度来实现。该方法能有效对齐模型与下游任务目标,包括图像-文本语义一致性、美学质量和可控性。相比传统强化学习方法,AlignProp能在更少训练步骤内获得更高奖励,并且概念简单,为扩散模型优化提供了高效直接的解决方案。
MagicTailor - 个性化控制文本到图像生成中的视觉组件
AI工具MagicTailor组件控制个性化文本到图像扩散模型语义污染语义不平衡
MagicTailor 是一个创新的系统,专注于文本到图像生成中对视觉组件的个性化控制。通过引入动态遮蔽降解和双流平衡技术,解决了语义污染和不平衡的问题。系统支持对视觉概念中的特定组件进行精确调整,为多领域应用提供了可能性,如独立生成、组件控制以及增强其他生成工具。
相关文章