#文本到图像扩散模型

AlignProp: 革命性的大规模文本到图像扩散模型对齐方法

2 个月前
Cover of AlignProp: 革命性的大规模文本到图像扩散模型对齐方法

TheChosenOne:一个实现文本到图像扩散模型中一致性角色生成的开源项目

2 个月前
Cover of TheChosenOne:一个实现文本到图像扩散模型中一致性角色生成的开源项目

Custom Diffusion: 多概念定制化的文本到图像扩散模型

3 个月前
Cover of Custom Diffusion: 多概念定制化的文本到图像扩散模型
相关项目
Project Cover

custom-diffusion

该项目提供了一种高效的文本到图像扩散模型微调方法。只需调整部分模型参数,即可在短时间内完成训练,并减少存储需求。项目还支持多概念组合,附带新数据集和完整的训练步骤。适用于多种类别和应用场景。

Project Cover

TheChosenOne

TheChosenOne项目是《The Chosen One: Consistent Characters in Text-to-Image Diffusion Models》论文的非官方PyTorch实现。该项目使用Diffuser框架,致力于在文本到图像扩散模型中实现一致性角色生成。项目提供训练和推理指南,计划支持ControlNet和局部图像编辑功能。基于diffuser 0.24.0.dev0版本开发,并包含详细的安装和配置说明。

Project Cover

AlignProp

AlignProp是一种创新的文本到图像扩散模型优化方法,通过端到端反向传播奖励梯度来实现。该方法能有效对齐模型与下游任务目标,包括图像-文本语义一致性、美学质量和可控性。相比传统强化学习方法,AlignProp能在更少训练步骤内获得更高奖励,并且概念简单,为扩散模型优化提供了高效直接的解决方案。

Project Cover

MagicTailor

MagicTailor 是一个创新的系统,专注于文本到图像生成中对视觉组件的个性化控制。通过引入动态遮蔽降解和双流平衡技术,解决了语义污染和不平衡的问题。系统支持对视觉概念中的特定组件进行精确调整,为多领域应用提供了可能性,如独立生成、组件控制以及增强其他生成工具。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号