#潜在扩散
CFLD - 粗到细潜在扩散实现姿态引导人像合成
CFLDpose-guided人物图像合成潜在扩散CVPRGithub开源项目
CFLD项目提出粗到细潜在扩散方法,用于姿态引导的人像合成。该方法采用多阶段策略,先生成粗略草图再逐步细化,提高了生成图像质量和准确性。作为CVPR 2024亮点论文,CFLD在人像合成领域展现了重要进展。
ladi-vton - 先进的虚拟试衣技术融合潜在扩散与文本反转
LaDI-VTON虚拟试穿图像生成潜在扩散文本倒置Github开源项目
LaDI-VTON是一种结合潜在扩散模型和文本反转技术的虚拟试衣系统。它通过可跳跃连接的自编码器增强图像生成,并利用文本反转将服装特征映射到CLIP词嵌入空间,有效保留服装细节。在Dress Code和VITON-HD数据集上的测试显示,LaDI-VTON的性能显著超越了现有方法,为虚拟试衣技术带来突破。