#潜在扩散

CFLD - 粗到细潜在扩散实现姿态引导人像合成

CFLDpose-guided人物图像合成潜在扩散CVPRGithub开源项目

CFLD项目提出粗到细潜在扩散方法，用于姿态引导的人像合成。该方法采用多阶段策略，先生成粗略草图再逐步细化，提高了生成图像质量和准确性。作为CVPR 2024亮点论文，CFLD在人像合成领域展现了重要进展。

ladi-vton - 先进的虚拟试衣技术融合潜在扩散与文本反转

LaDI-VTON虚拟试穿图像生成潜在扩散文本倒置Github开源项目

LaDI-VTON是一种结合潜在扩散模型和文本反转技术的虚拟试衣系统。它通过可跳跃连接的自编码器增强图像生成,并利用文本反转将服装特征映射到CLIP词嵌入空间,有效保留服装细节。在Dress Code和VITON-HD数据集上的测试显示,LaDI-VTON的性能显著超越了现有方法,为虚拟试衣技术带来突破。

相关文章

Article Cover

LaDI-VTON: 使用潜在扩散和文本反转的虚拟试衣新方法

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号