#潜在扩散

LaDI-VTON: 使用潜在扩散和文本反转的虚拟试衣新方法

2024年09月05日

LaDI-VTON 虚拟试穿图像生成潜在扩散文本倒置 Github 开源项目

2024年09月05日

相关项目

CFLD

CFLD项目提出粗到细潜在扩散方法，用于姿态引导的人像合成。该方法采用多阶段策略，先生成粗略草图再逐步细化，提高了生成图像质量和准确性。作为CVPR 2024亮点论文，CFLD在人像合成领域展现了重要进展。

ladi-vton

LaDI-VTON是一种结合潜在扩散模型和文本反转技术的虚拟试衣系统。它通过可跳跃连接的自编码器增强图像生成,并利用文本反转将服装特征映射到CLIP词嵌入空间,有效保留服装细节。在Dress Code和VITON-HD数据集上的测试显示,LaDI-VTON的性能显著超越了现有方法,为虚拟试衣技术带来突破。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com