#VITON-HD
Multimodal Garment Designer: 基于人体中心的时尚图像编辑潜在扩散模型
3 个月前
相关项目
multimodal-garment-designer
本项目通过多模态条件时尚图像编辑,优化服装设计流程,生成符合文本、人体姿势和服装草图等多种输入模态的时尚图像。采用的新架构基于潜变量扩散模型,并且扩展了Dress Code和VITON-HD数据集,实验结果显示该方法在图像现实性和输入一致性方面效果显著。更多详情请参阅官方文档及GitHub仓库。
VITON-HD
VITON-HD是一个创新的虚拟试衣项目,能够生成1024x768高分辨率的虚拟试衣图像。该项目通过ALIAS归一化和生成器技术解决了高分辨率下的图像错位问题,同时保留了输入图像的细节。与现有方法相比,VITON-HD在合成图像质量方面有明显提升,为虚拟试衣技术的发展提供了新的研究方向。