项目简介
SDXL-Turbo是SDXL 1.0的精简版本,专为实时合成训练。它基于一种名为“对抗性扩散蒸馏”(ADD)的新型训练方法,使得SDXL能在1到4个步骤内以高质量生成图像。这种方法使用分数蒸馏技术,并结合对抗性损失,即使在仅一两步的低步骤采样中也能保证高图像保真度。
用户评估
上述图表评估了用户对SDXL-Turbo与其他单步和多步模型的偏好。在单步评估时,就图像质量和对提示的遵循而言,人类评审更喜欢SDXL-Turbo,而不是在四步(或更少步骤)评估的LCM-XL。此外,我们还看到,使用SDXL-Turbo的四个步骤进一步提高了性能。
局限性
尽管SDXL-Turbo具有创新性,但它也有一些局限性。生成的图像分辨率固定(512x512像素),并未达到完美的照片级真实感。模型不能渲染清晰可辨的文字,且在生成人脸和人物时可能存在不准确性。此外,模型的自动编码部分存在信息损失。