近年来,扩散模型在高质量图像生成领域取得了巨大的成功。然而,扩散模型通常需要数百次迭代才能生成高质量图像,这限制了其在实际应用中的使用。为了加速扩散模型的采样过程,研究人员提出了一致性模型(Consistency Model, CM)。CM可以在很少的步骤内生成高保真度的图像,但其在高分辨率、文本条件图像生成任务中的应用效果仍不理想。
为了解决这个问题,来自香港中文大学等机构的研究人员提出了一种新的方法 - Phased Consistency Model (PCM)。PCM是对原始一致性模型的改进和扩展,旨在实现高分辨率、文本条件的图像快速生成。
PCM的核心思想是将整个ODE轨迹分成多个子轨迹。这种设计有效地解决了之前方法存在的三个主要局限性:
通过将ODE轨迹分阶段处理,PCM很好地克服了这些局限性,在各种生成设置下都能取得优异的表现。
相比之前的方法,PCM具有以下优势:
更好的生成质量:PCM在1-16步的图像生成中都能取得优异的表现,生成质量明显优于之前的方法。
更高的灵活性:PCM允许更灵活地选择CFG因子,对正面和负面提示词都很敏感。
结果一致性:在不同的推理步骤下,PCM能产生一致的高质量结果。