StableSR简介
StableSR是由Jianyi Wang等人提出的一种极具竞争力的超分辨率方法,最近被移植到了Automatic1111的Stable Diffusion WebUI上。作为一个强大的图像放大插件,StableSR为用户带来了以下主要特性:
- 超高保真度的细节放大:在保持人物面部特征的同时,大幅提升图像细节。
- 广泛适用性:适用于大多数图像类型,包括真实照片、动漫图像、AI生成图等。
- 低VRAM消耗:通过优化模型结构,相比其他方法如ControlNet Tile模型,StableSR需要更少的显存。
- 小波色彩修复:有效解决放大过程中的颜色偏移问题。
安装与使用
安装步骤
-
在Automatic1111 WebUI的"Extensions"标签页中搜索并安装StableSR插件。
-
下载必要的模型文件:
- Stable Diffusion v2.1 768 EMA checkpoint (约5.21GB)
- StableSR模块 (约400MB)
将上述文件分别放入相应目录。
-
可选:安装Tiled Diffusion & VAE扩展,以处理大尺寸图像。
使用方法
-
在WebUI顶部选择下载的v2-1_512-ema-pruned checkpoint。
-
切换到img2img标签,在底部"Scripts"下拉菜单中选择StableSR脚本。
-
选择下载的StableSR checkpoint和放大倍数。
-
推荐使用Euler a采样器,CFG Scale=7,步数≥20。
-
对于输出尺寸>512的图像,建议使用Tiled Diffusion & VAE以获得更好的质量和更低的显存占用。
与其他方法的对比
为了全面评估StableSR的性能,我们将其与其他几种流行的图像放大方法进行了对比:
- Tiled Diffusion + ControlNet Tile
- Ultimate SD Upscaler + ControlNet Tile
- Tiled Diffusion + Noise Inversion + ControlNet Tile
在处理速度方面:
- Tiled Diffusion + ControlNet最快,约1分09秒
- Ultimate SD Upscaler次之,约1分54秒
- StableSR + Tiled Diffusion需要2分38秒
- Tiled Diffusion + Noise Inversion + ControlNet Tile最慢,约3分04秒
在图像质量方面:
- StableSR在保持原图细节的同时,显著提升了清晰度和细节表现
- 其他方法虽然也能增加细节,但往往会引入不必要的细节或改变原图风格
使用技巧
-
负面提示词的力量:最近发现,合适的负面提示词能显著增强StableSR的细节表现。推荐使用:
3d, cartoon, anime, sketches, (worst quality:2), (low quality:2)
-
纯噪声模式:启用此模式可获得更多细节,但可能会显著改变颜色和锐度。
-
颜色修复:使用小波颜色修复可有效缓解StableSR和分块处理引起的颜色偏移问题。
注意事项
-
许可证:StableSR使用S-Lab License 1.0授权。严禁将代码和checkpoint用于商业用途。
-
结果差异:由于采样器和VAE解码器的差异,WebUI版本的StableSR结果可能与官方示例有所不同。
-
VRAM优化:对于6GB显存设备,可将Tiled Diffusion的Latent tile batch size设为1,Tiled VAE的Encoder Tile Size设为1024,Decoder Tile Size设为128。
结语
StableSR为Stable Diffusion WebUI带来了强大的图像超分辨率能力,为用户提供了一种高质量、低资源消耗的图像放大解决方案。通过合理设置和结合其他插件,StableSR可以在各种硬件条件下发挥出色的性能。无论是处理AI生成图像还是提升真实照片质量,StableSR都是一个值得尝试的强大工具。
随着技术的不断发展,我们期待看到StableSR在未来带来更多惊艳的图像处理效果,为创作者们提供更多可能性。如果您对图像超分辨率感兴趣,不妨亲自体验一下StableSR的魔力吧!