#潜在空间

LFM(Low Fuel Motorsport):模拟赛车的新兴竞技平台

3 个月前
Cover of LFM(Low Fuel Motorsport):模拟赛车的新兴竞技平台

SD-Latent-Interposer: 跨模型潜空间转换的神经网络

3 个月前
Cover of SD-Latent-Interposer: 跨模型潜空间转换的神经网络

TAESD:Stable Diffusion的微型自编码器

3 个月前
Cover of TAESD:Stable Diffusion的微型自编码器

sd-webui-llul: 实现局部潜在空间上采样的Stable Diffusion WebUI扩展

3 个月前
Cover of sd-webui-llul: 实现局部潜在空间上采样的Stable Diffusion WebUI扩展

Stable Cascade:革新AI图像生成的新里程碑

3 个月前
Cover of Stable Cascade:革新AI图像生成的新里程碑

Smooth Diffusion: 打造扩散模型中的平滑潜在空间

3 个月前
Cover of Smooth Diffusion: 打造扩散模型中的平滑潜在空间

CV-VAE: 一种兼容的视频VAE模型用于潜在生成视频模型

3 个月前
Cover of CV-VAE: 一种兼容的视频VAE模型用于潜在生成视频模型
相关项目
Project Cover

CV-VAE

CV-VAE是一种视频变分自编码器,专为潜在生成视频模型设计。它与预训练图像和视频模型(如SD 2.1和SVD)兼容,用于视频重建和生成。项目提供代码实现和预训练模型权重,支持视频重建和文本到视频转换。CV-VAE为视频生成技术研究提供了新的工具和方向。

Project Cover

SD-Latent-Interposer

SD-Latent-Interposer是一个实现Stable Diffusion模型间潜空间互操作的神经网络。它支持SDXL、SDv1.5、SD3、Flux.1和Stable Cascade等版本之间的直接潜空间转换,无需通过VAE解码和重新编码。这种方法提高了不同SD模型版本间的兼容性,为潜空间操作提供了更高效、灵活的解决方案。

Project Cover

sd-webui-llul

LLuL是Stable Diffusion WebUI的扩展插件,实现潜在空间中的图像局部放大。它提供简单的界面,让创作者能选择特定区域进行高质量放大,同时保持整体构图。插件支持权重调节和蒙版功能,增强了AI绘画的细节控制和画质表现。通过LLuL,AI生成图像的局部细节得到提升,整体画面质量显著改善。

Project Cover

taesd

TAESD是一款小巧的自动编码器,采用与Stable Diffusion VAE相同的潜在API。它能高效地将Stable Diffusion潜在空间解码为全尺寸图像。TAESD兼容SD1/2、SDXL、SD3和FLUX.1等多种模型,已整合到主流AI绘画工具中。该工具适用于实时预览图像生成过程和替代官方VAE的场景。尽管在细节还原方面稍有欠缺,TAESD通过轻微的质量损失换取了显著的速度和便利性提升。

Project Cover

Smooth-Diffusion

Smooth Diffusion是一种创新的扩散模型技术,通过优化潜在空间的平滑性来提升模型性能。这种方法在图像插值、反演和编辑任务中展现出显著优势,实现了更连续的过渡效果、更低的反演误差,以及更好的未修改内容保留。通过在训练过程中引入变化约束,Smooth Diffusion为扩散模型研究开辟了新方向。

Project Cover

StableCascade

Stable Cascade是一种新型文本到图像生成模型,采用高度压缩的潜在空间技术。它由三个阶段组成,可将1024x1024图像压缩至24x24尺寸,同时保持清晰重建效果。与Stable Diffusion相比,该模型实现了更快的推理速度和更低的训练成本。Stable Cascade在提示对齐和图像质量方面表现优异,并支持微调、ControlNet和LoRA等多种扩展功能,适用于对效率要求较高的应用场景。

Project Cover

LFM

LFM项目创新性地将流匹配应用于预训练自编码器的潜空间,显著提升高分辨率图像生成的效率。这种方法不仅在计算资源有限的情况下保持了图像质量,还首次将条件生成任务融入流匹配框架。经过广泛测试,LFM在多个数据集上均取得了优异的定量和定性结果。

Project Cover

sd-x2-latent-upscaler

sd-x2-latent-upscaler是为Stable Diffusion设计的潜在空间图像放大模型,能在GPU上对生成的潜在图像进行2倍放大。它实现了快速的文本到高分辨率图像生成流程,与所有Stable Diffusion检查点兼容。该模型由Katherine Crowson和Stability AI合作开发,在LAION-2B数据集的高分辨率子集上训练,为图像生成研究和创作提供了有力工具。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号