Project Icon

taesd

轻量级自动编码器:高速解码Stable Diffusion潜在空间

TAESD是一款小巧的自动编码器,采用与Stable Diffusion VAE相同的潜在API。它能高效地将Stable Diffusion潜在空间解码为全尺寸图像。TAESD兼容SD1/2、SDXL、SD3和FLUX.1等多种模型,已整合到主流AI绘画工具中。该工具适用于实时预览图像生成过程和替代官方VAE的场景。尽管在细节还原方面稍有欠缺,TAESD通过轻微的质量损失换取了显著的速度和便利性提升。

taef1 - 高效微型自动编码器增强FLUX.1实时预览
FLUX.1GithubHuggingfaceTAEF1实时预览开源项目模型深度学习自动编码器
TAEF1是与FLUX.1 VAE共享“latent API”的微型自动编码器,旨在提升实时生成过程的预览体验。该模型轻量化设计,可在FLUX.1-schnell管道中使用,并与PyTorch和diffusers库兼容。TAEF1支持`.safetensors`格式的权重文件,并通过预训练的AutoencoderTiny整合。加载时支持bfloat16精度及CPU顺序卸载,适合有经验的用户。通过简便的Python代码,用户可以生成关于美味纽约风格浆果芝士蛋糕的图像。
sd-vae-ft-mse - 改进稳定扩散自编码器提升图像重建效果
GithubHuggingfaceStable Diffusion图像生成开源项目模型模型微调深度学习自动编码器
sd-vae-ft-mse是一款经过微调的稳定扩散自编码器,在LAION-Aesthetics和LAION-Humans数据集上训练。该模型旨在提高图像重建质量,尤其是人脸细节。相比原始模型,它在PSNR和SSIM等指标上有明显提升,能够生成更平滑的图像。该模型可作为VAE组件轻松集成到现有的diffusers工作流中,用于稳定扩散图像生成。
sd-vae-ft-ema - 稳定扩散变分自编码器的增强版模型
GithubHuggingfaceStable Diffusion图像重建开源项目扩散模型机器学习模型自动编码器
sd-vae-ft-ema是一个基于LAION-Aesthetics和LAION-Humans数据集训练的稳定扩散变分自编码器。该模型在图像重建质量尤其是人脸细节方面优于原始VAE,具有更好的rFID、PSNR和SSIM指标表现,可作为扩散器工作流中的即插即用组件。
sdxl-vae - 优化自动编码器提升图像生成细节
GithubHuggingfaceStable DiffusionVAE图像生成开源项目扩散模型模型自编码器
SDXL-VAE项目为SDXL模型提供了优化版变分自动编码器。通过增大批量大小和采用指数移动平均,新autoencoder在所有重建指标上超越原始模型。它易于集成到diffusers工作流中,提升生成图像的局部高频细节。在COCO 2017数据集评估中,SDXL-VAE在rFID、PSNR、SSIM等指标上均优于原始VAE,显著改善了图像重建质量。
dc-ae-f64c128-in-1.0 - 深度压缩自编码器提高高分辨率模型性能
Deep Compression AutoencoderGithubHuggingface图像生成开源项目模型残差自编码训练加速高分辨率扩散模型
DC-AE凭借残差自编码和分阶段训练策略提升了高空间压缩率自编码器的重建精度,不仅在高分辨率扩散模型中实现了高效运行,还保持了优越的性能表现。在ImageNet 512x512测试中,DC-AE比传统SD-VAE-f8自编码器提高了19.1倍的推理速度和17.9倍的训练速度。
diffae - 基于扩散模型的自编码器框架实现图像生成与编辑
Diffusion AutoencodersGithub图像处理开源项目深度学习生成模型计算机视觉
diffae项目实现了基于扩散模型的自编码器框架,用于高质量图像的生成和编辑。该项目提供多个预训练模型,支持FFHQ、LSUN等数据集,实现了无条件生成、图像操作和插值等功能。项目包含使用说明、模型检查点和针对不同数据集的训练脚本,为图像生成和编辑研究提供了完整的工具链。
distill-sd - 更小更快速的Stable Diffusion模型,依靠知识蒸馏实现高质量图像生成
GithubStable Diffusion开源项目模型压缩神经网络训练细节预训练检查点
基于知识蒸馏技术开发的小型高速Stable Diffusion模型。这些模型保留了完整版本的图像质量,同时大幅减小了体积和提升了速度。文档详细介绍了数据下载脚本、U-net训练方法和模型参数设置,还支持LoRA训练及从检查点恢复。提供清晰的使用指南和预训练模型,适配快速高效图像生成需求。
consistencydecoder - 稳定扩散VAE的高性能一致性解码器
Consistency DecoderGithubStableDiffusionPipeline人工智能图像生成开源项目深度学习
ConsistencyDecoder是一个开源项目,旨在优化稳定扩散变分自编码器(VAE)的解码过程。该解码器生成的图像质量优于传统GAN解码器,在细节保留和整体画质上表现突出。项目具有简便的安装和使用流程,支持CUDA加速,并可与StableDiffusionPipeline无缝集成。项目提供的对比示例直观展示了ConsistencyDecoder的性能优势。
TCD-SDXL-LoRA - 创新扩散模型蒸馏技术助力高质量图像快速生成
GithubHuggingfaceLoRAStable DiffusionTCD开源项目快速采样文本生成图像模型
TCD是一款基于轨迹一致性蒸馏原理的开源项目,通过少步采样技术实现快速图像生成。该技术在保持高质量生成效果的同时,支持灵活调节采样步数和细节程度。作为SDXL的扩展模型,TCD可与社区模型、LoRA、ControlNet等技术无缝集成,并解决了传统对抗训练中的模式崩溃问题。
TCD - 新型少步采样蒸馏技术用于高质量图像生成
GithubLoRATCD图像生成开源项目扩散模型生成AI
TCD是一种创新的蒸馏技术,可将预训练扩散模型的知识提炼为高效的少步采样器。该技术具有灵活的NFE、优异的生成质量、可调节的细节程度和广泛的适用性。TCD无需对抗训练即可实现高质量的少步生成,有效避免了模式崩溃问题。项目开源了推理代码和基于SDXL Base 1.0蒸馏的TCD-SDXL模型,可与多种现有模型和技术无缝集成。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号