#模型加速

DeepCache - 免费加速扩散模型
DeepCache模型加速无训练降采样高搜索量Github开源项目
DeepCache通过无需训练的方式显著加速扩散模型,支持Stable Diffusion、Stable Diffusion XL、Stable Video Diffusion等。兼容多种采样算法如DDIM和PLMS,并提供详细的使用示例,用户无需修改代码即可提升性能。此外,DeepCache还支持并行推理和多GPU使用,确保高效部署和运行。
Efficient-Deep-Learning - 深度神经网络压缩和加速方法综述
神经网络压缩模型加速网络剪枝权重量化知识蒸馏Github开源项目
此项目汇总了深度神经网络压缩和加速的多种方法,涵盖神经架构设计、剪枝、量化、矩阵分解和知识蒸馏等技术。重点介绍了剪枝(含彩票假设)、知识蒸馏和量化等领域的研究进展,并提供了大量相关论文摘要。项目还收录了初始化剪枝和高效视觉Transformer等相关资源,为该领域的研究和开发提供了全面参考。
FLUX.1-Turbo-Alpha - 高效文本生成图像的蒸馏LoRA模型
AI绘图模型图像生成FLUX.1-devGithub模型加速Lora模型Huggingface开源项目
FLUX.1-Turbo-Alpha是阿里妈妈创意团队基于FLUX.1-dev模型开发的8步蒸馏LoRA模型。它采用多头判别器提升蒸馏质量,适用于文本生成图像和修复控制网等任务。该模型经过100万高质量图像训练,利用对抗训练提高效果,在保持输出质量的同时大幅提升生成速度。模型推荐引导缩放值为3.5。