#DeepFloyd-IF
IF-II-L-v1.0 - 最新级联扩散模型提升图像生成能力
级联扩散模型非商业使用Github开源项目文本到图像模型Huggingface许可协议DeepFloyd-IF
DeepFloyd-IF使用先进的文本到图像级联扩散模型生成高质量图像,具备出色的语言处理能力。采用冻结文本编码器与多级像素级扩散模块,将图像分辨率提升至1024x1024。通过COCO数据集测试,支持开箱即用,并可在Hugging Face平台通过diffusers库轻松运行。
IF-I-XL-v1.0 - 先进的多级级联扩散模型实现高质量文本到图像生成
AI绘画扩散模型开源项目模型Huggingface文本生成图像深度学习GithubDeepFloyd-IF
IF-I-XL-v1.0是DeepFloyd和StabilityAI开发的三级级联扩散模型,具有4.3B参数规模。该模型采用冻结的T5转换器和改进的UNet架构,实现高质量文本到图像生成。在COCO数据集上,模型达到6.66的零样本FID-30K分数,展现出优秀的照片级真实感和语言理解能力。支持从64x64到1024x1024的多分辨率图像生成,可在14GB显存的GPU上高效运行。