#Kandinsky 2.1
kandinsky-2-1 - 基于CLIP和扩散技术的高级文本到图像生成模型
图像处理Huggingface模型文本生成图像机器学习人工智能Github开源项目Kandinsky 2.1
Kandinsky 2.1是一个结合CLIP和潜在扩散技术的文本条件扩散模型。该模型采用CLIP作为文本和图像编码器,并利用扩散图像先验在CLIP模态的潜在空间间建立映射,从而提升视觉效果并拓展图像混合与文本引导图像操作的可能性。Kandinsky 2.1支持文本到图像生成、文本引导的图像到图像转换以及图像插值等功能,在COCO_30k数据集的零样本测试中获得8.21的FID评分。
kandinsky-2-1-prior - 先进的文本到图像扩散模型
图像编辑Huggingface模型文本生成图像机器学习模型AI绘图Github开源项目Kandinsky 2.1
Kandinsky 2.1是一款结合DALL-E 2和潜在扩散技术的文本条件扩散模型。它采用CLIP模型进行文本和图像编码,并在CLIP模态的潜在空间中引入扩散图像先验,大幅提升了视觉效果。该模型支持文本到图像生成、图像到图像转换、图像修复和插值等多种应用,为图像混合和文本引导的图像操作开辟了新的可能性。