#EMMA

ELLA: 用LLM增强扩散模型的语义对齐能力

2 个月前

ELLA EMMA 文本生成图像语义对齐多模态技术 Github 开源项目

2 个月前

相关项目

ELLA

ELLA项目将大语言模型与扩散模型结合，提高了图像生成的语义对齐能力。通过LLM注释的合成标题训练，ELLA实现了更准确的文本到图像转换。项目提供DPG-Bench评估基准和ComfyUI插件，并开发了支持多模态输入的EMMA模型。这些创新为图像生成领域开辟了新途径，展现了语言模型与扩散模型融合的应用前景。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com