相关项目
Lumina-T2X
Lumina-T2X利用基于流的扩散变换器,实现文本向多种模态、分辨率和持续时间的转换,包括图像、音频和视频。其功能还包括高分辨率生成、多轮对话、深度图和分割图估计等。项目提供多语言提示和表情符号支持,适用于多种智能生成需求。访问项目页面了解更多详情和使用案例。
FouriScale
FouriScale是一种基于频域分析的高分辨率图像生成方法。该技术在预训练扩散模型中引入膨胀技术和低通操作,解决了结构和尺度一致性问题。FouriScale可处理不同宽高比的文本到图像生成任务,平衡图像结构完整性和保真度,实现任意大小、高分辨率、高质量的图像生成。这种方法简单且兼容性强,为超高分辨率图像合成研究提供了新思路。