#text-to-image

CogView: 开创文本到图像生成的新时代

2024年09月04日
Cover of CogView: 开创文本到图像生成的新时代
相关项目
Project Cover

CogView

CogView是一个基于4B参数预训练的转换器,用于生成通用领域的文本到图像。最新版本CogView2显著提升了生成速度,并扩展支持英文输入。用户可以通过Github和Wudao平台体验并下载预训练模型。项目还包含超分辨率和图像到文本转换功能,并提供详细的设置和运行指南。该项目获得NeurIPS 2021认可,并推荐使用PB-relax和Sandwich-LN技术稳定训练大型转化器。

Project Cover

bigaspv2lustify-v10-sdxl

该项目展示了一个结合Stable Diffusion技术的先进文本生成图像模型,能够生成非常逼真的图像效果。由用户ffjggrtbjibv创建,其模型适用于复杂图像创建与需要真实效果的场景。凭借现代化的图像生成算法,这个模型在图像质量和细节表现上得到显著提升,为创作提供更大的灵活性与创意空间。

Project Cover

Hyper-SD

Hyper-SD是一种扩散模型加速技术,通过1到8步的快速推理生成高质量图像。该技术提供适用于FLUX.1-dev、SD3、SDXL和SD1.5等基础模型的LoRA和UNet检查点,并与ControlNet等技术兼容。Hyper-SD可应用于文本生成图像、涂鸦生成等多种场景,为AI图像创作提供高效便捷的解决方案。

Project Cover

IncredibleOdds

IncredibleOdds项目结合Incredible World和Gacha模型,利用diffusers技术,实现从文字到图像的转换,适合游戏艺术和现实主义作品创作。用户可通过种子9119生成高细节图像,如厨房里的卡通考拉和柠檬主题汉堡。这项技术不仅提升了图像生成质量,还扩展了可选的艺术风格,提供了更广泛的创作机会。

Project Cover

carnival-unchained-v10-fp8-flux

这是一个基于Carnival原始模型的实验性FP8模型转换项目,运用Flux技术融合真实与动漫风格。模型采用float8_e4m3fn格式,支持文本到图像生成,但目前仅供测试使用。由于采用特殊的浮点格式,该模型暂不支持无服务器推理API。

Project Cover

momoiro-pony-v14-sdxl

momoiro-pony-v14-sdxl是基于Stable Diffusion XL的开源AI绘画模型,专注于生成二次元动漫风格图像。该模型结合了Stable Diffusion XL的图像生成能力和特定的二次元艺术风格,可用于创作动漫角色和场景。这一工具适用于对动漫风格图像感兴趣的AI艺术爱好者和创作者。

Project Cover

lyh-anime-flux-v2a1-fp8-flux

lyh-anime-flux-v2a1-fp8-flux是一款基于Flux技术的实验性动漫AI模型,支持Float8 (E4M3)精度,专注生成可爱风格图像。当前版本仍在测试阶段,转换效果待验证,暂不支持在线推理。该模型适合研究轻量级动漫生成技术的开发者探索使用。

Project Cover

mlx-FLUX.1-schnell

项目在DiffusionKit MLX中提供文本到图像生成能力,适用于创意设计师及内容创作者。通过简单的命令行操作即可生成高细节图像,渲染出逼真的视觉效果。基于Apache 2.0许可证,确保广泛应用和可扩展性。

Project Cover

tame-the-authenticity-machine-v10-sdxl

该项目利用zyxt99565的模型,通过diffusers库进行文本到图像的转换,支持多标签如stable-diffusion-xl和photorealistic,专注于生成高质量逼真图像。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号