#text-to-image

CogView: 开创文本到图像生成的新时代

2024年09月04日

CogView ImageReward NeurIPS 2023 text-to-image transformer Github 开源项目

2024年09月04日

相关项目

CogView

CogView是一个基于4B参数预训练的转换器，用于生成通用领域的文本到图像。最新版本CogView2显著提升了生成速度，并扩展支持英文输入。用户可以通过Github和Wudao平台体验并下载预训练模型。项目还包含超分辨率和图像到文本转换功能，并提供详细的设置和运行指南。该项目获得NeurIPS 2021认可，并推荐使用PB-relax和Sandwich-LN技术稳定训练大型转化器。

bigaspv2lustify-v10-sdxl

该项目展示了一个结合Stable Diffusion技术的先进文本生成图像模型，能够生成非常逼真的图像效果。由用户ffjggrtbjibv创建，其模型适用于复杂图像创建与需要真实效果的场景。凭借现代化的图像生成算法，这个模型在图像质量和细节表现上得到显著提升，为创作提供更大的灵活性与创意空间。

Hyper-SD

Hyper-SD是一种扩散模型加速技术,通过1到8步的快速推理生成高质量图像。该技术提供适用于FLUX.1-dev、SD3、SDXL和SD1.5等基础模型的LoRA和UNet检查点,并与ControlNet等技术兼容。Hyper-SD可应用于文本生成图像、涂鸦生成等多种场景,为AI图像创作提供高效便捷的解决方案。

IncredibleOdds

IncredibleOdds项目结合Incredible World和Gacha模型，利用diffusers技术，实现从文字到图像的转换，适合游戏艺术和现实主义作品创作。用户可通过种子9119生成高细节图像，如厨房里的卡通考拉和柠檬主题汉堡。这项技术不仅提升了图像生成质量，还扩展了可选的艺术风格，提供了更广泛的创作机会。

carnival-unchained-v10-fp8-flux

这是一个基于Carnival原始模型的实验性FP8模型转换项目，运用Flux技术融合真实与动漫风格。模型采用float8_e4m3fn格式，支持文本到图像生成，但目前仅供测试使用。由于采用特殊的浮点格式，该模型暂不支持无服务器推理API。

momoiro-pony-v14-sdxl

momoiro-pony-v14-sdxl是基于Stable Diffusion XL的开源AI绘画模型，专注于生成二次元动漫风格图像。该模型结合了Stable Diffusion XL的图像生成能力和特定的二次元艺术风格，可用于创作动漫角色和场景。这一工具适用于对动漫风格图像感兴趣的AI艺术爱好者和创作者。

lyh-anime-flux-v2a1-fp8-flux

lyh-anime-flux-v2a1-fp8-flux是一款基于Flux技术的实验性动漫AI模型，支持Float8 (E4M3)精度，专注生成可爱风格图像。当前版本仍在测试阶段，转换效果待验证，暂不支持在线推理。该模型适合研究轻量级动漫生成技术的开发者探索使用。

mlx-FLUX.1-schnell

项目在DiffusionKit MLX中提供文本到图像生成能力，适用于创意设计师及内容创作者。通过简单的命令行操作即可生成高细节图像，渲染出逼真的视觉效果。基于Apache 2.0许可证，确保广泛应用和可扩展性。

tame-the-authenticity-machine-v10-sdxl

该项目利用zyxt99565的模型，通过diffusers库进行文本到图像的转换，支持多标签如stable-diffusion-xl和photorealistic，专注于生成高质量逼真图像。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com