#text-to-image
CogView: 开创文本到图像生成的新时代
CogView
CogView是一个基于4B参数预训练的转换器,用于生成通用领域的文本到图像。最新版本CogView2显著提升了生成速度,并扩展支持英文输入。用户可以通过Github和Wudao平台体验并下载预训练模型。项目还包含超分辨率和图像到文本转换功能,并提供详细的设置和运行指南。该项目获得NeurIPS 2021认可,并推荐使用PB-relax和Sandwich-LN技术稳定训练大型转化器。
bigaspv2lustify-v10-sdxl
该项目展示了一个结合Stable Diffusion技术的先进文本生成图像模型,能够生成非常逼真的图像效果。由用户ffjggrtbjibv创建,其模型适用于复杂图像创建与需要真实效果的场景。凭借现代化的图像生成算法,这个模型在图像质量和细节表现上得到显著提升,为创作提供更大的灵活性与创意空间。
Hyper-SD
Hyper-SD是一种扩散模型加速技术,通过1到8步的快速推理生成高质量图像。该技术提供适用于FLUX.1-dev、SD3、SDXL和SD1.5等基础模型的LoRA和UNet检查点,并与ControlNet等技术兼容。Hyper-SD可应用于文本生成图像、涂鸦生成等多种场景,为AI图像创作提供高效便捷的解决方案。
IncredibleOdds
IncredibleOdds项目结合Incredible World和Gacha模型,利用diffusers技术,实现从文字到图像的转换,适合游戏艺术和现实主义作品创作。用户可通过种子9119生成高细节图像,如厨房里的卡通考拉和柠檬主题汉堡。这项技术不仅提升了图像生成质量,还扩展了可选的艺术风格,提供了更广泛的创作机会。
carnival-unchained-v10-fp8-flux
这是一个基于Carnival原始模型的实验性FP8模型转换项目,运用Flux技术融合真实与动漫风格。模型采用float8_e4m3fn格式,支持文本到图像生成,但目前仅供测试使用。由于采用特殊的浮点格式,该模型暂不支持无服务器推理API。
momoiro-pony-v14-sdxl
momoiro-pony-v14-sdxl是基于Stable Diffusion XL的开源AI绘画模型,专注于生成二次元动漫风格图像。该模型结合了Stable Diffusion XL的图像生成能力和特定的二次元艺术风格,可用于创作动漫角色和场景。这一工具适用于对动漫风格图像感兴趣的AI艺术爱好者和创作者。
lyh-anime-flux-v2a1-fp8-flux
lyh-anime-flux-v2a1-fp8-flux是一款基于Flux技术的实验性动漫AI模型,支持Float8 (E4M3)精度,专注生成可爱风格图像。当前版本仍在测试阶段,转换效果待验证,暂不支持在线推理。该模型适合研究轻量级动漫生成技术的开发者探索使用。
mlx-FLUX.1-schnell
项目在DiffusionKit MLX中提供文本到图像生成能力,适用于创意设计师及内容创作者。通过简单的命令行操作即可生成高细节图像,渲染出逼真的视觉效果。基于Apache 2.0许可证,确保广泛应用和可扩展性。
tame-the-authenticity-machine-v10-sdxl
该项目利用zyxt99565的模型,通过diffusers库进行文本到图像的转换,支持多标签如stable-diffusion-xl和photorealistic,专注于生成高质量逼真图像。