#stable-diffusion
Text2Video: 将文本转换为视频的革命性工具
stable-diffusion-3.5-large-turbo-gguf
stable-diffusion-3.5-large-turbo-gguf项目提供了对stabilityai的3.5稳定扩散模型的直接量化处理。模型文件可以在ComfyUI-GGUF自定义节点中运用,通过简单的文件部署即可实现。量化处理保持了原模型的许可证要求,提升了图像生成的运算效率,适用于文本到图像的生成任务。更多技术细节可以参考GitHub上的安装说明和量化类型概览。
coloringbookgenerator
项目结合稳定扩散和LoRA技术,实现了文本到图像的生成,适用于创作儿童填色书。使用稳定扩散XL基础模型生成DIY填色书,并支持Safetensors格式权重,确保高效运行,适合多种文本到图像转换场景。
bigaspv2lustify-v10-sdxl
该项目展示了一个结合Stable Diffusion技术的先进文本生成图像模型,能够生成非常逼真的图像效果。由用户ffjggrtbjibv创建,其模型适用于复杂图像创建与需要真实效果的场景。凭借现代化的图像生成算法,这个模型在图像质量和细节表现上得到显著提升,为创作提供更大的灵活性与创意空间。
GrandPrix
Grand Prix项目是一个结合Gacha与LadyNostalgia的文本到图像生成模型,通过稳定扩散技术创造复古风格艺术作品。模型可根据文本提示生成个性化图片,广泛应用于游戏艺术和标志设计等领域。
kencanmix_v1.5
kencanmix_v1.5通过整合稳定扩散和谷歌Colab,提供了卓越的文本到图像转换能力,示例图片体现了创新的推理技术,为图像生成探索开辟了新的方向。
momoiro-pony-v14-sdxl
momoiro-pony-v14-sdxl是基于Stable Diffusion XL的开源AI绘画模型,专注于生成二次元动漫风格图像。该模型结合了Stable Diffusion XL的图像生成能力和特定的二次元艺术风格,可用于创作动漫角色和场景。这一工具适用于对动漫风格图像感兴趣的AI艺术爱好者和创作者。
beLIEve
beLIEve是一个融合'I Can't Believe It's Not Photography v1'和'realisticStockPhoto v3'优势的AI图像生成模型。它在细节表现和面部多样性方面有显著提升,可生成逼真的人物肖像和场景。模型适用于多种风格,包括可爱少女、电影场景和幻想人物等,呈现出高度逼真的照片级效果。beLIEve为创作者提供了强大的工具,能够生成从现实到奇幻的各种高质量图像。
flux-lora-film-noir
该项目通过FLUX.1-dev基础模型生成高对比的黑白影像,使用“in the style of FLMNR”触发Film Noir风格的图像。此技术融合了LoRA与Stable Diffusion,呈现出电影胶片风格,适用于创作戏剧性阴影和高强度场景的艺术效果。项目采用非商业许可,便于探索和下载使用,并提供丰富示例以展示其应用潜力。
text2video
text2video 是一款将文本转换为视频的开源工具,支持小说等文本的可视化阅读。通过分段文本生成图片和语音,并合成为包含画面、字幕和声音的视频。应用了 stable-diffusion 和 edge-tts 技术,支持 Docker 一键启动和 macOS 本地开发。该工具还支持生成高质量的绘图提示词,利用 huggingface 的开源模型和 ffmpeg 进行音视频合成,操作简便,效果显著。