#stable-diffusion

Text2Video: 将文本转换为视频的革命性工具

3 个月前

文本转视频 stable-diffusion edge-tts huggingface Docker Github 开源项目

3 个月前

相关项目

stable-diffusion-3.5-large-turbo-gguf

stable-diffusion-3.5-large-turbo-gguf项目提供了对stabilityai的3.5稳定扩散模型的直接量化处理。模型文件可以在ComfyUI-GGUF自定义节点中运用，通过简单的文件部署即可实现。量化处理保持了原模型的许可证要求，提升了图像生成的运算效率，适用于文本到图像的生成任务。更多技术细节可以参考GitHub上的安装说明和量化类型概览。

coloringbookgenerator

项目结合稳定扩散和LoRA技术，实现了文本到图像的生成，适用于创作儿童填色书。使用稳定扩散XL基础模型生成DIY填色书，并支持Safetensors格式权重，确保高效运行，适合多种文本到图像转换场景。

bigaspv2lustify-v10-sdxl

该项目展示了一个结合Stable Diffusion技术的先进文本生成图像模型，能够生成非常逼真的图像效果。由用户ffjggrtbjibv创建，其模型适用于复杂图像创建与需要真实效果的场景。凭借现代化的图像生成算法，这个模型在图像质量和细节表现上得到显著提升，为创作提供更大的灵活性与创意空间。

GrandPrix

Grand Prix项目是一个结合Gacha与LadyNostalgia的文本到图像生成模型，通过稳定扩散技术创造复古风格艺术作品。模型可根据文本提示生成个性化图片，广泛应用于游戏艺术和标志设计等领域。

kencanmix_v1.5

kencanmix_v1.5通过整合稳定扩散和谷歌Colab，提供了卓越的文本到图像转换能力，示例图片体现了创新的推理技术，为图像生成探索开辟了新的方向。

momoiro-pony-v14-sdxl

momoiro-pony-v14-sdxl是基于Stable Diffusion XL的开源AI绘画模型，专注于生成二次元动漫风格图像。该模型结合了Stable Diffusion XL的图像生成能力和特定的二次元艺术风格，可用于创作动漫角色和场景。这一工具适用于对动漫风格图像感兴趣的AI艺术爱好者和创作者。

beLIEve

beLIEve是一个融合'I Can't Believe It's Not Photography v1'和'realisticStockPhoto v3'优势的AI图像生成模型。它在细节表现和面部多样性方面有显著提升，可生成逼真的人物肖像和场景。模型适用于多种风格，包括可爱少女、电影场景和幻想人物等，呈现出高度逼真的照片级效果。beLIEve为创作者提供了强大的工具，能够生成从现实到奇幻的各种高质量图像。

flux-lora-film-noir

该项目通过FLUX.1-dev基础模型生成高对比的黑白影像，使用“in the style of FLMNR”触发Film Noir风格的图像。此技术融合了LoRA与Stable Diffusion，呈现出电影胶片风格，适用于创作戏剧性阴影和高强度场景的艺术效果。项目采用非商业许可，便于探索和下载使用，并提供丰富示例以展示其应用潜力。

text2video

text2video 是一款将文本转换为视频的开源工具，支持小说等文本的可视化阅读。通过分段文本生成图片和语音，并合成为包含画面、字幕和声音的视频。应用了 stable-diffusion 和 edge-tts 技术，支持 Docker 一键启动和 macOS 本地开发。该工具还支持生成高质量的绘图提示词，利用 huggingface 的开源模型和 ffmpeg 进行音视频合成，操作简便，效果显著。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com