项目概述
Dreamlike Diffusion 1.0是一个基于Stable Diffusion 1.5模型微调的人工智能艺术创作模型。该项目由dreamlike.art开发,专注于生成高质量的艺术作品。这是一个文本到图像(text-to-image)的生成模型,能够根据用户输入的文本描述创建独特的艺术图像。
主要特点
- 基于SD 1.5模型架构进行优化
- 支持多种图像尺寸和纵横比
- 可以生成高分辨率图像(建议使用640x640px、512x768px等分辨率)
- 支持非方形比例的图像生成,特别适合创作肖像和风景作品
- 提供了便捷的Gradio Web界面
使用方法
在使用过程中,用户可以像使用Stable Diffusion 1.5一样输入提示词。如果需要增强艺术风格效果,可以在提示词中添加"dreamlikeart"关键词。对于不同类型的创作,模型支持灵活的图像比例:
- 肖像照片推荐使用2:3或9:16的比例
- 风景照片推荐使用3:2或16:9的比例
技术实现
该模型可以通过Python的Diffusers库轻松调用。开发者可以使用StableDiffusionPipeline来加载和运行模型,支持GPU加速,能够快速生成高质量图像。
使用许可
该项目采用修改版的CreativeML OpenRAIL-M许可证,主要规定:
- 允许个人或小团队(10人以下)将模型输出用于商业用途
- 在非商业网站/应用中可以免费托管和使用
- 商业性使用需要获得授权,需联系官方团队
- 禁止生成或分享违法有害内容
- 模型输出成果的知识产权归使用者所有
应用平台
用户可以在dreamlike.art平台上免费使用该模型,同时项目也提供了Hugging Face Spaces的在线演示界面,方便用户快速体验模型功能。
技术支持
项目提供了完整的模型文件下载,支持多种部署方式:
- CompVis版本的模型权重文件
- Diffusers库的即插即用接口
- Gradio交互界面的集成支持