imaginAIry:AI驱动的图像生成工具
imaginAIry 是一个功能强大的 AI 图像生成工具,它可以让用户通过简单的文本描述或已有图片来创造出令人惊叹的图像。这个项目集成了多种先进的 AI 技术,为用户提供了丰富多样的图像生成和编辑选项。
主要特性
基础图像生成
用户可以通过简单的文本提示来生成高质量的图像。例如:
imagine "a scenic landscape" "a photo of a dog" "photo of a fruit bowl" "portrait photo of a freckled woman" "a bluejay"
这将生成与描述相匹配的各种图像。
AI 视频生成
imaginAIry 还支持基于稳定扩散的视频生成:
aimg videogen --start-image rocket.png
这个功能目前支持 Nvidia GPU,可以从静态图像创建短视频。
图像结构控制
通过 ControlNet 技术,用户可以使用身体姿势、深度图、边缘检测等方式来引导图像生成过程。支持的控制模式包括:
- Openpose 控制
- Canny 边缘控制
- HED 边界控制
- 深度图控制
- 法线图控制
- 图像重组控制
图像编辑和重新着色
imaginAIry 提供了强大的图像编辑功能:
- 指令式图像编辑:用自然语言描述如何修改图像
- 图像重新着色:为黑白图像上色或重新为彩色图像着色
- 快速图像编辑演示:应用预定义的编辑效果
基于提示的图像遮罩
用户可以使用文本描述来创建复杂的图像遮罩,支持布尔逻辑和强度修饰符。
人脸增强
使用 CodeFormer 技术来改善图像中的人脸质量。
图像放大
轻松提升图像分辨率,支持多种放大模型。
平铺图像生成
生成可无缝平铺的图像,适用于背景和纹理。
图像到图像转换
利用深度图实现惊人的图像"翻译"效果。
外部绘制
在给定起始图像的基础上,生成其"周围环境"。
提示扩展
支持使用占位符和短语列表来随机生成多样化的提示。
图像描述生成
使用 BLIP 模型为图像自动生成描述文本。
使用方法
imaginAIry 提供了命令行界面和 Python API 两种使用方式。用户可以通过简单的命令或代码来访问各种功能。该工具还提供了一个交互式 shell,方便用户探索和实验不同的功能。
系统要求
- 约 10GB 空间用于下载模型
- 支持 CUDA 的显卡(>= 11GB VRAM)或 M1 处理器
- Python 环境(推荐 Python 3.10)
- macOS 用户需要安装 Rust
结论
imaginAIry 是一个综合性的 AI 图像生成和编辑工具,集成了多种先进技术,为用户提供了丰富的创作可能性。无论是生成全新的图像,还是编辑和增强现有图像,imaginAIry 都能提供强大而灵活的解决方案。