Mann-E Dreams: 一款基于SDXL的高质量图像生成模型
Mann-E Dreams是一个由伊朗的生成式AI初创公司Mann-E开发的最新图像生成模型。该模型基于SDXL技术,通过使用数千张Midjourney生成的图像进行训练,旨在创造高质量的图像输出。
模型特点
- 快速生成:开发团队采用了多种技巧,使模型生成速度可与SDXL Turbo等快速模型相媲美。
- 高质量输出:通过大量高质量训练数据,确保生成图像的优秀品质。
- 灵活性:支持多种尺寸和比例的图像生成,适应不同场景需求。
- 兼容性:可与SDXL 1.0 LoRas、ControlNet、IPAdapter和InstantID等工具配合使用。
使用建议
为获得最佳效果,Mann-E Dreams团队推荐以下设置:
- CLIP Skip:1或2,推荐使用1以获得更好的结果
- 步骤数:6-10步,通常8步效果最佳
- CFG Scale:2-4
- 图像尺寸:768x768或832x832,更高分辨率尚未经过测试。16:9比例可尝试1080x608
- 采样器:DPM++ SDE Karras
如何使用
用户可以通过Diffusers库轻松使用Mann-E Dreams模型。以下是一个简单的Python代码示例,展示了如何生成一张"繁忙的中东城市中的猫"的图像:
from diffusers import DiffusionPipeline, DPMSolverSinglestepScheduler
import torch
pipe = DiffusionPipeline.from_pretrained(
"mann-e/Mann-E_Dreams", torch_dtype=torch.float16
).to("cuda")
pipe.scheduler = DPMSolverSinglestepScheduler.from_config(pipe.scheduler.config, use_karras_sigmas=True)
image = pipe(
prompt="a cat in a bustling middle eastern city",
num_inference_steps=8,
guidance_scale=3,
width=768,
height=768,
clip_skip=1
).images[0]
image.save("a_cat.png")
开发团队
Mann-E Dreams由Mann-E公司的创始人兼CEO Muhammadreza Haghiri带领的四人团队开发。他们花费数月时间收集数据、标注数据并训练模型,最终打造出这款强大的图像生成工具。
开源与支持
Mann-E Dreams采用MIT许可证,开发团队鼓励社区使用和改进这一模型。对于那些希望支持项目发展的用户,团队提供了加密货币捐赠的选项,包括Tron/USDT (TRC20)和ETH (ERC20)两种方式。
通过Mann-E Dreams,用户可以轻松创建高质量、富有创意的图像,为各种视觉创作项目提供强大支持。无论是个人创作者还是专业设计团队,都能从这一先进的AI图像生成模型中受益。