OpenVision项目介绍
OpenVision是一个令人兴奋的图像生成项目,其亮点在于将著名的Midjourney美学风格无缝融入用户生成的每一幅图像中。通过引入这个美学风格,OpenVision使用户不再需要进行手动调整或后期处理即可生成高质量的图像。
项目背景
OpenVision基于ProteusV0.4的风格增强功能进行开发,其核心在于通过开放的人工智能网络Bittensor生成合成图像。Bittensor的目标是去中心化人工智能,通过构建先进的开源模型来推动技术的发展。OpenVision可以被视为实现这一宏伟目标的小步伐。
项目的亮点
OpenVision以其独特的Midjourney风格著称,尤其在肖像细节的保留和风格的高度一致性方面表现出色。这种风格直接嵌入到模型中,使得用户在图像生成时无需多余的调整。
理想的设置
为了获得最佳的图像效果,OpenVision建议使用以下的参数设置:
- 控制字段(CFG)范围:1.5 - 2
- 采样器:Euler Ancestral
- 步数:30 - 40
- 分辨率:1280x1280(提高美学)或1024x1024(提高保真度)
使用方法
OpenVision与🤗 diffusers兼容,可以通过简单的代码实现图像生成。以下是一个使用Python和Pytorch的示例:
import torch
from diffusers import (
StableDiffusionXLPipeline,
AutoencoderKL
)
# 加载VAE组件
vae = AutoencoderKL.from_pretrained(
"madebyollin/sdxl-vae-fp16-fix",
torch_dtype=torch.float16
)
# 配置管道
pipe = StableDiffusionXLPipeline.from_pretrained(
"Corcelio/openvision",
vae=vae,
torch_dtype=torch.float16
)
pipe.to('cuda')
# 定义提示并生成图像
prompt = "a cat wearing sunglasses in the summer"
negative_prompt = ""
image = pipe(
prompt,
negative_prompt=negative_prompt,
width=1280,
height=1280,
guidance_scale=1.5,
num_inference_steps=30
).images[0]
鸣谢
OpenVision由Corcel制作,更多信息可以访问Corcel官网。