#扩散模型
control_v11p_sd15_scribble - ControlNet v1.1 涂鸦版本的图像生成条件控制方法
条件控制扩散模型开源项目模型GithubHuggingface图像生成Stable DiffusionControlNet
ControlNet v1.1 引入涂鸦条件以增强图像生成,修复了先前版本的数据问题,并优化了厚涂鸦处理。通过条件控制,该模型可在Stable Diffusion v1-5上实现多样输入条件,如边缘检测和分割,无需高配置硬件即可便捷地进行快速训练。
lotus-normal-g-v1-0 - 基于扩散原理的高精度视觉预测模型
视觉基础模型深度学习Huggingface开源项目模型扩散模型Github密集预测Lotus
Lotus是EnVision Research团队开发的视觉基础模型,采用扩散模型技术实现高精度的视觉预测功能。该项目已在arXiv发表论文,并开源了完整代码库。通过在线演示平台,开发者可以体验其在计算机视觉领域的实际应用效果。
lotus-normal-d-v1-0 - 视觉预测领域的高品质扩散模型
高质量预测Github扩散模型开源项目Lotus模型HuggingfaceHuggingFace视觉基础模型
Lotus系列中的视觉基础模型,专注于高精度与密集预测任务。通过创新的扩散技术,显著提升视觉预测的精度和质量,在科研领域拥有广泛的应用潜力。该项目是Lotus官方模型家族的一部分,采用先进的扩散技术以提高视觉预测的效果,适用于多种高难度的密集预测任务。
control_v11f1e_sd15_tile - 基于ControlNet的高精度图像超分辨率与细节增强模型
Github开源项目Huggingface图像生成深度学习扩散模型Stable DiffusionControlNet模型
control_v11f1e_sd15_tile是ControlNet v1.1系列中专注于图像细节增强的模型。通过与Stable Diffusion结合,该模型能将低分辨率或模糊图像转换为清晰度更高的图像。这个开源项目不仅支持图像超分辨率处理,还可用于生成与输入图像大小相同但细节更丰富的图像,为数字图像处理提供了新的解决方案。
IF-I-XL-v1.0 - 先进的多级级联扩散模型实现高质量文本到图像生成
AI绘画扩散模型开源项目模型Huggingface文本生成图像深度学习GithubDeepFloyd-IF
IF-I-XL-v1.0是DeepFloyd和StabilityAI开发的三级级联扩散模型,具有4.3B参数规模。该模型采用冻结的T5转换器和改进的UNet架构,实现高质量文本到图像生成。在COCO数据集上,模型达到6.66的零样本FID-30K分数,展现出优秀的照片级真实感和语言理解能力。支持从64x64到1024x1024的多分辨率图像生成,可在14GB显存的GPU上高效运行。
playground-v2-1024px-aesthetic - 高分辨率图像生成模型提升美学质量
基准测试Playground v2用户研究Huggingface文本到图像开源项目模型扩散模型Github
该模型生成1024x1024像素的高美学图像,并在用户偏好研究中表现出色。通过MJHQ-30K评估基准,Playground v2在多个评价指标上表现优于其他模型,尤其在图像的美学质量上。
相关文章
Diffree:最新模型实现文字指令修改图片!!这下修图变得更简单了
2024年08月03日
AnimateAnyone:动画新纪元,AI视频合成魔法
2024年08月03日
Playground v2:最新SD模型,超SDXL2.5倍!
2024年08月03日
ID-Animator:1小时前开源,单张人脸照片就可以生成高质量的特定人体视频
2024年08月03日
深入解析denoising-diffusion-pytorch:一个强大的去噪扩散概率模型实现
3 个月前
SkyPaint-AI-Diffusion: 基于 Stable Diffusion 的中英双语 AI 绘画模型
3 个月前
TokenFlow: 一种革命性的视频编辑框架
3 个月前
FateZero: 一种创新的零样本文本引导视频编辑技术
3 个月前
DiffMorpher:开源实现照片平滑转变,抖音特效快速落地
2024年08月02日