Lumina-Next-SFT-diffusers

采用Next-DiT架构的开源图像生成模型

文本转图像 AI绘画 Huggingface Github 开源项目模型 Lumina-Next-SFT 图像生成深度学习模型

Lumina-Next-SFT是一个文本到图像生成模型，采用Next-DiT架构，包含2B参数规模。模型集成了Gemma-2B文本编码器和经过优化的SDXL-VAE，支持生成1024分辨率图像。该项目已整合至diffusers库，可通过Python环境便捷部署。作为开源项目，它为图像生成领域提供了新的技术方案。

访问官网

Github

Huggingface

介绍相关项目

duchaitenPonyXLNo_ponyNoScoreV40 - 基于diffusers框架的新型图像生成模型

GithubHuggingfacediffusers人工智能图像生成开源项目机器学习模型模型卡

duchaitenPonyXLNo_ponyNoScoreV40是基于diffusers框架开发的图像生成模型。该模型利用深度学习技术生成图像，可能适用于艺术创作和内容生成等领域。目前，模型的具体训练细节和性能指标尚未公开。潜在用户应了解模型可能存在的局限性，并参考相关使用说明。

IF-II-L-v1.0 - 最新级联扩散模型提升图像生成能力

DeepFloyd-IFGithubHuggingface开源项目文本到图像模型级联扩散模型许可协议非商业使用

DeepFloyd-IF使用先进的文本到图像级联扩散模型生成高质量图像，具备出色的语言处理能力。采用冻结文本编码器与多级像素级扩散模块，将图像分辨率提升至1024x1024。通过COCO数据集测试，支持开箱即用，并可在Hugging Face平台通过diffusers库轻松运行。

PixArt-XL-2-512x512 - 快速生成高分辨率图像的高效能模型

GithubHuggingfacePixart-α开源项目扩散模型文本到图像模型深度学习生成模型

PixArt-α是一个基于Transformer架构的文本到图像生成框架，能够从文本提示生成高分辨率图像，最高可达1024像素。相比于Stable Diffusion v1.5，其训练时间仅为10.8%，大幅降低成本与碳排放。用户偏好评估显示，PixArt-α在实现效率与图像质量方面表现卓越，适用于艺术创作、教育用途及生成模型研究。但需要注意的是，其在图像还原现实性和复杂任务的执行上尚有局限。查看其GitHub或arXiv以了解更多细节。

ombre-v3-sdxl - 文本生成图像技术与动漫美学的全新融合应用

AI绘图GithubHuggingfaceStable Diffusion人物角色动漫开源项目模型艺术创作

ombre-v3-sdxl是基于Stable Diffusion XL的文本生成图像模型，专注于创造动漫和美学风格的图像。该模型融合多种艺术风格，适合生成独特的角色和艺术作品。通过文本描述，它能生成高质量、富有艺术感的图像，可应用于动漫创作、游戏设计等领域。模型由qelt开发，基于merges模型构建，遵循FAIPL-1.0-SD许可协议。

OpenDalleV1.1 - 超越SDXL性能的开源AI文生图模型

GithubHuggingfaceOpenDalleV1.1Stable Diffusion人工智能绘画图像生成开源项目模型深度学习

OpenDalleV1.1是一个开源AI图像生成模型，比SDXL具有更强的性能表现。模型在图像真实感和艺术风格方面表现突出，能够准确解析提示词并生成对应图像。基于独特的模型合并方法开发，仅限个人非商业使用，支持diffusers框架部署，通过推荐参数配置可生成细节丰富的图像。

mlx-FLUX.1-schnell - 高效文本到图像生成工具提升创意效率

AI绘图DiffusionKitFLUXGithubHuggingfacetext-to-image图像生成开源项目模型

项目在DiffusionKit MLX中提供文本到图像生成能力，适用于创意设计师及内容创作者。通过简单的命令行操作即可生成高细节图像，渲染出逼真的视觉效果。基于Apache 2.0许可证，确保广泛应用和可扩展性。

PixArt-XL-2-1024-MS - 快速训练的高性能文本到图像AI模型

AI模型GithubHuggingfacePixart-α图像生成开源项目文本生成图像模型深度学习

PixArt-XL-2-1024-MS是一个基于Transformer的文本到图像生成模型,采用纯Transformer块进行潜在扩散。该模型可直接生成1024px图像,训练效率高,仅用Stable Diffusion v1.5约10%的训练时间即达到可比性能。模型适用于艺术创作、教育工具开发等领域的研究,为探索高效文生图技术提供了新思路。

mvdream-sd2.1-diffusers - 基于多视图扩散的开源3D生成模型框架

3D生成DiffusersGithubHuggingfaceMVDream人工智能多视角扩散开源项目模型

MVDream-sd2.1-diffusers是一个开源的3D内容生成框架，基于多视图扩散技术。该项目将MVDream模型移植到Diffusers库中，实现了多视角3D生成功能。通过文本提示，用户可以创建高质量的3D模型，适用于创意设计和虚拟内容制作。项目在GitHub上提供示例代码，方便快速上手。框架设计时考虑了伦理因素，避免生成具有敌意或冒犯性的内容。

IF-I-XL-v1.0 - 先进的多级级联扩散模型实现高质量文本到图像生成

AI绘画DeepFloyd-IFGithubHuggingface开源项目扩散模型文本生成图像模型深度学习

IF-I-XL-v1.0是DeepFloyd和StabilityAI开发的三级级联扩散模型，具有4.3B参数规模。该模型采用冻结的T5转换器和改进的UNet架构，实现高质量文本到图像生成。在COCO数据集上，模型达到6.66的零样本FID-30K分数，展现出优秀的照片级真实感和语言理解能力。支持从64x64到1024x1024的多分辨率图像生成，可在14GB显存的GPU上高效运行。

stable-diffusion-inpainting - 开源AI模型实现图像修复和高质量生成

AI绘画GithubHuggingfaceStable Diffusion修复绘画图像生成开源项目文本转图像模型

Stable Diffusion Inpainting是一个开源的文本到图像生成和修复模型。它基于潜在扩散技术,可根据文本描述生成高质量图像,并能对现有图像进行智能修复。该模型在LAION-Aesthetics数据集上训练,支持512x512分辨率输出。适用于艺术创作、设计等领域,但不应用于生成有害内容。目前主要支持英文输入,其他语言效果可能有限。

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号