distrifuser

高效分布式并行推理助力高分辨率图像生成

DistriFusion diffusion模型并行推理高分辨率 GPU加速 Github 开源项目

DistriFusion是一种用于高分辨率扩散模型的分布式并行推理算法。该方法无需额外训练，通过多GPU协同工作加速推理过程，同时保持图像质量。其创新的补丁交互技术解决了传统方法的碎片化问题，在高分辨率图像生成任务中显著提升了性能。该项目已在CVPR 2024被评为亮点工作，并开源了相关代码。

HunyuanDiT-v1.2-Diffusers - 基于多分辨率扩散技术的中文图像生成模型

GithubHuggingfaceHunyuanDiT中文理解人工智能图像生成多分辨率开源项目模型

HunyuanDiT-v1.2-Diffusers是一个开源的文本到图像生成模型，基于多分辨率Diffusion Transformer架构实现中英文文本理解。模型在文本-图像一致性、AI伪影控制、主体清晰度和美学评分等维度进行了测试评估，支持长文本输入和中国文化元素理解，可用于多样化的图像生成场景。

Diffus - 高精度Stable Diffusion图像生成平台

AI工具AI绘图Stable Diffusion人工智能艺术图像生成深度学习

Diffus为创意工作者提供精确控制的Stable Diffusion图像生成平台。用户可通过独特的构图控制、灯光和颜色调整等功能,轻松创作高质量图像。丰富的模型库支持多样化创作需求,适用于专业项目和个人创作。Diffus致力于帮助用户将创意概念转化为视觉作品,提升图像生成效率。

ProFusion - 高效定制化文本到图像生成的无正则化方法

AI绘图GithubProFusionStable Diffusion开源项目文本生成图像自定义模型

ProFusion是一个创新的文本到图像生成框架，专为定制预训练大规模模型而设计。该框架仅需一张测试图像和单个GPU，即可为独特概念生成多样创意图像。ProFusion采用无正则化方法，有效保留图像细节，并能构建定制数据集用于训练免调整的AI助手。此外，它还支持处理复杂输入，同时生成文本说明和图像，无需额外微调。

DragDiffusion - 基于扩散模型的交互式图像编辑工具

DragDiffusionGithub交互式人工智能图像编辑开源项目扩散模型

DragDiffusion结合扩散模型和交互式编辑，允许用户通过拖拽操作修改图像。支持真实和生成图像编辑，集成LoRA训练、自定义VAE和FreeU技术，提高编辑质量和效率。这个研究项目为图像处理提供了新的方法和工具。

Infusion - 基于扩散先验的3D高斯体场景修复技术

3D GaussiansGithub图像修复开源项目扩散模型深度补全神经渲染

InFusion项目提出了一种创新的3D场景修复方法，通过学习扩散先验的深度完成来修复3D高斯体。该技术实现了对不完整3D场景的高质量修复，能够处理复杂的遮挡情况。InFusion为3D重建和虚拟现实等领域提供了新的解决方案，项目开源了推理代码和预训练模型，为相关研究和开发提供了重要资源。

MS-Diffusion - 基于布局引导的多主体零样本图像个性化框架

GithubMS-Diffusion图像生成多主题个性化布局引导开源项目零样本学习

MS-Diffusion是一个多主体零样本图像个性化框架，利用布局引导技术提高生成质量。该框架通过接地令牌和特征重采样器保持细节保真度，并引入多主体交叉注意力机制协调主体组合。实验显示，MS-Diffusion在图像和文本保真度方面表现优异，有助于推进个性化文本到图像生成技术的发展。

ddpm-celebahq-256 - 高效的无条件图像生成与渐进解压的新型扩散模型

DDPMGithubHuggingface图像合成图像降噪开源项目无条件图像生成模型深度学习

本项目使用去噪扩散概率模型，实现了高质量的图像合成，借鉴了不平衡热力学，创新性地结合了变分界限和去噪评分匹配，并通过Langevin动力学实现渐进的解压缩。模型在CIFAR10数据集上取得了9.46的Inception得分和3.17的最新FID得分，在256x256 LSUN上样本质量与ProgressiveGAN相近。推理中可使用离散噪声调度器如ddpm、ddim或pndm，ddim和pndm在速度和质量上表现出色。项目支持用户自主训练模型，并提供官方示例用于推理和训练。

stable-diffusion-docker - 多功能 GPU 加速的 Stable Diffusion Docker 容器

DockerGPUGithubHuggingfaceStable Diffusion开源项目模型

Stable Diffusion Docker 容器在支持 CUDA 的 GPU 上运行，通过官方模型实现高质量图像生成。支持从文本生成图像、图像修改、深度引导和图像修复等功能，适用多种应用场景。最低要求 8GB VRAM 的 GPU，并提供设备选择和内存优化选项。详细使用指南和示例帮助用户快速入门。

DiffusionGPT - LLM驱动的多功能文本转图像生成系统

DiffusionGPTGithub人工智能图像生成大语言模型开源项目文本生成图像

DiffusionGPT是一个利用大型语言模型(LLM)的文本到图像生成系统。该系统能适应多种类型的提示，并整合专业领域模型。DiffusionGPT通过LLM技术，提供了一个统一的生成平台，可处理多样化的输入并生成图像。项目提供开源代码、在线演示和使用指南，方便研究人员和开发者进行实验和应用。

scoresdeve-ema-celeba-64 - 无条件图像生成的高效DiffusionPipeline

AI绘图DiffusersGithubHuggingfaceunconditional-image-generation图像生成开源项目模型模型推理

该项目通过diffusers库的DiffusionPipeline实现无条件图像生成，使用eurecom-ds/celeba数据集，并兼容CUDA设备，提供了加载预训练模型和生成图像的高效方案。模型通过固定种子实现一致的推理输出，适用于AI研究和开发。用户可以自定义推理步骤，满足不同场景下的图像生成需求，拓展计算机视觉应用。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com