kandinsky-2-2-decoder-inpaint

Kandinsky 2.2的文本引导图像修复及生成新方法

扩散模型开源项目文本到图像图像合成模型 Huggingface CLIP模型 Kandinsky 2.2 Github

Kandinsky 2.2结合Dall-E 2和潜在扩散技术，融入CLIP模型进行文本与图像编码，并实现跨CLIP模态空间的图像扩散映射，提升视觉表现力。支持文本引导的图像修复，并整合于diffusers库。用户可通过修改掩码格式进行编辑。本版本在解析性能上进行了优化，在COCO_30k数据集的零样本测试中表现出色，FID指标显示显著提升。

Github

Huggingface

介绍相关项目

Smooth-Diffusion - 提升扩散模型潜在空间平滑性的新方法

CVPR 2024GithubSmooth Diffusion图像生成开源项目扩散模型潜在空间

Smooth Diffusion是一种创新的扩散模型技术，通过优化潜在空间的平滑性来提升模型性能。这种方法在图像插值、反演和编辑任务中展现出显著优势，实现了更连续的过渡效果、更低的反演误差，以及更好的未修改内容保留。通过在训练过程中引入变化约束，Smooth Diffusion为扩散模型研究开辟了新方向。

sd-webui-inpaint-anything - 扩展使用 Segment Anything 中的蒙版在浏览器 UI 上执行稳定的扩散修复

AUTOMATIC1111GithubInpaint AnythingSegment AnythingStable DiffusionWeb UI开源项目

Inpaint Anything扩展在AUTOMATIC1111的Stable Diffusion Web UI上利用Segment Anything生成的掩码进行修复。通过简单指向所需区域来指定掩码，提高掩码创建的效率和准确性。该扩展支持v1.3.0及以上版本，提供详细的安装、运行、模型下载和高级功能指南。支持对动画风格图像和复杂模型的处理，显著节省时间和精力，提高修复质量。

DMD2 - 改进分布匹配蒸馏的快速图像合成技术

AI绘图DMD2Github图像生成开源项目文本生成图像模型蒸馏

DMD2是一种改进的分布匹配蒸馏技术，用于快速图像合成。通过消除回归损失、集成GAN损失和支持多步采样，该技术显著提升了图像生成的质量和效率。在ImageNet-64x64和COCO 2014数据集上，DMD2的FID评分超越原始模型，同时将推理成本降低500倍。此外，DMD2还能生成百万像素级图像，在少步方法中展现出卓越的视觉效果。

PAIR-Diffusion - 多模态对象级图像编辑的开源解决方案

GithubPAIR Diffusion图像编辑多模态对象级别开源项目扩散模型

PAIR-Diffusion是一个开源的多模态对象级图像编辑器。它支持外观编辑、形状修改、对象添加和变体生成等功能，可通过参考图像和文本进行控制。该项目基于PyTorch开发，兼容各种扩散模型。PAIR-Diffusion在SDv1.5上实现，并使用COCO-Stuff数据集微调。这个工具为对象级图像编辑提供了灵活精确的解决方案。

IP-Adapter-Instruct - 多任务图像生成的突破性技术

GithubIP Adapter Instruct图像生成多任务学习开源项目扩散模型条件控制

IP-Adapter-Instruct是一种先进的图像生成技术，融合了自然图像条件和指令提示。这个模型能够高效处理多种任务，包括风格迁移和对象提取，同时保持高质量输出。它克服了传统文本提示在描述图像风格和细节方面的局限性，提供了更精确的图像生成控制。IP-Adapter-Instruct在实际应用中表现出色，为扩散模型的发展提供了新的可能性。

krita-ai-diffusion - Krita中的AI生成插件，控制、整合与本地化

Generative AIGithubKritaStable Diffusion图像生成开源项目插件热门

krita-ai-diffusion是一款集成于Krita中的AI生成插件，专为图像编辑和绘画工作流程设计。它支持精准控制生成内容，如通过选择区域、使用参考图像和素描来引导图像生成。此插件与Krita的编辑工作流程完美整合，支持本地运行和开放源代码，无需依赖高性能云服务。特性包括实时绘画、图像放大、稳定扩散技术、区域文本描述、以及强大的默认及自定义预设。

awesome-ai-art-image-synthesis - AI图像生成与提示工程工具集合

AI ArtDalle2GithubMidJourneyPrompt EngineeringStableDiffusion开源项目

全面介绍Dalle2、MidJourney、StableDiffusion等AI图像生成工具和技术。提供适合初学者和高级用户的实用工具、提示和技巧，以及丰富的资源，包括商业和开源模型、提示工程工具、后处理工具和社区支持。无论是了解如何使用这些工具生成图像，还是寻找灵感和学习资源，这里都能满足需求。

DiffSketcher - 基于文本生成高质量矢量草图的新方法

AI绘图DiffSketcherGithub向量草图合成开源项目文本引导潜在扩散模型

DiffSketcher是一个基于潜在扩散模型的文本引导矢量草图合成项目。它可以根据文本描述生成高质量的矢量草图,支持素描、油画和彩色图像等多种风格。该项目提供灵活的参数配置,如调整笔画数量和迭代次数,并支持与风格迁移技术结合。DiffSketcher为艺术创作和图像生成领域提供了新的可能性。

edge-connect - 通过生成对抗网络模型提高细节再现的图像修复方法

EdgeConnectGithubPython图像修复开源项目生成对抗网络边缘生成器

EdgeConnect是一种新的图像修复方法，通过生成对抗网络模型提高细节再现。该方法包含两个步骤：首先生成图像中缺失区域的边缘，然后根据生成的边缘信息填补图像。此方法适用于Places2、CelebA及Paris Street-View等数据集。EdgeConnect引入新的边缘生成和图像补全技术，使修复结果更为真实自然。该项目基于Python和PyTorch实现，支持CUDA加速，提供完整的训练、测试和评估指南，并且免费提供预训练模型下载使用。

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号