Project Icon

DesignEdit

基于多层潜在表示的统一精准图像编辑框架

DesignEdit是一个创新图像编辑项目,采用多层潜在表示技术实现统一精准的编辑功能。支持对象移除、缩放、平移、移动、调整大小和翻转等操作,还可进行跨图像合成和排版重设。基于Stable Diffusion XL 1.0实现,无需额外训练即可使用。项目提供Gradio交互界面,简化了复杂的图像编辑过程。这个开源项目展示了AI在图像编辑领域的应用前景。

DesignEdit: 多层潜在分解和融合用于统一和精准的图像编辑

Stable Diffusion XL 1.0 实现

预览图

项目主页   论文   Hugging Face 演示

✨ 新闻 ✨

  • [2024/4/4] 我们已在 Hugging Face 🤗 上支持 Gradio 应用,欢迎您在线设计,无需本地部署。
  • [2024/3/28] 我们发布了 DesignEdit 的代码!让我们一起来设计吧!😍

环境配置

所需的 Python 版本是 3.10.12,Pytorch 版本是 2.0.1。 代码框架基于 Prompt-to-promptStable Diffusion 构建。

其他所需的包列在 requirements 文件中。

conda create -n DesignEdit python=3.10.12
conda activate DesignEdit
pip install -r requirements.txt

请注意,我们的模型完全是免训练的💪!!!基础模型是 Stable Diffusion XL-1.0。

演示

我们使用 Gradio 创建了一个交互式界面,如下所示。您只需在我们之前设置的环境中简单运行以下命令:

python design_app.py

页面_1

🖱️使用方法

  • 我们有 5 个功能页面用于不同的编辑操作。

💡对象移除

💡缩放

💡相机平移

💡对象移动、调整大小和翻转

💡多层编辑

  • 您可以按照每个页面内的"使用方法"说明进行操作。

页面_4

  • 对于每个页面,我们还提供了一些有趣的示例供您尝试。

页面_2

  • 请注意,多层编辑页面使用多层表示进行多种编辑任务,可以在通用表示中实现与对象移除和对象移动、调整大小和翻转相同的结果。

  • 此外,我们添加了"遮罩准备"页面,供您使用 SAM 或草图来组合多个遮罩。这在您使用多层编辑页面时可能会有用。

页面_3

更多细节

如果您有兴趣探索更多关于模型实现的细节,我们建议查看 model.py。特别注意 register_attention_control() 函数和 LayerFusion 类。

应用

关于更多应用,我们诚挚邀请您探索我们的项目主页并参考我们的论文

💡对象移除

您可以在对象移除页面选择多个对象进行移除,也可以遮罩不规则区域进行移除。

💡对象移除与精细遮罩

直接使用移除遮罩可能会导致伪影,精细遮罩表示可能导致伪影的区域。您可以转到对象移除页面进行探索。

💡相机平移和缩放

您可以使用相机平移缩放页面实现不同尺度和方向的编辑。

图像调整和遮罩准备的说明如下所示。

💡多对象编辑:移动、调整大小、翻转

您可以在对象移动、调整大小和翻转页面实现单个对象的移动、调整大小和翻转, 对于多对象编辑如交换和添加,您可以转到多层编辑页面。

💡跨图像合成

通过选择一张图像作为背景,并指定前景图像的位置、大小和放置顺序,我们可以实现跨图像合成。您可以在多层编辑页面尝试示例。

💡文字重新排版

文字重新排版指的是设计元素的特定使用,您可以在多层编辑页面实现。

致谢

我们的项目得益于几个杰出项目和技术的贡献。我们对以下项目表示感谢:

这些项目在我们工作的发展中都发挥了至关重要的作用。我们感谢他们的贡献者与社区分享他们的专业知识和资源。

BibTeX

@misc{jia2024designedit,
  title={DesignEdit: Multi-Layered Latent Decomposition and Fusion for Unified & Accurate Image Editing},
  author={Yueru Jia and Yuhui Yuan and Aosong Cheng and Chuke Wang and Ji Li and Huizhu Jia and Shanghang Zhang},
  year={2024},
  eprint={2403.14487},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号