Project Icon

Awesome-Image-Composition

图像合成领域资源精选 从论文到工具的全面集合

Awesome-Image-Composition汇集了图像合成领域的核心资源,包括论文、数据集和相关链接。涵盖图像融合、调和、阴影生成和对象放置等多个子领域,该项目为研究人员和开发者提供了全面的参考资料。此外,项目还包含在线演示和实用工具箱,方便用户实践和探索图像合成技术。收录了超过100篇高质量论文和20多个开源工具,是图像合成研究和应用的首选资源库。

超棒的图像合成 Awesome

我们共同创立了一家初创公司 miguo.ai,致力于利用 AIGC 技术加速漫画和动画的制作。如果您正在寻找实习或全职职位,请随时将您的简历发送至 hr@miguocomics.com


这是一个精心策划的资源列表,包括与图像合成(对象插入)相关的论文、数据集和相关链接。图像合成的目标是将一个前景插入背景图像以获得逼真的合成图像,通过解决前景和背景之间的不一致性(外观、几何和语义不一致)。 一般来说,图像合成可用于组合来自不同图像的视觉元素。


贡献

欢迎贡献。如果您希望贡献,请随时发送拉取请求。如果您对包含新部分有建议,请提出问题并在发送拉取请求之前进行讨论。

目录

在线演示

试试这个在线演示来进行图像合成,玩得开心! hot

综述

  • Li Niu, Wenyan Cong, Liu Liu, Yan Hong, Bo Zhang, Jing Liang, Liqing Zhang: "再次使图像真实:深度图像合成的全面综述。" arXiv 预印本 arXiv:2106.14490 (2021). [arXiv] [幻灯片]

工具箱

我们将 10 多个与图像合成相关的功能集成到 libcom(图像合成库)中,包括图像混合、标准/绘画风格图像协调、阴影生成、对象放置、生成式合成、质量评估等。该库的最终目标是通过简单的 import libcom 解决与图像合成相关的所有问题。

论文

1. 图像混合

Awesome-Image-Blending

2. 图像协调

Awesome-Image-Harmonization

3. 对象阴影生成

Awesome-Object-Shadow-Generation

4. 对象反射生成

  • Daniel Winter, Matan Cohen, Shlomi Fruchter, Yael Pritch, Alex Rav-Acha, Yedid Hoshen: "ObjectDrop:引导反事实对象移除和插入的真实感生成。" arXiv 预印本 arXiv:2403.18818 (2024) [arXiv]
  • Shengjie Ma, Qian Shen, Qiming Hou, Zhong Ren, Kun Zhou: "用于低频照明环境下实时增强现实渲染的神经合成。" 中国科学:信息科学 (2021) [pdf]

5. 对象放置

Awesome-Object-Placement

6. 透视变换

  • Junhong Gou, Bo Zhang, Li Niu, Jianfu Zhang, Jianlou Si, Chen Qian, Liqing Zhang: "通过关键点幻觉实现虚拟配饰试戴。" arXiv 预印本 arXiv:2310.17131 (2023) [arXiv]
  • Bo Zhang, Yue Liu, Kaixin Lu, Li Niu, Liqing Zhang: "通过对应学习实现图像合成的空间变换。" arXiv 预印本 arXiv:2207.02398 (2022) [arXiv]
  • Fangneng Zhan, Hongyuan Zhu, Shijian Lu: "用于图像合成的空间融合 GAN。" CVPR (2019) [pdf]
  • Chen-Hsuan Lin, Ersin Yumer, Oliver Wang, Eli Shechtman, Simon Lucey: "ST-GAN:用于图像合成的空间变换生成对抗网络。" CVPR (2018) [pdf] [代码]

7. 遮挡

  • Jonghyun Lee, Hansam Cho, Youngjoon Yoo, Seoung Bum Kim, Yonghyun Jeong: "合成并征服:基于扩散的 3D 深度感知可组合图像合成。" arXiv 预印本 arXiv:2401.09048 (2024) [pdf]
  • Zan Li, Wencheng Wang, Fei Hou: "带深度配准的图像合成。" IJCAI (2023) [论文]
  • Fangneng Zhan, Jiaxing Huang, Shijian Lu: "用于高保真图像合成的层次合成 GAN。" 控制论会刊 (2021) [arXiv]
  • Samaneh Azadi, Deepak Pathak, Sayna Ebrahimi, Trevor Darrell: "组合式 GAN:学习图像条件二进制组合。" IJCV (2020) [arXiv] [代码]

8. 分辨率/锐度/噪声差异

  • Jizhizi Li, Jing Zhang, Stephen J.Maybank, Dacheng Tao: "桥接合成与真实:端到端深度图像抠图。" IJCV (2021) [pdf] [代码]

9. 前景对象搜索

Awesome-Foreground-Object-Search

10. 生成式图像合成

Awesome-Generative-Image-Composition

数据集

评估

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号