Project Icon

SimSwap

支持高保真图像和视频处理的换脸框架

SimSwap框架实现任意换脸,支持高保真图像和视频处理。采用单一训练模型,无需再次训练。适用于学术和技术用途,提供详细的训练与测试代码。支持高分辨率数据集VGGFace2-HQ,定期更新进展。欢迎工程师加入团队。高质量案例视频可在Google Drive和Bilibili观看。

SimSwap: An Efficient Framework For High Fidelity Face Swapping

第28届ACM国际多媒体会议论文集

Pytorch的官方仓库

我们的方法可以通过单一训练模型实现图像和视频中的任意换脸**。**

我们正在招募全职工程师。如果你有兴趣,请发邮件给我的团队,邮件。具体的招聘条件请参考网站:招聘要求

训练和测试代码现已开放! google colab logo

我们正在与我们的即将到来的论文SimSwap++合作,敬请期待!

高分辨率版本的SimSwap-HQ已经支持!

simswaplogo

我们的论文可以从以下链接下载 [Arxiv] [ACM DOI]

本项目还得到了SocialBook的支持。

注意

本项目仅用于技术和学术用途。请不要将其应用于非法和不道德的场景。

如果用户违反其所在国家或地区的法律和伦理要求,本代码库不承担责任。

请不要忽略此README末尾的内容!

如果你觉得这个项目有用,请给它加星。这是对我们工作的最大肯定。

最新动态

2023-09-26: 我们修复了colab中的错误!

2023-04-25: 我们修复了“AttributeError: 'SGD' object has no attribute 'defaults' now”错误。如果你已经下载了arcface_checkpoint.tar,请重新下载。同时,你还需要更新./models/中的脚本。

2022-04-21: 对于资源有限的用户,我们提供了裁剪版的VGGFace2-224数据集 [Google Driver] VGGFace2-224 (10.8G) [Baidu Driver] [密码:lrod]。

2022-04-20: 训练脚本现已可用。我们强烈推荐大家使用我们发布的高质量数据集VGGFace2-HQ训练simswap模型。

2021-11-24: 我们已经在VGGFace2-HQ上训练了一个SimSwap-HQ的beta版本,并开源了该模型的checkpoint(如果你觉得Simswap 512很酷,请给我们VGGFace2-HQ仓库加星)。请不要忘记查看准备工作图像或视频换脸推理的最新设置。

2021-11-23: VGGFace2-HQ的google drive链接已发布。

2021-11-17: 我们发布了一个高分辨率面部数据集VGGFace2-HQ以及生成该数据集的方法。此数据集仅用于研究目的。

2021-08-30: Docker已支持,详情请参考此处

2021-08-17: 我们更新了准备工作,主要更改是默认安装了GPU版本的onnx,现在处理视频的时间大大缩短。

2021-07-19: 明显的边界突兀问题已解决。我们增加了使用蒙版的功能并升级了旧的算法以获得更好的视觉效果,详情请查看图像或视频换脸推理。请不要忘记查看准备工作以检查最新设置。(感谢@woctezuma@instant-high的帮助)

第一个开源的高分辨率换脸数据集!

高分辨率数据集VGGFace2-HQ

logo

依赖

  • python3.6+
  • pytorch1.5+
  • torchvision
  • opencv
  • pillow
  • numpy
  • imageio
  • moviepy
  • insightface
  • timm==0.5.4

训练

准备工作

训练脚本与原版稍有不同,例如,我们将patch判别器替换为projected判别器,这节省了大量的硬件开销并取得了略好的结果。

为了确保正常训练,batch size必须大于1。

友情提醒,由于训练设置的不同,用户训练的模型在视觉效果上与我们提供的预训练模型会有细微差别。

为了更快地收敛和更好的结果,推荐较大的batch size(超过16)!

我们推荐训练超过400K次迭代(batch size为16),600K~800K会更好,不推荐更多的迭代次数。

python train.py --name simswap224_test --batchSize 8  --gpu_ids 0 --dataset /path/to/VGGFace2HQ --Gdeep False

[用于训练224模型的Colab演示] google colab logo

为了更快地收敛和更好的结果,推荐较大的batch size(超过16)!

  • 使用VGGFace2-HQ 512*512训练512模型VGGFace2-HQ
python train.py --name simswap512_test  --batchSize 16  --gpu_ids 0 --dataset /path/to/VGGFace2HQ --Gdeep True

使用预训练的SimSwap模型进行推理

准备工作

图像或视频换脸推理

Colab演示

更强的功能

[用于多脸视频中特定脸部切换的Colab] google colab logo

图像换脸演示 & Docker镜像在Replicate上

视频

结果

Results1

Results2 高质量视频请参见以下链接:

[Mama(视频)1080p]

[Google Drive 链接 视频 1]

[Google Drive 链接 视频 2]

[Google Drive 链接 视频 3]

[百度云盘链接] 密码:b26n

[在线视频]

用户案例

如果你在使用我们的项目后有一些有趣的结果并愿意分享,你可以通过电子邮件或在问题页面上直接分享。稍后,我们可能会单独设立一个部分来展示这些结果,这应该会很酷。

同时,如果你对我们的项目有任何建议,请随时在问题页面提问,或直接通过以下电子邮件联系我们:email1email2email3。(三个都可以,只需选择一个)

许可

仅限学术和非商业用途。整个项目以 CC-BY-NC 4.0 许可证发布。有关详细信息,请参见 LICENSE

论文引用

@inproceedings{DBLP:conf/mm/ChenCNG20,
  author    = {Renwang Chen and
               Xuanhong Chen and
               Bingbing Ni and
               Yanhao Ge},
  title     = {SimSwap: An Efficient Framework For High Fidelity Face Swapping},
  booktitle = {{MM} '20: The 28th {ACM} International Conference on Multimedia},
  year      = {2020}
}
@Article{simswapplusplus,
    author  = {Xuanhong Chen and
              Bingbing Ni and
              Yutian Liu and
              Naiyuan Liu and
              Zhilin Zeng and
              Hang Wang},
    title   = {SimSwap++: Towards Faster and High-Quality Identity Swapping},
    journal = {{IEEE} Trans. Pattern Anal. Mach. Intell.},
    volume  = {46},
    number  = {1},
    pages   = {576--592},
    year    = {2024}
}

相关项目

请参观我们另一个ACMMM2020高质量风格迁移项目

logo

title

请参观我们AAAI2021基于草图的渲染项目

logo title

请参观我们高分辨率面部数据集VGGFace2-HQ

logo

了解我们的其他项目

[VGGFace2-HQ];

[RainNet];

[草图生成];

[CooGAN];

[知识风格迁移];

[SimSwap];

[ASMA-GAN];

[SNGAN-Projection-pytorch];

[预训练VGG19].

致谢

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号