人体视频生成
论文列表
2018年
- Face2Face: "RGB视频的实时人脸捕捉与重演" "CVPR" (2016) [论文][项目]
- PSGAN: "基于姿势引导的人体视频生成" "ECCV" (2018) [论文]
- DVP: "深度视频肖像" "Siggraph"(2018) [论文][项目]
- Recycle-GAN: "Recycle-GAN: 无监督视频重定向" "ECCV"(2018) [论文][项目][代码]
- X2Face: "X2Face: 一个使用图像、音频和姿势编码控制人脸生成的网络" "ECCV"(2018) [论文][项目][代码]
- EBDN: "人人都能跳舞" "arXiv"(2018) [论文][项目]
- Vid2Vid: "视频到视频合成" "NIPS"(2018) [论文][项目][代码]
2019年
- NAR: "人类演员视频的神经动画和重演" "Siggraph"(2019) [论文][项目]
- TETH: "基于文本的说话头视频编辑" "Siggraph"(2019) [论文][项目]
- VPC: "基于深度视频的表演克隆" "Eurographics"(2019) [论文]
- FSTH: "少样本对抗学习的逼真神经说话头模型" "CVPR"(2019) [论文][非官方代码]
- TNA: "纹理神经化身" "CVPR"(2019) [论文][项目]
- VOCA: "语音操控角色动画" "CVPR"(2019) [论文][项目][代码]
- Audio2Face: "Audio2Face: 使用基于注意力的双向LSTM网络从单一音频生成语音/人脸动画" "arXiv"(2019) [论文]
- RSDA: "使用GAN的逼真语音驱动动画" "arXiv"(2019) [论文][项目][代码]
- LISCG: "学习个人对话手势风格" "arXiv"(2019) [论文] [项目][代码]
- AUDIO2FACE: "使用基于注意力的双向LSTM网络从单一音频生成语音/人脸动画" "ICMI"(2019)
- AvatarSim: "具有唇同步和表情能力的高保真开放式具身化身" "ICMI"(2019) 代码
- NVP: "神经语音木偶:音频驱动的面部重演" "arXiv"(2019) [论文]
- CSGN: "基于骨架的动作合成卷积序列生成" "ICCV"(2019) [论文]
- Few shot VID2VID: "少样本视频到视频合成" [论文] [项目] [代码]
- FOM: "图像动画的一阶运动模型" "NIPS"(2019) [论文] [项目] [代码]
2020年
- TransMoMo: "TransMoMo: 不变性驱动的无监督视频运动重定向" "CVPR"(2020) [论文] [项目] [代码]
- poseflow: "深度图像空间变换用于人物图像生成" "CVPR"(2020) [论文] [项目] [代码]
- PIFuHD: "PIFuHD: 用于高分辨率3D人体数字化的多层像素对齐隐函数" "CVPR(口头报告)"(2020) [论文] [项目] [代码]
- Hifi3dface:"从RGB-D自拍照创建高保真3D数字人像" "arXiv"(2020.10)[论文][项目] [代码]
- face-vid2vid:"用于视频会议的单次免视图神经说话头合成" "arXiv"(2020.11)[论文] [项目] [代码]
- HeadGan:"HeadGAN:视频和音频驱动的说话头合成" "arXiv"(2020.12)[论文]
- "基于学习的个性化头部姿势的音频驱动说话面部视频生成" "arXiv"(2020)[论文][代码]
2021年
- Talking-Face_PC-AVS:《通过隐式模块化音视频表示实现可控姿态的说话人脸生成》"CVPR"(2021) [代码][项目][演示]
- Pixel Codec Avatar《像素编解码器头像》"arXiv"(2021.04) [论文]
- MRAA《用于关节动画的运动表示》"CVPR"(2021) [项目]
- NWT《通过表示学习实现自然的音频到视频生成》"arXiv"(2021)[论文][项目]
- LipSync3D《利用姿态和光照归一化从视频中高效学习个性化3D说话人脸》"arXiv"(2021) [论文][演示]
- AD-NeRF《用于说话头合成的音频驱动神经辐射场》"ICCV"(2021) [论文][代码][演示][项目]
- LSP《实时语音肖像:实时逼真的说话头动画》[论文][代码][项目][演示]
- FaceFormer《FaceFormer:基于Transformer的语音驱动3D面部动画》"arXiv"(2021.12) [论文]
- HeadNeRF《HeadNeRF:基于NeRF的实时参数化头部模型》"arXiv"(2021.12) [论文][项目]
- FACIAL《FACIAL:通过隐式属性学习合成动态说话人脸》"ICCV"(2021) [论文][代码]
2022年
- NPFAP《用于制作的视频驱动神经物理面部资产》"arXiv"(2022.02)[论文]
- PGMPI《基于姿态引导多平面图像的实时神经角色渲染》"ECCV"(2022) [论文][代码][项目]
- VideoReTalking《基于音频的野外说话头视频编辑唇形同步》"arXiv"(2022.11) [论文][代码][项目]
- One-Shot-Talking-Face《基于单说话人音视频相关性学习的一次性说话人脸生成》"AAAI"(2022) [论文][代码][演示]
- RAD-NeRF:实时神经说话肖像合成:"arXiv"(2022.12)[论文][代码]
2023年
- SadTalker《学习逼真的3D运动系数用于风格化音频驱动的单图像说话人脸动画》"CVPR"(2023) [论文][代码][项目]
- GeneFace:通用高保真音频驱动3D说话人脸合成 "ICLRv"(2023) [项目][代码][dockerfile]
- 迈向逼真的生成式3D人脸模型 "arXiv"(2023.04) [论文][项目][代码]
- Live 3D Portrait:用于单图像肖像视图合成的实时辐射场 "SIGGRAPH" (2023) [项目][论文]
- StyleAvatar:从单个视频实时生成逼真的肖像头像 "SIGGRAPH" (2023) [代码][项目][论文]
- OTAvatar:具有可控三平面渲染的一次性说话人脸头像 [代码] "arXiv"(2023) [论文]
- DisCoHead:通过解耦控制头部姿态和面部表情的音视频驱动说话头生成 "arXiv"(2023) [项目]
- GeneFace++:通用稳定的实时音频驱动3D说话人脸生成:[项目]
- HumanRF:用于运动中人类的高保真神经辐射场 "SIGGRAPH" (2023) [项目][代码]
- PointAvatar:基于视频的可变形点头像 "CVPR"(2023) [项目][代码][论文]
- SyncTalk:SyncTalk:说话头合成的魔鬼😈在于同步 "arXiv(2023.11)[项目][代码]
2024年
- Real3D-Portait: 真实3D肖像:一次性逼真3D会说话的肖像合成 "ICLR(2024)" [项目][代码][论文]
- EMO: 生动的肖像动画 - 使用弱条件下的音频到视频扩散模型生成富有表现力的肖像视频 "arXiv"(2024.02) [项目][论文][代码]
应用
换脸
- ZAO:一款热门应用。