#人脸合成

speech-driven-animation - 语音驱动的端到端面部动画合成模型

Github开源项目深度学习Speech-Driven Animation视频动画人脸合成语音驱动

Speech-Driven Animation是一个开源项目，实现语音驱动的端到端面部合成模型。该项目根据输入图像和音频生成面部动画视频，支持GRID、TIMIT和CREMA等预训练模型。通过API可输入自定义音频和图像，输出同步动画视频。项目还提供音频和视频编码器，可用于特征提取和分类任务。

SadTalker - 将单张肖像图片与音频结合生成逼真的动态说话视频

Github开源项目深度学习AI动画人脸合成语音驱动SadTalker

SadTalker是一个开源AI项目，可将单张肖像图片与音频结合生成逼真的动态说话视频。项目采用3D运动系数学习技术，实现音频驱动的单图像说话人脸动画。SadTalker支持全身图像生成和多种增强模式，并提供WebUI界面。该技术可应用于内容创作、虚拟主播等领域。

相关文章

Article Cover

SadTalker：让静态图像开口说话的AI技术

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号