#人脸合成

SadTalker：让静态图像开口说话的AI技术

3 个月前

3 个月前

相关项目

speech-driven-animation

Speech-Driven Animation是一个开源项目，实现语音驱动的端到端面部合成模型。该项目根据输入图像和音频生成面部动画视频，支持GRID、TIMIT和CREMA等预训练模型。通过API可输入自定义音频和图像，输出同步动画视频。项目还提供音频和视频编码器，可用于特征提取和分类任务。

SadTalker

SadTalker是一个开源AI项目，可将单张肖像图片与音频结合生成逼真的动态说话视频。项目采用3D运动系数学习技术，实现音频驱动的单图像说话人脸动画。SadTalker支持全身图像生成和多种增强模式，并提供WebUI界面。该技术可应用于内容创作、虚拟主播等领域。

投诉举报邮箱: service@vectorlightyear.com