#对话场景

Audio2PhotoReal: Meta 推出通过语音驱动的逼真化身技术

2 个月前

音频到真人化身 AI合成对话场景计算机视觉深度学习 Github 开源项目

2 个月前

相关项目

audio2photoreal

audio2photoreal项目实现了音频到逼真人物对话视频的自动转换。该开源项目集成了面部表情和全身动作生成模型,能根据音频输入合成自然的人物表情和动作。项目提供预训练模型、训练代码和数据集,便于研究者复现和改进。这一技术为虚拟人物制作和视频合成领域开辟了新的可能性。

ChatTTS

ChatTTS是专注于对话场景的语音生成模型，支持中英双语。经过约10万小时的数据训练，该模型能生成高质量、自然的语音，适用于大型语言模型助手的对话任务和会话式音视频制作。项目团队计划开源基础模型，推动相关研究发展。ChatTTS具有多语言支持和易用性，为开发者和研究人员提供了便捷的文本转语音解决方案。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com