#一步采样

CoMoSpeech: 单步语音合成的一致性模型

2024年09月05日

2024年09月05日

相关项目

CoMoSpeech

CoMoSpeech是一种创新的语音合成方法，通过单步扩散采样实现高质量语音生成。该模型从扩散教师模型中提炼一致性模型，在保持音频质量的同时显著提高推理速度。在文本转语音和歌声合成任务中，CoMoSpeech展现出优异性能，推理速度超过实时150倍，大幅提升了基于扩散采样的语音合成的实用性。

投诉举报邮箱: service@vectorlightyear.com