#零样本TTS

P-Flow TTS: 新一代文本转语音技术的非官方PyTorch实现

3 个月前

P-Flow 零样本TTS 语音提示语音合成流匹配生成解码器 Github 开源项目

3 个月前

USLM: 统一语音语言模型的创新与应用

3 个月前

USLM 语音语言模型 SpeechTokenizer 零样本TTS LibriTTS Github 开源项目

3 个月前

相关项目

USLM

USLM是基于SpeechTokenizer构建的统一语音语言模型，结合自回归和非自回归模型实现语音信息的分层建模。该开源项目提供完整的安装指南、预训练模型和零样本文本转语音推理流程。USLM在LibriTTS数据集上训练，展示了语音内容和副语言信息建模的能力，为语音处理研究提供新思路。

pflowtts_pytorch

pflowtts_pytorch是P-Flow论文的一个非官方实现,提供了基于语音提示的零样本文本转语音功能。该模型采用语音提示文本编码器和流匹配生成解码器,仅需少量训练数据即可实现与大规模模型相当的说话人相似度,同时具有显著更快的采样速度。在发音准确性和语音自然度方面表现出色,为高效率和高质量的语音合成提供了新的解决方案。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com