#LibriTTS
FunCodec - 开源神经语音编解码工具包
FunCodec语音编解码神经网络开源工具LibriTTSGithub开源项目
FunCodec是一个高效的开源神经语音编解码工具,提供高质量的文本到语音转换功能,并支持丰富的预训练模型。它易于安装,适用于多种数据集,持续集成最新技术,适合专业开发者和研究人员使用。
USLM - 语音信息分层建模与零样本文本转语音的统一框架
USLM语音语言模型SpeechTokenizer零样本TTSLibriTTSGithub开源项目
USLM是基于SpeechTokenizer构建的统一语音语言模型,结合自回归和非自回归模型实现语音信息的分层建模。该开源项目提供完整的安装指南、预训练模型和零样本文本转语音推理流程。USLM在LibriTTS数据集上训练,展示了语音内容和副语言信息建模的能力,为语音处理研究提供新思路。
相关文章