#SpeechTokenizer

USLM: 统一语音语言模型的创新与应用

3 个月前

USLM 语音语言模型 SpeechTokenizer 零样本TTS LibriTTS Github 开源项目

3 个月前

SpeechTokenizer: 统一的语音标记器为语音大型语言模型铺平道路

3 个月前

SpeechTokenizer 语音标记器语音语言模型 RVQ 语音信息处理 Github 开源项目

3 个月前

相关项目

USLM

USLM是基于SpeechTokenizer构建的统一语音语言模型，结合自回归和非自回归模型实现语音信息的分层建模。该开源项目提供完整的安装指南、预训练模型和零样本文本转语音推理流程。USLM在LibriTTS数据集上训练，展示了语音内容和副语言信息建模的能力，为语音处理研究提供新思路。

SpeechTokenizer

SpeechTokenizer 是一个开源的语音标记化工具，采用编码器-解码器架构和残差向量量化技术，统一了语义和声学标记。该项目能够分层分离语音信息的不同方面，为语音语言模型提供更精确的输入。它提供了在 LibriSpeech 和 Common Voice 数据集上训练的模型，支持 16kHz 单声道语音处理。项目开源了训练代码和预训练模型，可用于语音处理研究和应用开发。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com