#RVQ

SpeechTokenizer: 统一的语音标记器为语音大型语言模型铺平道路

3 个月前

SpeechTokenizer 语音标记器语音语言模型 RVQ 语音信息处理 Github 开源项目

3 个月前

相关项目

SpeechTokenizer

SpeechTokenizer 是一个开源的语音标记化工具，采用编码器-解码器架构和残差向量量化技术，统一了语义和声学标记。该项目能够分层分离语音信息的不同方面，为语音语言模型提供更精确的输入。它提供了在 LibriSpeech 和 Common Voice 数据集上训练的模型，支持 16kHz 单声道语音处理。项目开源了训练代码和预训练模型，可用于语音处理研究和应用开发。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com