WeTTS
面向生产的端到端文本转语音工具包
安装
安装 Python 包
pip install git+https://github.com/wenet-e2e/wetts.git
命令行使用(使用 -h
查看参数):
wetts --text "今天天气怎么样" --wav output.wav
Python 编程使用:
import wetts
# 待完成
安装用于开发和部署
我们建议使用 Anaconda 或 Miniconda 安装 WeTTS。
克隆此仓库:
git clone https://github.com/wenet-e2e/wetts.git
创建环境:
conda create -n wetts python=3.8 -y
conda activate wetts
pip install -r requirements.txt
路线图
我们主要关注端到端、生产级和设备端 TTS。我们计划使用:
- 后端:端到端模型,例如:
- 前端:
- 文本正规化:WeTextProcessing
- 韵律和多音字:基于蒸馏 BERT 模型的统一中文 TTS 前端
数据集
我们计划支持多种开源 TTS 数据集,包括但不限于:
预训练模型
运行时
我们计划支持多种硬件和平台,包括:
- x86
- Android
- 树莓派
- 其他设备端平台
export GLOG_logtostderr=1
export GLOG_v=2
cd runtime/onnxruntime
cmake -B build -DCMAKE_BUILD_TYPE=Release
cmake --build build
./build/bin/tts_main \
--frontend_flags baker_bert_onnx/frontend.flags \
--vits_flags multilingual_vits_v3_onnx/vits.flags \
--sname baker \
--text "hello我是小明。" \
--wav_path audio.wav
讨论与交流
对于中国用户,您也可以扫描左侧的二维码关注我们的 WeNet 官方公众号。 我们创建了一个微信群,以便更好地讨论和更快地回应。 请扫描右侧的个人二维码,该人负责邀请您加入聊天群。
或者您可以直接在 Github Issues 上讨论。
致谢
- 我们借鉴了 vits 的大量代码来实现 VITS。
- 我们参考了 PaddleSpeech 来生成
pinyin
词典。