EmotiVoice简介
EmotiVoice是由网易有道开发的一款开源TTS引擎,具有以下主要特点:
- 完全免费开源
- 支持中英文双语
- 拥有2000多种不同音色
- 可以合成包含多种情感(如快乐、兴奋、悲伤、愤怒等)的语音
- 提供易用的Web界面和脚本接口
快速开始
Docker镜像方式
最简单的尝试方法是运行Docker镜像:
docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest
然后访问 http://localhost:8501 即可使用Web界面。
完整安装
- 创建conda环境:
conda create -n EmotiVoice python=3.8 -y
conda activate EmotiVoice
- 安装依赖:
pip install torch torchaudio
pip install numpy numba scipy transformers soundfile yacs g2p_en jieba pypinyin pypinyin_dict
python -m nltk.downloader "averaged_perceptron_tagger_eng"
-
下载预训练模型文件
-
运行推理
相关资源
开发计划
- 支持更多语言,如日语和韩语
- 改进情感/风格控制
- 优化性能和质量
EmotiVoice重视社区反馈,欢迎提出建议和需求。如有问题可以在GitHub上提issue或加入微信群交流。
希望这个学习资料汇总能帮助大家快速上手使用EmotiVoice。随着项目的不断发展,我们会持续更新相关内容。