vits-simple-api简介
vits-simple-api是一个简单的VITS HTTP API项目,通过扩展Moegoe开发而来,提供了便捷的语音合成服务。该项目支持多种语音合成模型,包括VITS、HuBert-VITS、Bert-VITS2等,可以实现文本到语音的转换、声音转换等功能。
主要功能
- VITS文本到语音合成
- 语音转换
- 支持多种模型:VITS、HuBert-VITS、Bert-VITS2、W2V2-VITS、GPT-SoVITS等
- 支持加载多个模型
- 自动语言识别和处理
- 长文本分段处理
- GPU加速推理
- 提供Web UI界面
快速部署
vits-simple-api提供了多种部署方式:
- Docker部署(推荐Linux系统使用)
- 虚拟环境部署
- Windows快速部署包
对于Linux用户,推荐使用Docker进行部署:
bash -c "$(wget -O- https://raw.githubusercontent.com/Artrajz/vits-simple-api/main/vits-simple-api-installer-latest.sh)"
部署完成后,需要导入模型才能使用语音合成功能。
模型加载
- 下载VITS模型文件,放入
data/models
文件夹 - 修改
config.yaml
配置文件,设置模型路径 - 也可以通过Web管理界面加载模型
API使用
vits-simple-api提供了丰富的API:
- GET
/voice/vits
: 进行VITS语音合成 - POST
/voice/vits
: 支持更多参数的VITS合成 - GET
/voice/speakers
: 获取可用说话人列表
API支持设置语言、说话人ID、音频格式等多种参数。
Web界面
- 推理前端: http://127.0.0.1:23456
- 管理后台: http://127.0.0.1:23456/admin
通过Web界面可以方便地进行语音合成测试和模型管理。
更多资源
- 项目GitHub: https://github.com/Artrajz/vits-simple-api
- 在线演示: https://huggingface.co/spaces/Artrajz/vits-simple-api
- 详细文档: https://github.com/Artrajz/vits-simple-api#readme
vits-simple-api为开发者提供了强大而简单的语音合成API,欢迎大家使用并提出宝贵意见!