GPT-SoVITS-服务器
我在一台realme手机上运行了这个项目!
如果是在ubuntu上进行推理的话,你也可以看这里
这个项目的意义在于,如果你是一个应用者,可以完全舍弃源项目! 不需要复杂的环境搭建,不需要下载特别庞大的整合包,只需要这个几M的小项目,就能把训练好的模型用起来。 我在一台手机上尝试完成的服务器部署,最能说明这一点。
以下内容基本没有必要看
GPT-SoVITS项目是目前为止最优秀的语音克隆项目。 很多朋友使用云端的模型训练工具完成声音克隆的模型训练,在推理合成时,其实不需要把完整的项目都克隆到本地,只需要从云端下载好模型文件,然后放在本地或者服务器上即可。 训练模型对算力要求很高,但推理合成其实可以用CPU也行——绝大多数的服务器其实都是CPU计算,GPU服务器太贵了。
自己也懒得在很复杂的文件体系中做配置,索性从源项目提取出来了这个项目,核心内容在server.py
里面,大家可以修改里面的配置,然后使用即可。
这个版本删除了日语和英语,纯粹的中文。
系统环境:
依赖
pretrained_models下载地址:https://huggingface.co/lj1995/GPT-SoVITS/tree/main
把:chinese-hubert-base
,chinese-roberta-wwm-ext-large
下载后放到本地,记得修改server.py里面的路径即可。
windows
- 我在本地使用的是源项目提供的windows的runtime运行时环境,所以已经装好了依赖,如果有使用相同环境的,直接使用
../runtime/python.exe ./server.py
即可。 - 切记下载ffmpeg.exe放在server.py同级目录;本项目已包含,linux下不需要,删除该文件即可
- server.py里面clean_path函数一定要看注释,修改一下;
云服务器 或者 自己的安卓手机
看文章开始的提示,直接看这里
优化方向
- 重新整理代码结构
- 把原来项目中的日语、英语部分重新融合进来
- 规范化代码实现
- 优化Windows和Linux的兼容性代码
- 优化代码运行速度
- 完整提取Windows部分的运行时,后期可以考虑用GUI进行封装
- 封装一个docker
完成Windows的GUI和云服务器的部署后,大家可以在云端训练模型,然后用CPU在云端或本地电脑进行推理,而不需要再去仔细研究完整的项目,对新手或应用型选手更加友好便捷。