xtts-webui简介
xtts-webui是一个基于XTTS(XTTSv2)的Web界面,旨在让用户可以最大限度地发挥XTTS的功能。该项目由GitHub用户daswer123开发,目前已获得500多个星标。
xtts-webui的主要特点包括:
- 易于使用的XTTSv2界面
- 支持批量处理大量文件的配音
- 能够翻译任何音频并保存声音
- 可以使用神经网络和音频工具自动改善结果
- 支持微调模型并立即使用
- 可以使用RVC、OpenVoice、Resemble Enhance等工具
- 可以自定义XTTS生成的所有参数,支持多个说话样本
安装指南
xtts-webui提供了多种安装方式,用户可以根据自己的需求选择:
1. 便携版(仅限Windows)
项目提供了一个便携版,无需安装任何依赖即可运行。点击此处下载便携版。运行只需Windows系统和至少6GB显存的NVIDIA显卡。
2. 脚本安装
Windows:
- 运行 'install.bat' 文件
- 运行 'start_xtts_webui.bat' 启动Web界面
- 在浏览器中打开控制台显示的本地地址
Linux:
- 运行 'install.sh' 文件
- 运行 'start_xtts_webui.sh' 启动Web界面
- 在浏览器中打开控制台显示的本地地址
3. 手动安装
- 确保已安装CUDA
- 克隆仓库:
git clone https://github.com/daswer123/xtts-webui
- 进入目录:
cd xtts-webui
- 创建虚拟环境:
python -m venv venv
- 激活虚拟环境
- 安装PyTorch和torchaudio
- 安装依赖:
pip install -r requirements.txt
使用教程
- 激活虚拟环境
- 运行命令启动webui:
python app.py
- 在浏览器中打开显示的本地地址
xtts-webui支持多种运行参数,如指定主机、端口、设备、语言等。详细参数说明请参考GitHub README。
相关资源
- xtts-webui GitHub仓库
- xtts-finetune-webui - 用于微调XTTS模型的单独Web界面
- Google Colab版本 - 适用于没有强力GPU的用户
- 官方XTTS文档
- xtts-api-server - 用于托管XTTSv2的FastAPI服务器
进阶技巧
- RVC后处理: 可以通过添加
--rvc
标志启用RVC模块进行音频后处理。 - 低VRAM模式: 使用
--lowvram
参数可以在不活跃处理时将模型切换到RAM。 - DeepSpeed加速: 在Windows上的Python 3.10和3.11版本中,可以使用
--deepspeed
参数启用DeepSpeed加速。
常见问题
- 训练标签目前已损坏,如需训练模型请使用单独的xtts-finetune-webui。
- 如果在步骤中意外重启界面,可以加载数据到额外的按钮中。
- 对于日语支持的问题,请参考此讨论。
xtts-webui为XTTS提供了一个功能强大且易于使用的界面,无论您是语音合成的新手还是专业用户,都能从中受益。通过本文提供的资源和指南,相信您可以快速上手并充分利用这一工具。如有任何问题,欢迎访问项目的GitHub仓库寻求帮助或提出建议。