ChatTTS-ui 项目介绍
项目概述
ChatTTS-ui 是一个简单易用的本地网页界面,它能够将文字合成为语音,并且支持中英文、数字混杂的文本输入。此外,它还提供了用于集成到其他应用中的API接口。这款工具是基于原始的 ChatTTS 项目开发的,从0.96版本起,用户在部署前需要安装ffmpeg。
功能特点
- 支持文字、数字及符号混杂的文本进行语音合成。
- 中英文混合文本处理。
- 提供便捷的API接口供开发者与其他应用程序集成。
- 支持不同音色选择与自定义音色生成,用户可以根据需要调整语音的风格。
- 支持GPU加速,尤其是对拥有英伟达显卡的用户提供更高效的性能表现。
系统要求与安装
Windows系统
- 用户可以从Releases下载预打包版本,解压后双击
app.exe
即可使用。 - 注意某些安全软件可能会错误报毒,如果遇到这种情况,可以选择退出安全软件或者使用源码进行部署。
- 如果电脑配备英伟达显卡且显存超过4GB,并安装了CUDA11.8+后,程序将支持GPU加速。
Linux系统
- 提供容器化部署与源码部署两种方式。
- 容器化部署适用于CPU和GPU两种版本,通过Docker Compose进行安装和管理。
- 源码部署要求配置好Python环境并安装ffmpeg,之后通过Git下载源码并配置虚拟环境。
MacOS系统
- 同样支持源码部署。
- 需要配置Python环境、安装ffmpeg和Git,然后通过类似Linux的步骤进行部署。
使用指南
模型下载
- 第一次使用时,系统将从huggingface.co或GitHub下载必要的模型文件到本地
asset
目录。如果网络不稳定,用户需要手动下载。
API接口
- 提供POST请求方法,通过
http://127.0.0.1:9966/tts
地址请求语音合成。 - API支持多种参数设置,包括文本内容、音色、笑声与停顿(通过prompt设置)等,返回音频文件的路径和下载URL。
故障排除
- 若GPU显存不足4GB则强制使用CPU。
- 若在配置满足条件的情况下仍无法启用GPU,可以尝试重新安装CUDA支持的torch版本。
其他应用集成
- ChatTTS-ui 可以集成到pyVideoTrans软件中,通过其提供的API与设置界面进行集成,支持视频字幕的语音合成。
结语
ChatTTS-ui 项目为希望在本地计算机上进行语音合成的用户提供了强大的工具。项目易于安装,界面友好,功能全面,非常适合需要中英文语音合成的个人用户和开发者。无论是用于个人项目还是集成到更复杂的应用程序中,ChatTTS-ui都能满足用户的需求。