xtts2-ui简介
xtts2-ui是一个基于XTTS-2模型的文本语音克隆用户界面,只需10秒语音样本即可实现任意声音的克隆。该项目由GitHub用户BoltzmannEntropy开发,目前已获得242个星标和40个分叉。
主要特性
- 仅需10秒语音样本即可克隆目标声音
- 支持16种语言
- 内置语音录制和上传功能
- 简单易用的图形界面
安装与使用
- 克隆仓库:
git clone https://github.com/pbanuru/xtts2-ui.git
cd xtts2-ui
- 创建虚拟环境:
python -m venv venv
source venv/bin/activate # Linux/Mac
venv\Scripts\activate # Windows
- 安装依赖:
pip install -r requirements.txt
pip install --upgrade TTS
- 运行应用:
python app.py
# 或
streamlit run app2.py
更多详细安装步骤请参考项目README。
语言支持
xtts2-ui支持以下16种语言:
阿拉伯语、中文、捷克语、荷兰语、英语、法语、德语、匈牙利语、意大利语、日语、韩语、波兰语、葡萄牙语、俄语、西班牙语、土耳其语
语音样本
项目提供了多种语言的语音样本,您可以通过以下链接试听:
相关资源
常见问题
如果在使用过程中遇到模型重复下载的问题,可以参考GitHub Issue 4723。
总结
xtts2-ui为文本语音克隆提供了一个简单易用的界面,让用户能够快速实现声音克隆。通过本文介绍的资源,相信读者能够更好地了解和使用这一强大工具。如果您对语音克隆感兴趣,不妨尝试一下xtts2-ui! 🎤🔊