KAN-TTS 项目介绍
KAN-TTS 是一个让用户能够从零开始训练自己的文本到语音(TTS)模型的项目。通过这个项目,用户可以创建高质量的语音模型,使得计算机可以将文字自然流畅地转换为语音。
支持的模型
当前,KAN-TTS 项目暂时支持 sam-bert 和 hifi-GAN 这两种模型来进行语音合成。未来将会支持更多种类的模型,以满足不同用户的需求。
支持的语言
KAN-TTS 项目支持多种语言的语音合成,具体语言及相应的模型链接如下:
- 普通话(Mandarin): 模型链接
- 英语(English): 模型链接
- 英式英语(British English): 模型链接
- 上海话(Shanghainese): 模型链接
- 四川话(Sichuanese): 模型链接
- 粤语(Cantonese): 模型链接
- 意大利语(Italian): 模型链接
- 西班牙语(Spanish): 模型链接
- 俄语(Russian): 模型链接
- 韩语(Korean): 模型链接
此外,更多语言的支持也在计划中,将陆续上线。
训练教程
如果用户希望自己动手开发训练模型,可以参考项目的训练教程。这份教程提供了详细的步骤和说明,帮助用户轻松上手。
模型演示
想要体验 KAN-TTS 的效果,可以通过ModelScope Demo进行在线演示,感受模型生成的语音表现力。
如何参与
用户可以通过以下简单命令参与项目的开发和贡献:
pip install -r requirements.txt
pre-commit install
联系我们
如有任何问题和建议,用户可以随时与项目团队联系。通过扫描下方二维码可以加入我们的钉钉讨论群,与其他用户交流经验、反馈问题。