SummerTTS 项目介绍
SummerTTS 是一个在2023年夏季创建的独立语音合成程序(TTS),旨在方便用户在本地环境下实现中文和英文的语音合成。它以纪念那即将到来而又将逝去的夏天为主题,通过提供本地化、无网络需求的TTS服务,成为语音合成领域中的一个有趣工具。
特点与优势
- 独立性与易用性:SummerTTS 可以在本地运行,无需网络连接且没有额外的依赖。这使得程序可轻松部署,只需一键编译即可开始使用。
- 零依赖的底层计算:它使用Eigen库,这是一套基于模板的矩阵库,只需简单地包含头文件,使得程序能在C++环境中独立编译。
- 无需外部NN框架:通过Eigen自带的矩阵运算,SummerTTS 实现了神经网络的算子功能,避免依赖像PyTorch或TensorFlow这样的深度学习框架。
- 跨平台支持:在Ubuntu平台上成功编译和运行,理论上也支持其他Linux系统如Android和树莓派。在Windows平台可能需要一些小调整。
技术基础
SummerTTS 的模型基于语音合成算法VITS,并进行了基于C++的工程化。开发者通过实现 Eigen 提供的矩阵库,使其在神经网络运算中无需外部依赖,让用户能够高效地进行语音合成。
更新记录
自初始创建以来,SummerTTS 多次更新以提升性能和用户体验:
- 2023年6月16日:推出更快的英文语音合成模型,提升了英文语音合成的速度。
- 2023年6月15日:增加对纯英文语音合成的支持。
- 2023年6月9日:推出音质提升的单说话人模型。
- 持续的错误修复和改进,以及对多音字发音准确性的优化。
使用指南
用户可以按照以下步骤使用SummerTTS:
- 代码克隆:在Ubuntu Linux 环境下将代码克隆到本地。
- 模型下载:从提供的网盘下载各个语音合成模型文件,将其存放在项目的model目录中。
- 编译程序:进入Build目录,运行
cmake ..
和make
命令完成编译。 - 运行合成:通过执行编译生成的
tts_test
程序测试中文和英文语音合成。
测试代码位于 test/main.cpp
,而核心合成接口定义在 include/SynthesizerTrn.h
中。
后续计划
未来计划开放模型训练和转换脚本,同时努力提升模型的合成音质,满足用户对高品质声音的需求。
联系与支持
如果用户有疑问或需要反馈,可以通过以下方式联系项目作者:
- 邮件:120365182@qq.com
- 微信:hwang_2011
致谢
在项目开发过程中,感谢以下资源和库的支持:
- Eigen
- vits
- vits_chinese
- MB-iSTFT-VITS
- WeTextProcessing
- 其他支持开源资源
SummerTTS 的开发得益于这些工具和技术的帮助,同时也希望在使用过程中的任何法律问题能够得到有效协调解决。