TensorVox入门学习资料 - 轻量级桌面神经网络语音合成应用
TensorVox是一款旨在实现用户友好、轻量级的桌面神经网络语音合成应用。它使用纯C++/Qt编写,通过TensorFlow C API与TensorFlow模型交互,通过LibTorch与PyTorch模型交互,无需安装庞大的Python库,只需几个DLL即可执行推理。
🚀 快速开始
- 访问GitHub仓库下载最新版本
- 解压zip文件
- 查看Google Drive文件夹获取模型和安装说明
- 阅读详细指南了解更多使用方法
📚 支持的架构
TensorVox支持来自三个仓库的模型:
- TensorFlowTTS: FastSpeech2、Tacotron2(字符和音素)和Multi-Band MelGAN
- Coqui-TTS: Tacotron2(IPA音素)和Multi-Band MelGAN
- VITS: 端到端模型(IPA重音音素)
🛠️ 构建说明
目前仅支持Windows 10 x64。
需求:
- Qt Creator
- MSVC 2017 (v141) 编译器
构建步骤:
- 下载预编译二进制依赖和包含文件
- 解压到与.pro和主源文件相同的位置
- 使用Qt Creator打开项目,添加编译器并编译
🔗 相关资源
📞 联系方式
- 在GitHub上提交issue
- 加入Discord服务器讨论
- 发送邮件至9yba9c1y@anonaddy.me
📝 许可证说明
TensorVox本身采用MIT许可证,但使用的模型可能有其他许可条款。例如,使用TensorFlowTTS模型时,请查看相关许可说明。
通过本文的介绍,相信读者对TensorVox项目有了初步的了解。欢迎大家访问GitHub仓库,尝试使用这个有趣的开源语音合成工具!