ChineseTtsTflite - Kotlin与TensorFlow Lite构建的离线中文文本转语音引擎

Chinese TTS TF Lite 项目介绍

项目背景

Chinese TTS TF Lite 是一个通过 Kotlin 与 JetPack Compose 搭配 Tensorflow Lite 开发的中文语音合成引擎。该项目的设计目标是实现一个可以完全离线使用的语音合成系统，支持在移动设备上实时生成语音输出。这一特性使得用户即便在没有网络连接的情况下，也能进行文字到语音的转换。

项目功能

Chinese TTS TF Lite 提供了两种可选模型：FastSpeech 和 Tacotron。两者的具体性能和适用场景各不相同：

FastSpeech：该模型速度较快，适合于中等以上配置的手机设备。虽然生成的音频质量相对不如 Tacotron，但在一些对速度要求较高的应用场景中具有明显优势。
Tacotron：生成音频的质量较高，但是需要较多的计算资源，所以在移动设备上的实用性不如 FastSpeech 这么高。目前主要用于测试目的。

这两个模型都来自于 TensorFlowTTS，而中文文字转拼音的方法则参考了 TensorflowTTS_chinese。

安装和编译

使用 Chinese TTS TF Lite 需要一定的设置和准备：

使用 Android Studio 2021.2.1 进行开发，并下载所需的模型文件和裁剪版的 TensorFlow Lite aar 文件。
将下载的模型文件解压并放置到项目的指定目录中。例如 app/src/main/assets 下需包括 baker_mapper.json、fastspeech2_quan.tflite、mb_melgan.tflite 和 tacotron2_quan.tflite。
将 aar 文件放入 app/libs 中。
使用指令 ./gradlew assembleRelease 进行项目的编译。