gTTS: 强大的Python文本转语音库

gTTS

gTTS简介

gTTS(Google Text-to-Speech)是一个Python库和命令行工具,用于与Google Translate的文本转语音API进行交互。它允许用户将文本转换为语音,并将结果保存为MP3文件或进行进一步的音频处理。gTTS支持多种语言,并提供了丰富的自定义选项,使其成为一个强大而灵活的文本转语音解决方案。

gTTS logo

主要特性

gTTS具有以下主要特性:

支持多种语言:gTTS支持Google Translate提供的所有语言,包括英语、中文、日语、法语等多种语言。
自定义语音参数:用户可以调整语速、音量等参数,以获得理想的语音效果。
长文本支持:gTTS使用自定义的语音特定句子分词器,允许处理无限长度的文本,同时保持适当的语调、缩写和小数点等。
文本预处理:提供自定义的文本预处理器,可以进行发音纠正等操作。
命令行工具:除了作为Python库使用外,gTTS还提供了一个方便的命令行工具。
灵活的输出选项:可以将语音保存为MP3文件,或输出为字节串以进行进一步处理。

安装和使用

安装

使用pip安装gTTS非常简单:

pip install gTTS

基本使用

命令行使用:

gtts-cli 'hello' --output hello.mp3

Python模块使用:

from gtts import gTTS

tts = gTTS('hello')
tts.save('hello.mp3')

高级功能

1. 语言选择

gTTS支持多种语言,可以通过lang参数指定:

tts = gTTS('你好', lang='zh-cn')

2. 语速调整

可以通过slow参数调整语速:

tts = gTTS('hello', slow=True)

3. 自定义分词器

gTTS允许用户自定义分词器,以更好地处理特定语言或文本格式:

from gtts.tokenizer import pre_processors, Tokenizer, tokenizer_cases

custom_tokenizer = Tokenizer(
    pre_processors=[pre_processors.abbreviations],
    tokenizer_cases=[tokenizer_cases.period_comma, tokenizer_cases.colon]
)

tts = gTTS('hello', tokenizer_func=custom_tokenizer.run)

4. 错误处理

gTTS提供了专门的异常类gTTSError来处理可能出现的错误:

from gtts import gTTS
from gtts.tts import gTTSError

try:
    tts = gTTS('hello')
    tts.save('hello.mp3')
except gTTSError as e:
    print(f"An error occurred: {e}")