PlayHT API SDK
pyht是一个用于PlayHT人工智能文本转语音API的Python SDK。PlayHT构建用于实时场景的对话式语音AI模型。使用pyht,您可以轻松将文本转换为高质量的类人声音频流。
功能特点
- 实时流式文本转语音。
- 使用PlayHT的预构建语音或创建自定义语音克隆。
- 从LLM流式传输文本,并实时生成音频流。
- 支持WAV、MP3、PCM、Mulaw、FLAC和OGG音频格式。
- 支持8KHz、16KHz、24KHz、44.1KHz和48KHz采样率。
系统要求
- Python 3.8+
numpy
simpleaudio
安装
您可以使用pip安装pyht SDK:
pip install pyht
使用方法
您可以通过创建Client
实例并调用其tts
方法来使用pyht SDK。以下是一个简单示例:
from pyht import Client
from dotenv import load_dotenv
from pyht.client import TTSOptions
import os
load_dotenv()
client = Client(
user_id=os.getenv("PLAY_HT_USER_ID"),
api_key=os.getenv("PLAY_HT_API_KEY"),
)
options = TTSOptions(voice="s3://voice-cloning-zero-shot/d9ff78ba-d016-47f6-b0ef-dd630f59414e/female-cs/manifest.json")
for chunk in client.tts("您能告诉我您的账户邮箱或者,呃,您的电话号码吗?", options):
# 对音频块进行处理
print(type(chunk))
有关更详细的示例,包括命令行参数和交互模式,请参阅提供的演示。
命令行演示
您可以从命令行运行提供的演示。
**注意:**此演示依赖以下软件包:
pip install numpy simpleaudio
python demo/main.py --user 您的用户ID --key 您的API密钥 --text "来自Play的问候!"
或者,您可以在交互模式下运行演示:
python demo/main.py --user 您的用户ID --key 您的API密钥 --interactive
在交互模式下,您可以输入文本行来即时生成和播放音频。输入空行将退出交互会话。
获取API密钥
要开始使用pyht SDK,您需要您的API密钥和用户ID。按照以下步骤获取它们:
-
访问API页面: 导航至API访问页面。
-
生成您的API密钥:
- 在"Secret Key"部分下点击"Generate Secret Key"按钮。
- 您的API密钥将会显示。确保复制并安全存储。
-
找到您的用户ID: 在同一页面的"User ID"部分下找到并复制您的用户ID。
请对您的API密钥保密。不要与任何人分享或将其包含在公开访问的代码仓库中。