elevenlabslib: 全面的Python Wrapper for ElevenLabs API

elevenlabslib

elevenlabslib: 为ElevenLabs API打造的全功能Python包装器

在人工智能和语音合成技术飞速发展的今天,ElevenLabs作为一家领先的AI语音公司,其API受到了开发者们的广泛关注。为了让Python开发者能更便捷地使用ElevenLabs的强大功能,一个名为elevenlabslib的第三方Python包应运而生。这个包为ElevenLabs API提供了全面的封装,不仅实现了API的所有功能,还添加了许多便利特性,大大简化了开发流程。

项目概览

elevenlabslib是由GitHub用户lugia19开发的开源项目,目前在GitHub上已获得149颗星和27次fork。该项目采用MIT许可证,允许开发者自由使用、修改和分发代码。

项目的主要目标是为ElevenLabs API提供一个全面且易用的Python接口。尽管ElevenLabs官方后来也发布了自己的Python SDK,但elevenlabslib仍然保持活跃开发,因为它在某些方面提供了独特的优势,特别是在音频播放控制方面。

主要特性

elevenlabslib的核心功能包括:

完整API支持: 实现了ElevenLabs API的所有功能,包括文本到语音转换、声音克隆、声音编辑等。
高级音频播放控制:
- 支持在特定输出设备上播放音频
- 可以精确控制播放开始和结束时的回调函数
- 允许从Python代码中直接控制音频播放
纯Python实现: 不依赖外部进程进行音频播放,提高了跨平台兼容性和灵活性。
丰富的文档: 提供了详细的使用文档,方便开发者快速上手和深入了解。
持续更新: 项目保持活跃开发,及时跟进ElevenLabs API的新功能和变化。

安装和依赖

安装elevenlabslib非常简单,只需要通过pip运行以下命令:

pip install elevenlabslib

需要注意的是,在Linux系统上可能需要额外安装portaudio库。对于Debian及其衍生版本,可以使用以下命令:

sudo apt-get install libportaudio2
sudo apt-get install python3-pyaudio

此外,elevenlabslib依赖libsndfile v1.1.0或更高版本来支持MP3格式。这在Windows上通常不是问题,但在其他平台上可能需要注意。

基本使用示例

以下是一个简单的使用示例,展示了如何使用elevenlabslib进行基本的文本到语音转换和音频播放:

from elevenlabslib import *

# 初始化用户对象
user = User("YOUR_API_KEY")

# 获取一个名为"Rachel"的声音
voice = user.get_voices_by_name_v2("Rachel")[0]

# 生成并播放音频
voice.generate_play_audio_v2("你好,世界!", playbackOptions=PlaybackOptions(runInBackground=False))

# 从用户历史记录中删除刚刚生成的音频
for historyItem in user.get_history_items_paginated():
    if historyItem.text == "你好,世界!":
        historyItem.delete()
        break

这个示例展示了如何初始化用户、选择声音、生成并播放音频,以及如何管理生成历史。