与AI无缝且实时的语音互动。
提示: 任何对最先进的语音解决方案感兴趣的人,请也看看Linguflex。它让你通过说话来控制环境,是目前最强大和最复杂的开源助手之一。
使用faster_whisper和elevenlabs输入流以实现对语音输入的低延迟响应。
注意: 演示是在10Mbit/s连接上进行的,因此在更快的连接上实际性能可能会更出色。
voice_talk_vad.py
- 自动检测语音
voice_talk.py
- 使用空格键切换录音开/关
🛠 设置:
1. API 密钥:
将代码中的 your_openai_key
和 your_elevenlabs_key
替换为你的OpenAI和ElevenLabs API密钥值。
2. 依赖项:
安装所需的Python库:
pip install openai elevenlabs pyaudio wave keyboard faster_whisper numpy torch
3. 运行脚本:
根据您的模式偏好执行主脚本:
python voice_talk_vad.py
或
python voice_talk.py
🎙 使用方法:
对于 voice_talk_vad.py
:
对着麦克风说话。 聆听回复。
对于 voice_talk.py
:
- 按 空格键 开始说话。
- 畅所欲言。
- 说完后再次按 空格键。
- 聆听回复。
🤝 贡献
欢迎分叉、改进并提交拉取请求。如果您考虑进行重大更改或添加,请先打开一个问题。
💖 鸣谢
非常感谢:
- faster_whisper背后的努力开发者。
- ElevenLabs提供的尖端语音API。
- OpenAI用GPT-4模型开创未来。