项目介绍:AIVoiceChat
项目概述
AIVoiceChat 是一个创新的项目,旨在实现人与 AI 之间无缝、实时的语音互动。这个系统利用先进的语音解决方案,提供低延迟的语音输入响应。用户可以通过简单的语音交流,实时得到 AI 的反馈,体验智能互动带来的便利。
技术亮点
AIVoiceChat 结合了快速语音识别和实时语音生成技术。具体来说,它使用 faster_whisper 和 elevenlabs 的输入流来实现这一点。通过这些技术,用户可以在说出命令后立即获得响应,极大地提升了交互的效率和流畅度。
使用教程
环境设置
-
API 密钥:用户需要将代码中的
your_openai_key
和your_elevenlabs_key
替换为自己的 OpenAI 和 ElevenLabs API 密钥。 -
依赖安装:必须安装一些必要的 Python 库来确保程序正常运行。运行以下命令可以完成安装:
pip install openai elevenlabs pyaudio wave keyboard faster_whisper numpy torch
-
运行脚本:用户可根据自己的需要选择运行哪一个脚本:
- 使用语音自动检测功能:
python voice_talk_vad.py
- 使用手动录音开关功能:
python voice_talk.py
- 使用语音自动检测功能:
操作指南
-
对于
voice_talk_vad.py
脚本:- 仅需对着麦克风讲话即可。
- 系统会自动检测讲话并回复。
-
对于
voice_talk.py
脚本:- 按下空格键开始录音。
- 开始讲话。
- 结束讲话后再次按下空格键停止录音。
- 收听 AI 的回复。
致谢
AIVoiceChat 的成功得益于一些前沿技术及其开发者的努力:
- 感谢 faster_whisper 的开发团队。
- 感谢 ElevenLabs 提供的领先语音 API。
- 感谢 OpenAI 带来的 GPT-4 模型。
如何贡献
项目鼓励用户参与贡献。欢迎大家 fork 项目、进行改进并提交 pull requests。如果计划进行重大更改或增加新功能,请先开一个 issue 与项目维护者讨论。
AIVoiceChat 为用户提供了一个便捷、高效的语音交互平台,希望每位用户在使用过程中享受到智能和便捷的体验。