项目简介
ollama-voice-mac
是一个完全离线的语音助手,它利用 Mistral 7b 和 Whisper 语音识别模型,通过 Ollama 软件在 Mac 上运行。这个项目在 maudoin
提供的优秀工作基础上进行了改进,增加了对 Mac 的兼容性,并进行了一些其他的优化。
功能特色
- 完全离线:这个语音助手可以完全脱离网络工作,确保用户隐私。
- 语音识别:通过 Whisper 模型的应用,可以实现准确的语音识别。
- 适用于 Mac 平台:项目特别优化了在 Mac 上的运行能力。
安装与运行
要在 Mac 上安装和运行 ollama-voice-mac
,用户需要按照几个简单的步骤进行设置:
- 安装 Ollama:首先需要在 Mac 上安装 Ollama 应用。
- 下载 Mistral 7b 模型:使用
ollama pull mistral
命令下载该模型。 - 下载 OpenAI Whisper 模型:获取 Whisper 模型,可以选择 base.en 版本。
- 克隆项目仓库:将此项目仓库克隆到本地。
- 模型存放:将 Whisper 模型放入项目主目录下的
/whisper
文件夹中。 - 安装 Python 和 Pip:确保 Mac 上安装了 Python 和 Pip。
- 支持 PyAudio 库:对于 Apple Silicon 的支持,需安装 Homebrew 并运行
brew install portaudio
命令。 - 安装依赖:运行
pip install -r requirements.txt
安装所需依赖。 - 启动助手:通过执行
python assistant.py
启动语音助手。
提升语音质量
用户可以通过下载更高质量的语音来提升语音助手的声音效果。具体步骤如下:
- 打开系统设置,选择“辅助功能”> “朗读内容”。
- 选择系统语音并管理语音。
- 找到英文语音 “Zoe (Premium)”,并进行下载。
- 设置 “Zoe (Premium)” 为系统默认语音。
支持其他语言
要支持其他语言,用户可以编辑 assistant.yaml
文件。确保下载了相应语言的 Whisper 模型,并修改默认的 modelPath
路径。
总结
ollama-voice-mac
项目为用户提供了一个功能强大且隐私友好的语音助手选择,经过简单的设置即可在 Mac 上实现高质量的语音交互。通过项目中的详细指导,用户可以轻松安装、运行并实现多语言支持。