WhisperClip 项目介绍
WhisperClip 是一个自动音频转录工具,旨在通过简化将语音内容转换为文字的过程来提高生活和工作效率。它利用了 OpenAI 的 Whisper 技术,为用户提供免费和便捷的音频转文本功能。用户只需轻轻一按按钮,即可将语音内容快速转为文本,并直接复制到剪贴板以供使用。
功能介绍
- 轻松点击即可录制音频。
- 使用 Whisper 技术自动转录音频(免费使用)。
- 选择将转录内容直接保存到剪贴板。
安装指南
先决条件
- 需要安装 Python 3.8 或更高版本。
- 推荐使用 CUDA 以提高性能,但不是必需的,WhisperClip 也可以在 CPU 上运行。
环境搭建
-
克隆代码仓库:
git clone https://github.com/gustavostz/whisper-clip.git cd whisper-clip
-
如果还没有安装 PyTorch,可以参考 PyTorch 官网进行安装。
-
安装必要的依赖:
pip install -r requirements.txt
选择合适的模型
根据 GPU 的显存选择适合的 Whisper 模型,以获得最佳性能。以下是可用模型及其所需显存和相对速度的表格:
大小 | 所需显存 | 相对速度 |
---|---|---|
tiny | ~1 GB | ~32x |
base | ~1 GB | ~16x |
small | ~2 GB | ~6x |
medium | ~5 GB | ~2x |
large | ~10 GB | 1x |
对于仅英语的应用,.en
模型(例如:tiny.en
,base.en
)的效果通常更佳。要更换模型,可以在 config.json
文件中修改 model_name
变量为所需的模型名称。
使用方法
运行应用程序:
python main.py
- 点击麦克风按钮开始和停止录音。
- 如果选中“保存到剪贴板”选项,转录文本将会自动复制到您的剪贴板。
配置设置
- 默认的录音快捷键是
Alt+Shift+R
,用户可以在config.json
文件中进行修改。 - 您还可以在
config.json
文件中更改用于转录的 Whisper 模型。
反馈
如果用户对更友好、可执行的 WhisperClip 版本感兴趣,项目开发者乐意考虑制作一版。欢迎通过 GitHub 提交反馈和建议。
鸣谢
该项目使用了 OpenAI 的 Whisper 技术进行音频转录。