在 Obsidian 中使用 OpenAI Whisper 实现语音转文字 🗣️📝
Obsidian Whisper 是一个插件,可以轻松将您的语音转换为书面笔记。只需说出您的想法,让 OpenAI 的 Whisper 完成剩下的工作!
🚀 开始使用
- 此插件可以从 Obsidian 内的"社区插件"中安装。
- 要使用此插件,您需要提供 OpenAI API 密钥。有关更多信息,请参阅本 README 文件的设置部分。
🎯 使用方法
访问录音控件
点击功能区按钮打开录音控件界面。
录制音频
使用"开始"按钮开始录音。您可以使用"暂停/继续"按钮暂停和恢复录音。完成后点击"停止"按钮。停止录音后,插件将自动转录音频并在指定文件夹中创建一个包含转录内容和链接音频文件的新笔记。
您可以使用
Alt + Q
快捷键快速开始或停止录音。
上传现有音频文件
您还可以转录现有的音频文件:
- 使用
Ctrl/Cmd + P
打开命令面板。 - 搜索"上传音频文件"并选择它。
- 将出现文件对话框。选择要转录的音频文件。
- 插件将转录所选文件并在指定文件夹中创建一个包含内容和链接音频文件的新笔记。
使用命令面板快速操作
"开始/停止录音"和"上传音频文件"操作也可以通过命令面板快速访问。
有关使用此插件的更多解释,请查看 TfT Hacker 撰写的文章"在 Obsidian 中使用 OpenAI Whisper 服务实现语音转文字"
⚙️ 设置
-
API 密钥:输入您的 OpenAI API 密钥以解锁 Whisper API 的高级转录功能。您可以在此链接获取 OpenAI 的密钥。如果您不熟悉 API 密钥的概念,可以在此链接了解更多信息。
-
API URL:指定用于向 Whisper API 发送请求的端点。除非您有特殊原因使用不同的端点,否则不应更改此项。
-
模型:选择用于生成文本转录的机器学习模型。除非您有特殊原因使用不同的模型,否则不应更改此项。
-
语言:指定要转录的消息的语言。有关语言和代码列表,请参阅此链接。
-
保存录音:切换此选项以在发送到 Whisper API 后保存音频文件。启用后,您可以指定保存音频文件的保管库路径。
-
录音文件夹:指定保存音频文件的保管库路径。例如:
folder/audio
。仅在启用"保存录音"时可用。 -
保存转录:切换此选项以为每次录音创建新文件,或关闭以在光标处添加转录。启用后,您可以指定保存转录的保管库路径。
-
转录文件夹:指定保存转录文件的保管库路径。例如:
folder/note
。仅在启用"保存转录"时可用。
🤝 贡献
我们欢迎并感谢社区的贡献、问题报告和功能请求!请随时访问问题页面分享您的想法和建议。
💬 Whisper API
- 有关使用 Whisper API 的其他信息,包括限制和定价,请查看 OpenAI Whisper FAQ
- 有关 Whisper API 的高级概述,请查看 OpenAI 提供的信息
⚒️ 手动安装
如果您想手动安装此插件,请按照以下步骤操作:
- 从 GitHub 仓库下载
manifest.json
、main.js
、styles.css
文件到 Obsidian 保管库中的plugins/whisper
文件夹。 - 在
设置 > 社区插件
中点击重新加载插件
按钮。 - 找到 "Whisper" 插件并启用它。
- 在插件设置中输入您的 OpenAI API 密钥。
🤩 表示感谢
您觉得这个插件有价值吗?太好了!您可以通过在这里为我买杯咖啡来支持我的编码工作并表达您的感谢。
帮助其他人发现 Obsidian Whisper 插件的魔力!如果您能在 Twitter、Reddit 或您喜欢的社交媒体平台上分享您的使用体验,我会非常高兴!
您可以在 Twitter 上找到我 @nikdanilov_。