Project Icon

whisper-obsidian-plugin

Obsidian语音转文字插件,轻松创建笔记

Whisper-obsidian-plugin是一个集成OpenAI Whisper技术的Obsidian插件,可将语音快速转换为文字笔记。该插件支持实时录音和音频文件上传,通过快捷键和命令面板操作。它具有灵活的设置选项,支持多语言识别,允许自定义文件保存路径。这个插件为Obsidian用户提供了一种新的高效笔记创建方式。

在 Obsidian 中使用 OpenAI Whisper 实现语音转文字 🗣️📝

Obsidian Whisper 是一个插件,可以轻松将您的语音转换为书面笔记。只需说出您的想法,让 OpenAI 的 Whisper 完成剩下的工作!

🚀 开始使用

  1. 此插件可以从 Obsidian 内的"社区插件"中安装。
  2. 要使用此插件,您需要提供 OpenAI API 密钥。有关更多信息,请参阅本 README 文件的设置部分。

🎯 使用方法

访问录音控件

点击功能区按钮打开录音控件界面。

录制音频

使用"开始"按钮开始录音。您可以使用"暂停/继续"按钮暂停和恢复录音。完成后点击"停止"按钮。停止录音后,插件将自动转录音频并在指定文件夹中创建一个包含转录内容和链接音频文件的新笔记。

您可以使用 Alt + Q 快捷键快速开始或停止录音。

上传现有音频文件

您还可以转录现有的音频文件:

  • 使用 Ctrl/Cmd + P 打开命令面板。
  • 搜索"上传音频文件"并选择它。
  • 将出现文件对话框。选择要转录的音频文件。
  • 插件将转录所选文件并在指定文件夹中创建一个包含内容和链接音频文件的新笔记。

使用命令面板快速操作

"开始/停止录音"和"上传音频文件"操作也可以通过命令面板快速访问。

有关使用此插件的更多解释,请查看 TfT Hacker 撰写的文章"在 Obsidian 中使用 OpenAI Whisper 服务实现语音转文字"

⚙️ 设置

  • API 密钥:输入您的 OpenAI API 密钥以解锁 Whisper API 的高级转录功能。您可以在此链接获取 OpenAI 的密钥。如果您不熟悉 API 密钥的概念,可以在此链接了解更多信息。

  • API URL:指定用于向 Whisper API 发送请求的端点。除非您有特殊原因使用不同的端点,否则不应更改此项。

  • 模型:选择用于生成文本转录的机器学习模型。除非您有特殊原因使用不同的模型,否则不应更改此项。

  • 语言:指定要转录的消息的语言。有关语言和代码列表,请参阅此链接

  • 保存录音:切换此选项以在发送到 Whisper API 后保存音频文件。启用后,您可以指定保存音频文件的保管库路径。

  • 录音文件夹:指定保存音频文件的保管库路径。例如:folder/audio。仅在启用"保存录音"时可用。

  • 保存转录:切换此选项以为每次录音创建新文件,或关闭以在光标处添加转录。启用后,您可以指定保存转录的保管库路径。

  • 转录文件夹:指定保存转录文件的保管库路径。例如:folder/note。仅在启用"保存转录"时可用。

🤝 贡献

我们欢迎并感谢社区的贡献、问题报告和功能请求!请随时访问问题页面分享您的想法和建议。

💬 Whisper API

  • 有关使用 Whisper API 的其他信息,包括限制和定价,请查看 OpenAI Whisper FAQ
  • 有关 Whisper API 的高级概述,请查看 OpenAI 提供的信息

⚒️ 手动安装

如果您想手动安装此插件,请按照以下步骤操作:

  1. GitHub 仓库下载 manifest.jsonmain.jsstyles.css 文件到 Obsidian 保管库中的 plugins/whisper 文件夹。
  2. 设置 > 社区插件 中点击 重新加载插件 按钮。
  3. 找到 "Whisper" 插件并启用它。
  4. 在插件设置中输入您的 OpenAI API 密钥。

🤩 表示感谢

您觉得这个插件有价值吗?太好了!您可以通过在这里为我买杯咖啡来支持我的编码工作并表达您的感谢。

帮助其他人发现 Obsidian Whisper 插件的魔力!如果您能在 Twitter、Reddit 或您喜欢的社交媒体平台上分享您的使用体验,我会非常高兴!

您可以在 Twitter 上找到我 @nikdanilov_


项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号