#离线识别
ollama-voice-mac - 离线可用的Mac专用语音助手
ollama-voice-macMistral 7bWhisper语音助手离线识别Github开源项目
Ollama-voice-mac是一个离线语音助手,利用Ollama和Whisper语音识别模型工作。通过安装Ollama、Mistral 7b和OpenAI Whisper Model,即可在Mac上运行。该项目基于maudoin的工作进行了改进,兼容Mac,适用于macOS 14 Sonoma及以上版本。通过下载更高质量的系统语音,如'Zoe (Premium)',可提升语音质量。用户也可以通过修改assistant.yaml文件来支持其他语言,方便多语言使用。
whisper_android - 介绍在Android应用中如何集成Whisper和Recorder类,进行高效的音频录制和语音识别的指南
WhisperRecorder语音识别离线识别TF LiteGithub开源项目
介绍在Android应用中如何集成Whisper和Recorder类,进行高效的音频录制和语音识别。指南提供了Whisper模型的初始化、配置和转录操作的代码片段,以及Recorder的配置和录音功能。集成过程中需注意权限、错误处理和文件路径管理,以确保应用的平稳运行。使用Whisper ASR提升应用的语音识别功能,为用户提供流畅的体验。
CapsWriter-Offline - 多功能离线语音识别和字幕转录软件
CapsWriter-Offline语音输入字幕转录离线识别热词功能Github开源项目
CapsWriter-Offline是一款功能丰富的PC端语音识别和字幕转录软件。它支持完全离线运行,提供无限时长录音、低延迟识别和高准确率转录。用户可使用大写锁定键进行语音输入,或直接拖拽音视频文件进行字幕生成。此外,该工具还具备热词定制、日记记录和关键词分类等实用功能,兼容Windows、Mac和Linux操作系统。
vosk-server - 多协议支持的高准确度离线语音识别服务器
语音识别服务器通信协议离线识别Vosk-APIGithub开源项目
vosk-server是一个基于Kaldi和Vosk-API的高准确度离线语音识别服务器。支持MQTT、GRPC、WebRTC和Websocket四种主要通信协议,适用于智能家居、PBX系统以及Web流式语音识别等场景。该服务器可本地部署,也可作为聊天机器人、网站和电话系统的后端。Vosk网站提供详细的文档和使用说明。
相关文章