#语音助手
ollama-voice-mac 入门指南 - 基于 Mac 的本地离线语音助手
GPT Assistant: 一款免费强大的Android语音助手
ollama-voice-mac
Ollama-voice-mac是一个离线语音助手,利用Ollama和Whisper语音识别模型工作。通过安装Ollama、Mistral 7b和OpenAI Whisper Model,即可在Mac上运行。该项目基于maudoin的工作进行了改进,兼容Mac,适用于macOS 14 Sonoma及以上版本。通过下载更高质量的系统语音,如'Zoe (Premium)',可提升语音质量。用户也可以通过修改assistant.yaml文件来支持其他语言,方便多语言使用。
make-a-smart-speaker
本文提供如何从头开始制作智能音箱的详细指南和优质资源。文章覆盖音频处理、关键词检测、语言理解至文本转语音的全面步骤,介绍开源项目如Mycroft、Snips以及Amazon Alexa和Google Assistant等硬件SDK。提供硬件套件链接,帮助开发者和技术爱好者构建并优化智能音箱项目。
JARVIS
JARVIS, 一个集成多种技术的语音个人助手,支持通过Web界面将用户的语音输入转换为文本,利用高级自然语言处理技术响应用户,兼容Python 3.8至3.11。
glados-voice-assistant
glados-voice-assistant是一款DIY型的声控助手项目,以GLaDOS角色为灵感,并使用Python构建完成。该项目能够实现语音到文本转换,并具备本地文本到语音的缓存功能,还可以进行动画眼控制以及LCD显示。通过与Home Assistant集成,它能执行灯光控制、读取天气预报等功能,并实现设备控制与传感器数据的读取。
local-talking-llm
本教程详细介绍如何在本地构建和运行功能齐全的语音助理,集成语音识别(Whisper)、语言模型对话生成(Langchain和Ollama)、语音合成(Bark)等技术。使用Python实现,适合初学者。提供了关键技术堆栈的使用方法及性能优化和用户界面开发建议。
Python-ai-assistant
Python-ai-assistant项目是一款基于Python 3.8的智能语音助手,支持异步命令执行和语音识别。主要功能包括打开网页、播放音乐、调节音量、启动办公软件、搜索信息、播报天气、设定闹钟、测试网络速度和可用性、播报新闻、拼写单词、创建提醒、启动Linux应用和执行计算等。在Ubuntu 20.04系统上可以轻松安装和使用,配置简便,立即开始体验智能助手服务。
alan-sdk-ios
alan-sdk-ios是一个开源的iOS语音AI SDK,支持Swift和Objective-C开发。该SDK能为iOS应用快速添加AI助手功能,实现智能语音交互和操作。特点包括集成简单、无需修改UI、支持实时更新对话流程,以及提供全面的测试和分析工具。通过Alan AI平台,开发者可轻松创建、嵌入和管理高质量的iOS对话式AI体验,为应用增添智能语音功能。
RealtimeSTT
RealtimeSTT是一个为实时应用设计的语音转文本库。它集成了语音活动检测、实时转录和唤醒词激活等功能,适合开发语音助手和需要快速精确语音转文本的应用。该库采用WebRTCVAD和SileroVAD进行语音检测,Faster_Whisper执行转录,Porcupine或OpenWakeWord负责唤醒词检测,体现了当前语音识别技术的先进水平。
pipecat
pipecat是一个灵活的框架,用于构建语音和多模态对话代理,适用于个人教练、会议助手、故事讲述玩具、客户支持机器人等应用。通过简单的安装和设置,代理进程可以在本地或云端运行,并支持多种第三方AI服务和传输方式。提供丰富的示例应用和代码片段,帮助开发者快速构建符合特定需求的对话系统。