#语音助手

ollama-voice-mac 入门指南 - 基于 Mac 的本地离线语音助手

3 个月前

ollama-voice-mac Mistral 7b Whisper 语音助手离线识别 Github 开源项目

3 个月前

自制智能音箱完全指南 - 从零开始打造属于自己的智能语音助手

3 个月前

智能扬声器语音识别开源项目语音助手语音处理 Github

3 个月前

JARVIS入门学习资料 - 打造个人智能语音助手

3 个月前

JARVIS 语音助手 OpenAI GPT-3 Python Web接口 Github 开源项目

3 个月前

pipecat入门指南-开源语音和多模态对话AI框架

3 个月前

Pipecat AI 语音助手多模态聊天机器人 Github 开源项目

3 个月前

GPT Assistant: 一款免费强大的Android语音助手

3 个月前

GPT Assistant Android 语音助手 OpenAI API 无障碍服务 Github 开源项目

3 个月前

J.A.R.V.I.S: 一个强大的个人助理AI系统

3 个月前

J.A.R.V.I.S 语音助手人工智能 Python项目开源软件 Github 开源项目

3 个月前

EfficientWord-Net: 开源一次性学习热词检测引擎

3 个月前

EfficientWord-Net 热词检测少样本学习语音助手 Python Github 开源项目

3 个月前

Verbi: 革新语音助手技术的模块化平台

3 个月前

Verbi 语音助手模块化设计 API集成开源项目 Github

3 个月前

PI-Assistant: 一个基于树莓派和人工智能的多功能家庭语音助手

3 个月前

树莓派语音助手智能家居 MQTT HomeAssistant Github 开源项目

3 个月前

RealtimeSTT: 实时语音转文本的开源利器

3 个月前

RealtimeSTT 语音转文本实时转录语音助手唤醒词 Github 开源项目

3 个月前

相关项目

ollama-voice-mac

Ollama-voice-mac是一个离线语音助手，利用Ollama和Whisper语音识别模型工作。通过安装Ollama、Mistral 7b和OpenAI Whisper Model，即可在Mac上运行。该项目基于maudoin的工作进行了改进，兼容Mac，适用于macOS 14 Sonoma及以上版本。通过下载更高质量的系统语音，如'Zoe (Premium)'，可提升语音质量。用户也可以通过修改assistant.yaml文件来支持其他语言，方便多语言使用。

make-a-smart-speaker

本文提供如何从头开始制作智能音箱的详细指南和优质资源。文章覆盖音频处理、关键词检测、语言理解至文本转语音的全面步骤，介绍开源项目如Mycroft、Snips以及Amazon Alexa和Google Assistant等硬件SDK。提供硬件套件链接，帮助开发者和技术爱好者构建并优化智能音箱项目。

JARVIS

JARVIS, 一个集成多种技术的语音个人助手，支持通过Web界面将用户的语音输入转换为文本，利用高级自然语言处理技术响应用户，兼容Python 3.8至3.11。

glados-voice-assistant

glados-voice-assistant是一款DIY型的声控助手项目，以GLaDOS角色为灵感，并使用Python构建完成。该项目能够实现语音到文本转换，并具备本地文本到语音的缓存功能，还可以进行动画眼控制以及LCD显示。通过与Home Assistant集成，它能执行灯光控制、读取天气预报等功能，并实现设备控制与传感器数据的读取。

local-talking-llm

本教程详细介绍如何在本地构建和运行功能齐全的语音助理，集成语音识别（Whisper）、语言模型对话生成（Langchain和Ollama）、语音合成（Bark）等技术。使用Python实现，适合初学者。提供了关键技术堆栈的使用方法及性能优化和用户界面开发建议。

Python-ai-assistant

Python-ai-assistant项目是一款基于Python 3.8的智能语音助手，支持异步命令执行和语音识别。主要功能包括打开网页、播放音乐、调节音量、启动办公软件、搜索信息、播报天气、设定闹钟、测试网络速度和可用性、播报新闻、拼写单词、创建提醒、启动Linux应用和执行计算等。在Ubuntu 20.04系统上可以轻松安装和使用，配置简便，立即开始体验智能助手服务。

alan-sdk-ios

alan-sdk-ios是一个开源的iOS语音AI SDK，支持Swift和Objective-C开发。该SDK能为iOS应用快速添加AI助手功能，实现智能语音交互和操作。特点包括集成简单、无需修改UI、支持实时更新对话流程，以及提供全面的测试和分析工具。通过Alan AI平台，开发者可轻松创建、嵌入和管理高质量的iOS对话式AI体验，为应用增添智能语音功能。

RealtimeSTT

RealtimeSTT是一个为实时应用设计的语音转文本库。它集成了语音活动检测、实时转录和唤醒词激活等功能，适合开发语音助手和需要快速精确语音转文本的应用。该库采用WebRTCVAD和SileroVAD进行语音检测，Faster_Whisper执行转录，Porcupine或OpenWakeWord负责唤醒词检测，体现了当前语音识别技术的先进水平。

pipecat

pipecat是一个灵活的框架，用于构建语音和多模态对话代理，适用于个人教练、会议助手、故事讲述玩具、客户支持机器人等应用。通过简单的安装和设置，代理进程可以在本地或云端运行，并支持多种第三方AI服务和传输方式。提供丰富的示例应用和代码片段，帮助开发者快速构建符合特定需求的对话系统。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com