#语音助手

Alan SDK for iOS: 构建智能语音交互体验

3 个月前
Cover of Alan SDK for iOS: 构建智能语音交互体验

Ollama Voice Mac: 本地离线语音助手的革新之作

2024年08月31日
Cover of Ollama Voice Mac: 本地离线语音助手的革新之作

打造自己的智能音箱:开源DIY智能音箱全攻略

2024年08月30日
Cover of 打造自己的智能音箱:开源DIY智能音箱全攻略

JARVIS: 你的个人智能语音助手

2024年08月30日
Cover of JARVIS: 你的个人智能语音助手

Pipecat: 开源语音和多模态对话AI框架

2024年08月30日
Cover of Pipecat: 开源语音和多模态对话AI框架
相关项目
Project Cover

ollama-voice-mac

Ollama-voice-mac是一个离线语音助手,利用Ollama和Whisper语音识别模型工作。通过安装Ollama、Mistral 7b和OpenAI Whisper Model,即可在Mac上运行。该项目基于maudoin的工作进行了改进,兼容Mac,适用于macOS 14 Sonoma及以上版本。通过下载更高质量的系统语音,如'Zoe (Premium)',可提升语音质量。用户也可以通过修改assistant.yaml文件来支持其他语言,方便多语言使用。

Project Cover

make-a-smart-speaker

本文提供如何从头开始制作智能音箱的详细指南和优质资源。文章覆盖音频处理、关键词检测、语言理解至文本转语音的全面步骤,介绍开源项目如Mycroft、Snips以及Amazon Alexa和Google Assistant等硬件SDK。提供硬件套件链接,帮助开发者和技术爱好者构建并优化智能音箱项目。

Project Cover

JARVIS

JARVIS, 一个集成多种技术的语音个人助手,支持通过Web界面将用户的语音输入转换为文本,利用高级自然语言处理技术响应用户,兼容Python 3.8至3.11。

Project Cover

glados-voice-assistant

glados-voice-assistant是一款DIY型的声控助手项目,以GLaDOS角色为灵感,并使用Python构建完成。该项目能够实现语音到文本转换,并具备本地文本到语音的缓存功能,还可以进行动画眼控制以及LCD显示。通过与Home Assistant集成,它能执行灯光控制、读取天气预报等功能,并实现设备控制与传感器数据的读取。

Project Cover

local-talking-llm

本教程详细介绍如何在本地构建和运行功能齐全的语音助理,集成语音识别(Whisper)、语言模型对话生成(Langchain和Ollama)、语音合成(Bark)等技术。使用Python实现,适合初学者。提供了关键技术堆栈的使用方法及性能优化和用户界面开发建议。

Project Cover

Python-ai-assistant

Python-ai-assistant项目是一款基于Python 3.8的智能语音助手,支持异步命令执行和语音识别。主要功能包括打开网页、播放音乐、调节音量、启动办公软件、搜索信息、播报天气、设定闹钟、测试网络速度和可用性、播报新闻、拼写单词、创建提醒、启动Linux应用和执行计算等。在Ubuntu 20.04系统上可以轻松安装和使用,配置简便,立即开始体验智能助手服务。

Project Cover

alan-sdk-ios

alan-sdk-ios是一个开源的iOS语音AI SDK,支持Swift和Objective-C开发。该SDK能为iOS应用快速添加AI助手功能,实现智能语音交互和操作。特点包括集成简单、无需修改UI、支持实时更新对话流程,以及提供全面的测试和分析工具。通过Alan AI平台,开发者可轻松创建、嵌入和管理高质量的iOS对话式AI体验,为应用增添智能语音功能。

Project Cover

RealtimeSTT

RealtimeSTT是一个为实时应用设计的语音转文本库。它集成了语音活动检测、实时转录和唤醒词激活等功能,适合开发语音助手和需要快速精确语音转文本的应用。该库采用WebRTCVAD和SileroVAD进行语音检测,Faster_Whisper执行转录,Porcupine或OpenWakeWord负责唤醒词检测,体现了当前语音识别技术的先进水平。

Project Cover

pipecat

pipecat是一个灵活的框架,用于构建语音和多模态对话代理,适用于个人教练、会议助手、故事讲述玩具、客户支持机器人等应用。通过简单的安装和设置,代理进程可以在本地或云端运行,并支持多种第三方AI服务和传输方式。提供丰富的示例应用和代码片段,帮助开发者快速构建符合特定需求的对话系统。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号