ESP-SR 语音识别框架
乐鑫 ESP-SR 帮助用户基于 ESP32 或 ESP32-S3 芯片构建 AI 语音解决方案。
概述
ESP-SR 框架包括以下模块:
这些算法以组件的形式提供,因此可以轻松集成到您的项目中。
推荐使用 ESP32-S3/ESP32-P4,它们支持 AI 指令和更大、高速的八线 SPI PSRAM。 新算法将不再支持 ESP32 芯片。
唤醒词引擎
乐鑫唤醒词引擎 WakeNet 专为用户提供高性能和低内存占用的唤醒词检测算法而设计,使设备能够始终监听唤醒词,如"Alexa"、"你好,乐鑫"和"Hi,ESP"。
乐鑫提供两种自定义唤醒词的方式,请参阅以下文档选择适合您需求的方式: 乐鑫语音唤醒词定制流程 或 使用 TTS 样本训练唤醒词。
esp-sr 支持以下唤醒词:
唤醒词 | ESP32 | ESP32-S3/ESP32-P4 |
---|---|---|
Hi,乐鑫 | wn5_hilexin, wn5_hilexinX3 | wn9_hilexin |
你好小智 | wn5_nihaoxiaozhi,wn5_nihaoxiaozhiX3 | wn9_nihaoxiaozhi_tts |
小爱同学 | wn9_xiaoaitongxue | |
Hi,ESP | wn9_hiesp | |
Hi,M Five | wn9_himfive | |
Alexa | wn9_alexa | |
Jarvis | wn9_jarvis_tts | |
Computer | wn9_computer_tts | |
Hey,Willow | wn9_heywillow_tts | |
Sophia | wn9_sophia_tts | |
Mycroft | wn9_mycroft_tts | |
Hey,Printer | wn9_heyprinter_tts | |
Hi,Joy | wn9_hijoy_tts | |
Hey,Wand | wn9_heywanda_tts | |
Astrolabe | wn9_astrolabe_tts | |
你好小鑫 | wn9_nihaoxiaoxin_tts | |
小美同学 | wn9_xiaomeitongxue_tts | |
Hi,小星 | wn9_hixiaoxing_tts | |
小龙小龙 | wn9_xiaolongxiaolong_tts | |
喵喵同学 | wn9_miaomiaotongxue_tts | |
Hi,喵喵 | wn9_himiaomiao_tts | |
Hi,Lily/Hi,莉莉 | wn9_hilili_tts | |
Hi,Telly/Hi,泰力 | wn9_hitelly_tts | |
小滨小滨/小冰小冰 | wn9_xiaobinxiaobin_tts |
注意: _tts
后缀表示该 WakeNet 模型是通过 TTS 样本训练的。
语音命令识别
乐鑫的语音命令识别模型 MultiNet 专为提供灵活的离线语音命令识别模型而设计。使用此模型,您可以轻松添加自己的语音命令,无需重新训练模型。
目前,乐鑫 MultiNet 支持多达 300 个中文或英文语音命令,如"打开空调"和"打开卧室灯"。
esp-sr 支持以下 MultiNet 模型:
语言 | ESP32 | ESP32-S3 | ESP32-P4 |
---|---|---|---|
中文 | mn2_cn | mn5q8_cn, mn6_cn, mn7_cn | mn7_cn |
英文 | mn5q8_en, mn6_en, mn7_en | mn7_en |
音频前端
乐鑫音频前端 AFE 集成了 AEC(声学回声消除)、VAD(语音活动检测)、BSS(盲源分离)和 NS(噪声抑制)。
我们的双麦克风音频前端(AFE)已获得 Amazon Alexa Built-in 设备 的"软件音频前端解决方案"认证。
为了获得最佳性能:
- 请参考软件设计 esp-skainet。