#Silero VAD

speech-to-text - 实时音频转录系统,兼容多种格式,具备高级配置
faster-whisperPython实时转录Silero VADNVIDIA GeForce RTX 3060Github开源项目
该开源项目使用Silero VAD技术检测静音部分,并结合Faster-Whisper将音频数据转录为文本。支持多种音频格式(如wav、mp3、ogg)和高级设置,如重复惩罚和无重复ngram大小。其HTML界面允许进行详细配置,并能同步显示转录结果,支持CUDA环境运行,兼容最新的Faster-Whisper版本(1.0.3),提升转录速度和准确性。
silero-vad - 企业级预训练语音活动检测工具,适用于多种平台
Silero VAD音频处理语音活动检测声学模型PyTorchGithub开源项目
Silero VAD 是一种企业级预训练语音活动检测工具,具备高精确度和快速处理能力。支持多种采样率、体积小巧,适用于 IoT、移动设备和电信应用。通过 PyTorch 和 ONNX 实现高度便携,无需注册或密钥,易于集成和广泛使用。
vad - JavaScript实时语音活动检测开源库
语音活动检测JavaScriptSilero VADONNX Runtime实时语音处理Github开源项目
vad是一个开源的JavaScript语音活动检测库,支持浏览器端运行。该项目基于Silero VAD模型和ONNX Runtime,提供麦克风管理、音频录制和语音段识别功能。通过简洁API,开发者可轻松将其集成到Web、Node.js和React应用中,实现实时语音检测和处理。vad为语音交互应用提供了高效且易用的底层支持。