#语音活动检测

Android语音活动检测(VAD)库:实现实时高效的语音识别

3 个月前

Android VAD 语音活动检测音频处理机器学习 Github 开源项目

3 个月前

深入解析VAD: 革新语音活动检测技术

3 个月前

语音活动检测 JavaScript Silero VAD ONNX Runtime 实时语音处理 Github 开源项目

3 个月前

语音活动检测技术的创新应用 - VAD.js项目解析

3 个月前

语音活动检测 JavaScript Silero VAD ONNX Runtime 实时语音处理 Github 开源项目

3 个月前

Silero VAD: 先进的语音活动检测技术

3 个月前

Silero VAD 音频处理语音活动检测声学模型 PyTorch Github 开源项目

3 个月前

相关项目

silero-vad

Silero VAD 是一种企业级预训练语音活动检测工具，具备高精确度和快速处理能力。支持多种采样率、体积小巧，适用于 IoT、移动设备和电信应用。通过 PyTorch 和 ONNX 实现高度便携，无需注册或密钥，易于集成和广泛使用。

ffsubsync

FFsubsync是一个开源的自动字幕同步工具，适用于各种语言的字幕。它通过分析视频音频和字幕文件，利用快速傅里叶变换算法找出最佳匹配点，从而解决字幕与视频不同步的问题。该工具支持多种文件格式，处理速度快，通常只需20-30秒即可完成同步。FFsubsync特别适用于处理从不同来源获取的视频和字幕文件，如下载的电影、电视剧或在线视频平台的内容。它可以有效解决由于帧率差异、剪辑不一致或时间码错误导致的字幕同步问题，为用户提供更好的观看体验。FFsubsync为提升视频观看体验提供了一个简单有效的解决方案，特别适合需要处理大量视频字幕的用户。

vad

vad是一个开源的JavaScript语音活动检测库，支持浏览器端运行。该项目基于Silero VAD模型和ONNX Runtime，提供麦克风管理、音频录制和语音段识别功能。通过简洁API，开发者可轻松将其集成到Web、Node.js和React应用中，实现实时语音检测和处理。vad为语音交互应用提供了高效且易用的底层支持。

android-vad

Android-vad项目提供语音活动检测库，支持实时音频处理和人声识别。集成了WebRTC、Silero和Yamnet三种VAD模型，分别适用于不同场景。该库可离线运行，适合移动设备上的实时语音检测应用。WebRTC模型轻量快速，Silero模型精度高，Yamnet模型则支持多种音频事件识别。

segmentation-3.0

Powerset编码为核心的开源模型，结合pyannote.audio 3.0，实现多说话者分段以及语音活动和重叠检测，适用于多种语音会议场景。

brouhaha

Brouhaha是一个基于pyannote.audio的开源音频分析模型，集成了语音活动检测、语音信噪比和C50房间声学评估功能。该模型采用多任务训练方法，在LibriSpeech、AudioSet等数据集上进行训练，能够同时处理多项语音分析任务。Brouhaha通过简单的Python接口即可使用，为语音处理和声学分析研究提供了便捷工具。该项目在GitHub上开源，为相关领域的研究人员和开发者提供了新的技术支持。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com