#NVIDIA GeForce RTX 3060

实时语音转文字技术：基于Faster-Whisper的高效解决方案

3 个月前

faster-whisper Python 实时转录 Silero VAD NVIDIA GeForce RTX 3060 Github 开源项目

3 个月前

相关项目

speech-to-text

该开源项目使用Silero VAD技术检测静音部分，并结合Faster-Whisper将音频数据转录为文本。支持多种音频格式（如wav、mp3、ogg）和高级设置，如重复惩罚和无重复ngram大小。其HTML界面允许进行详细配置，并能同步显示转录结果，支持CUDA环境运行，兼容最新的Faster-Whisper版本（1.0.3），提升转录速度和准确性。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com