#优化管道

WhisperS2T: 打造高效的语音转文字流水线

3 个月前

WhisperS2T 语音转文本多后端支持优化管道高速推理 Github 开源项目

3 个月前

相关项目

WhisperS2T

WhisperS2T是一个为Whisper模型优化的开源语音识别管道，提供更快的转录速度。它支持OpenAI原始模型、HuggingFace模型和CTranslate2模型等多种推理引擎。该项目具有集成自定义VAD模型、智能处理音频文件、支持多语言和多任务批处理等特点，并能有效减少幻觉输出。WhisperS2T在保持高准确度的同时大幅提升转录速度，为用户提供高效的语音识别解决方案。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com