热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#WhisperS2T
WhisperS2T: 打造高效的语音转文字流水线
2 个月前
WhisperS2T是一个为OpenAI的Whisper模型量身定制的优化语音识别流水线,支持多种推理引擎,大幅提升了转录速度,并增加了多项实用功能。本文详细介绍了这个开源项目的特性、性能表现和使用方法。
WhisperS2T
语音转文本
多后端支持
优化管道
高速推理
Github
开源项目
2 个月前
相关项目
WhisperS2T
WhisperS2T是一个为Whisper模型优化的开源语音识别管道,提供更快的转录速度。它支持OpenAI原始模型、HuggingFace模型和CTranslate2模型等多种推理引擎。该项目具有集成自定义VAD模型、智能处理音频文件、支持多语言和多任务批处理等特点,并能有效减少幻觉输出。WhisperS2T在保持高准确度的同时大幅提升转录速度,为用户提供高效的语音识别解决方案。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号