#Distil-Whisper
distil-whisper - 快速高效的音频转录模型
Distil-Whisper语音识别模型压缩自然语言处理机器学习Github开源项目
Distil-Whisper是OpenAI Whisper模型的蒸馏版本,速度提升6倍,模型规模缩小49%,同时保持了相近的准确性。该项目支持短语音和长语音转录,提供多个针对英语语音识别的高效模型。Distil-Whisper还可作为Whisper的辅助模型实现推测解码,在保证输出一致性的同时将速度提升2倍。
distil-medium.en - 高效快速的英语语音识别模型
模型开源项目Huggingface模型压缩Distil-Whisper语音识别GithubTransformers推理加速
Distil-Whisper是OpenAI Whisper模型的压缩版,专为英语语音识别优化。该模型速度提升6倍,体积减少49%,性能仅下降1% WER。通过教师-学生蒸馏法在22,000小时多样化音频数据上训练,可直接替代Whisper用于短长音频转录,支持流式处理。
distil-large-v2 - 高效精简的Whisper语音识别模型
模型Github模型压缩语音识别Distil-Whisper自动语音识别Huggingface开源项目Transformers
distil-large-v2是Whisper语音识别模型的蒸馏版本,推理速度提高6倍,模型体积减少49%,性能接近原始模型。采用编码器-解码器架构,通过精简解码器层数实现加速。支持英语短音频和长音频转录,可作为Whisper辅助模型进行推测解码。基于多个开源数据集训练,适用广泛语音识别场景。
distil-large-v3 - 经过蒸馏的快速轻量级语音识别模型
模型压缩transformersHuggingface模型语音识别Github开源项目自然语言处理Distil-Whisper
distil-large-v3是一个经过知识蒸馏的语音识别模型,模型大小比Whisper large-v3减少44%,推理速度提升6.3倍,同时保持相近的识别准确率。支持短语音和长语音转录,兼容多种主流语音识别框架,为用户提供快速、轻量且准确的语音识别功能。
distil-small.en - 轻量快速的英语语音识别模型,保持高准确率
语音识别Github开源项目高性能TransformersDistil-Whisper模型Huggingface模型压缩
distil-small.en是Whisper模型的轻量化版本,参数量为166M。相比原始模型,速度提升6倍,体积减少49%,在外部数据集上的识别准确率仅降低1%。支持短长音频转录,可通过Transformers等多种框架使用。适合资源受限场景,采用编码器-解码器架构,通过精简解码器提升推理效率。