#Distil-Whisper

distil-whisper - 快速高效的音频转录模型

Distil-Whisper语音识别模型压缩自然语言处理机器学习Github开源项目

Distil-Whisper是OpenAI Whisper模型的蒸馏版本，速度提升6倍，模型规模缩小49%，同时保持了相近的准确性。该项目支持短语音和长语音转录，提供多个针对英语语音识别的高效模型。Distil-Whisper还可作为Whisper的辅助模型实现推测解码，在保证输出一致性的同时将速度提升2倍。

distil-medium.en - 高效快速的英语语音识别模型

模型开源项目Huggingface模型压缩Distil-Whisper语音识别GithubTransformers推理加速

Distil-Whisper是OpenAI Whisper模型的压缩版，专为英语语音识别优化。该模型速度提升6倍，体积减少49%，性能仅下降1% WER。通过教师-学生蒸馏法在22,000小时多样化音频数据上训练，可直接替代Whisper用于短长音频转录，支持流式处理。

distil-large-v2 - 高效精简的Whisper语音识别模型

模型Github模型压缩语音识别Distil-Whisper自动语音识别Huggingface开源项目Transformers

distil-large-v2是Whisper语音识别模型的蒸馏版本,推理速度提高6倍,模型体积减少49%,性能接近原始模型。采用编码器-解码器架构,通过精简解码器层数实现加速。支持英语短音频和长音频转录,可作为Whisper辅助模型进行推测解码。基于多个开源数据集训练,适用广泛语音识别场景。

distil-large-v3 - 经过蒸馏的快速轻量级语音识别模型

模型压缩transformersHuggingface模型语音识别Github开源项目自然语言处理Distil-Whisper

distil-large-v3是一个经过知识蒸馏的语音识别模型,模型大小比Whisper large-v3减少44%,推理速度提升6.3倍,同时保持相近的识别准确率。支持短语音和长语音转录,兼容多种主流语音识别框架,为用户提供快速、轻量且准确的语音识别功能。

distil-small.en - 轻量快速的英语语音识别模型,保持高准确率

语音识别Github开源项目高性能TransformersDistil-Whisper模型Huggingface模型压缩

distil-small.en是Whisper模型的轻量化版本,参数量为166M。相比原始模型,速度提升6倍,体积减少49%,在外部数据集上的识别准确率仅降低1%。支持短长音频转录,可通过Transformers等多种框架使用。适合资源受限场景,采用编码器-解码器架构,通过精简解码器提升推理效率。

相关文章

Article Cover

Distil-Whisper:更快更轻的语音识别模型

2024年09月05日

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号