#Distil-Whisper
distil-whisper - 快速高效的音频转录模型
Github开源项目自然语言处理语音识别机器学习模型压缩Distil-Whisper
Distil-Whisper是OpenAI Whisper模型的蒸馏版本,速度提升6倍,模型规模缩小49%,同时保持了相近的准确性。该项目支持短语音和长语音转录,提供多个针对英语语音识别的高效模型。Distil-Whisper还可作为Whisper的辅助模型实现推测解码,在保证输出一致性的同时将速度提升2倍。
distil-small.en - 轻量快速的英语语音识别模型,保持高准确率
Github开源项目语音识别模型模型压缩高性能TransformersHuggingfaceDistil-Whisper
distil-small.en是Whisper模型的轻量化版本,参数量为166M。相比原始模型,速度提升6倍,体积减少49%,在外部数据集上的识别准确率仅降低1%。支持短长音频转录,可通过Transformers等多种框架使用。适合资源受限场景,采用编码器-解码器架构,通过精简解码器提升推理效率。