Whisper ASR 网络服务
Whisper 是一个通用语音识别模型。它在大规模多样化的音频数据集上进行训练,是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。更多详情请访问:github.com/openai/whisper
功能特性
当前版本(v1.5.0)支持以下 Whisper 模型:
快速使用
CPU
docker run -d -p 9000:9000 -e ASR_MODEL=base -e ASR_ENGINE=openai_whisper onerahmet/openai-whisper-asr-webservice:latest
GPU
docker run -d --gpus all -p 9000:9000 -e ASR_MODEL=base -e ASR_ENGINE=openai_whisper onerahmet/openai-whisper-asr-webservice:latest-gpu
更多信息请参阅:
文档
点击此处查看文档。