sherpa
sherpa
是一个使用PyTorch的开源语音-文本-文本推理框架,专注于端到端(E2E)模型,即基于转录器和CTC的模型。它提供C++和Python的API。
本项目专注于部署,即使用预训练模型进行语音转录。如果您对如何训练或微调自己的模型感兴趣,请参考icefall。
我们还有其他类似的不依赖PyTorch的项目:
sherpa-onnx
和sherpa-ncnn
也支持iOS、Android和嵌入式系统。
安装和使用
请参考https://k2-fsa.github.io/sherpa/的文档
在浏览器中试用
无需安装任何东西,直接在浏览器中试用sherpa
:
https://huggingface.co/spaces/k2-fsa/automatic-speech-recognition