============ ReazonSpeech
本仓库提供了ReazonSpeech项目的主要用户工具访问。
安装
.. code:: console
$ git clone https://github.com/reazon-research/ReazonSpeech $ pip install ReazonSpeech/pkg/nemo-asr # 或 k2-asr、espnet-asr 或 espnet-oneseg
软件包
reazonspeech.nemo.asr <pkg/nemo-asr>
_
- 基于FastConformer-RNNT实现快速、准确的语音识别。
- 总参数数量为619M。需要
Nvidia Nemo <https://github.com/NVIDIA/NeMo>
_。
reazonspeech.k2.asr <pkg/k2-asr>
_
- 下一代Kaldi模型,速度快且准确。
- 总参数数量为159M。需要
sherpa-onnx <https://github.com/k2-fsa/sherpa-onnx>
_。
reazonspeech.espnet.asr <pkg/espnet-asr>
_
- 使用Conformer-Transducer模型进行语音识别。
- 总参数数量为120M。需要
ESPnet <https://github.com/espnet/espnet>
_。
reazonspeech.espnet.oneseg <pkg/espnet-oneseg>
_
- 提供一套分析日本"单段"电视流的工具。
- 使用此软件包创建日语音频语料库。
许可证
::
版权所有 2022-2024 Reazon Holdings, inc.
根据Apache许可证2.0版("许可证")授权;
除非遵守许可证,否则您不得使用此文件。
您可以在以下位置获取许可证副本:
http://www.apache.org/licenses/LICENSE-2.0
除非适用法律要求或书面同意,根据许可证分发的软件是基于
"按原样"分发的,不附带任何明示或暗示的担保或条件。
请参阅许可证以了解许可证下的特定语言和限制。