#ReazonSpeech
ReazonSpeech - 多模型语音识别开源工具包 支持日语音频分析
ReazonSpeech语音识别深度学习开源项目自然语言处理Github
ReazonSpeech是一个开源语音识别项目,整合了多种高性能模型。它提供基于NeMo的FastConformer-RNNT模型、基于Kaldi的K2模型和基于ESPnet的Conformer-Transducer模型。此外,该项目还包含专用于日语电视节目分析的工具,有助于构建日语音频语料库。ReazonSpeech支持多个深度学习框架,为开发者提供了多样化的选择。
japanese-hubert-base - 日语HuBERT Base自监督语音学习模型
HuBERT开源项目模型Githubrinna/japanese-hubert-baseHuggingface日语语音模型ReazonSpeech自我监督学习
rinna Co., Ltd.发布的日语HuBERT Base模型,采用与原始HuBERT相同的12层变换器结构,通过ReazonSpeech语料库的19000小时语音数据进行训练,支持自监督语音表示学习。模型提供详尽的训练配置和论文参考,便于研究和应用。使用Transformers库可方便地实现日语语音处理。