#ReazonSpeech

ReazonSpeech - 多模型语音识别开源工具包支持日语音频分析

ReazonSpeech语音识别深度学习开源项目自然语言处理Github

ReazonSpeech是一个开源语音识别项目，整合了多种高性能模型。它提供基于NeMo的FastConformer-RNNT模型、基于Kaldi的K2模型和基于ESPnet的Conformer-Transducer模型。此外，该项目还包含专用于日语电视节目分析的工具，有助于构建日语音频语料库。ReazonSpeech支持多个深度学习框架，为开发者提供了多样化的选择。

japanese-hubert-base - 日语HuBERT Base自监督语音学习模型

HuBERT开源项目模型Githubrinna/japanese-hubert-baseHuggingface日语语音模型ReazonSpeech自我监督学习

rinna Co., Ltd.发布的日语HuBERT Base模型，采用与原始HuBERT相同的12层变换器结构，通过ReazonSpeech语料库的19000小时语音数据进行训练，支持自监督语音表示学习。模型提供详尽的训练配置和论文参考，便于研究和应用。使用Transformers库可方便地实现日语语音处理。

相关文章

Article Cover

ReazonSpeech: 开创日语语音识别新纪元的开源项目

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号