#XLS-R
wav2vec2-xls-r-300m-hebrew - XLS-R微调的希伯来语语音识别模型
Github开源项目语音识别微调模型HuggingfaceWav2Vec2XLS-RHebrew
该开源项目提供了一个针对希伯来语优化的语音识别模型。基于wav2vec2-xls-r-300m架构,通过两阶段训练方法在私有数据集上进行微调。模型在测试集上实现23.18%的词错误率,展示了特定语言语音识别优化的有效途径。这一模型为希伯来语自动语音识别研究和应用提供了实用工具。
wav2vec2-xls-r-1b - 大规模多语言语音预训练模型支持128种语言处理
Github开源项目语音识别预训练模型Huggingface多语言模型语音处理XLS-R
Wav2Vec2-XLS-R-1B是Facebook AI开发的大规模多语言语音预训练模型,拥有10亿参数。该模型在436K小时的公开语音数据上训练,涵盖128种语言。在CoVoST-2语音翻译基准测试中平均提升7.4 BLEU分,BABEL等语音识别任务错误率降低20%-33%。适用于语音识别、翻译和分类等任务,需要16kHz采样率的语音输入进行微调。