#XLS-R

wav2vec2-xls-r-300m-hebrew - XLS-R微调的希伯来语语音识别模型

Github开源项目语音识别微调模型HuggingfaceWav2Vec2XLS-RHebrew

该开源项目提供了一个针对希伯来语优化的语音识别模型。基于wav2vec2-xls-r-300m架构，通过两阶段训练方法在私有数据集上进行微调。模型在测试集上实现23.18%的词错误率，展示了特定语言语音识别优化的有效途径。这一模型为希伯来语自动语音识别研究和应用提供了实用工具。

wav2vec2-xls-r-1b - 大规模多语言语音预训练模型支持128种语言处理

Github开源项目语音识别预训练模型Huggingface多语言模型语音处理XLS-R

Wav2Vec2-XLS-R-1B是Facebook AI开发的大规模多语言语音预训练模型，拥有10亿参数。该模型在436K小时的公开语音数据上训练，涵盖128种语言。在CoVoST-2语音翻译基准测试中平均提升7.4 BLEU分，BABEL等语音识别任务错误率降低20%-33%。适用于语音识别、翻译和分类等任务，需要16kHz采样率的语音输入进行微调。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号