#XLSR
wav2vec2-large-xlsr-53-french - 法语语音识别模型实现自动语音文本转录
Github开源项目语音识别机器学习模型HuggingfaceCommon Voice法语XLSR
该开源模型通过针对法语的深度训练,实现了法语语音到文本的自动转录功能。模型支持处理16kHz采样率的语音输入,在标准测试集上展现出较低的错误率。模型提供完整的使用示例和评估工具,可用于法语语音识别相关应用开发。
wav2vec2-large-xlsr-53-esperanto - 基于XLSR-53微调的世界语语音识别模型
Github开源项目语音识别模型HuggingfaceCommon VoiceWav2Vec2XLSREsperanto
该项目基于wav2vec2-large-xlsr-53模型,使用世界语Common Voice数据集进行微调,开发了一个世界语语音识别模型。模型在测试集上实现12.31%的词错误率(WER),支持16kHz采样率的语音输入。它可直接应用于语音识别任务,无需额外语言模型。项目详细介绍了模型的使用方法和评估过程。