热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#语音预训练
wav2vec2-large-lv60 - 深度学习实现高性能语音识别 仅需少量标记数据
语音识别
语音预训练
模型
深度学习
Github
Wav2Vec2
音频处理
Huggingface
开源项目
Wav2Vec2是Facebook开发的语音预训练模型,通过无监督学习从原始音频中提取语音特征。该模型在大规模未标注数据上预训练后,能够以极少量的标注数据实现高性能语音识别。在LibriSpeech测试集上,全量标注数据训练可达1.8/3.3词错率;仅用1小时标注数据即超过先前100小时数据的最佳结果;10分钟标注数据也能实现4.8/8.2词错率。Wav2Vec2为低资源环境下的高质量语音识别提供了新的可能性。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号