热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#DARPA TIMIT
wav2vec2-xls-r-300m-timit-phoneme - 改进Wav2Vec2的音素识别性能的开源AI模型
DARPA TIMIT
语音识别
Github
模型
HuggingFace
开源项目
自动语音识别
Huggingface
wav2vec2-xls-r-300m
该项目在DARPA TIMIT数据集上微调了Wav2Vec2模型,提升音素识别的精确度,展示从音频到文本的自动识别过程。使用HuggingFace的pipeline,实现了端到端处理。测试集上的字符错误率为7.996%。项目特色包括自定义音素预测方法和现代AI工具优化,有助于提高语音处理技术效率。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号