热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#Libriheavy
libriheavy - 大规模语音识别数据集,50,000小时带标点和上下文
Github
开源项目
语音识别
数据集
Libriheavy
标点符号
上下文
Libriheavy是基于Librilight的大规模标注语音数据集,总时长达50,000小时。该数据集包含标点、大小写和上下文信息,适用于多种语音任务研究。Libriheavy提供完整版和ASR训练专用版本,支持多种数据格式。此外,项目还提供基线模型和性能排行榜,展示了在不同规模子集上的识别效果。研究人员可以通过简单步骤获取并使用这一丰富的语音识别资源。
1
1
相关文章
LibriHeavy: 50,000小时的开源自动语音识别语料库
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号