#GigaSpeech

GigaSpeech: 一个革命性的大规模多领域语音识别数据集

3 个月前

GigaSpeech 语音识别数据集深度学习音频处理 Github 开源项目

3 个月前

相关项目

GigaSpeech

GigaSpeech是一个开源的多领域英语语音识别数据集，包含33,000多小时音频数据，其中10,000小时有高质量人工转录。数据来源包括有声书、播客和YouTube等，并提供多个规模的训练和评估子集。项目提供多种语音识别工具包的数据准备脚本，由志愿者维护并欢迎社区贡献，旨在促进语音技术的研究和应用。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com