Project Icon

Leaderboard

多语言语音识别基准测试平台 促进ASR系统评估

SpeechColab ASR leaderboard是一个开源的语音识别基准平台,集成测试集、模型集和标准化评估流程。平台提供多样化测试数据,涵盖广泛ASR场景,支持商业API和开源模型评估。它简化了ASR系统的基准测试、复现和验证过程,方便研究人员和开发者比较不同系统性能。通过统一的评估标准,该平台有助于推动语音识别技术的持续进步。

SpeechColab ASR leaderboard

result result

1. Overview

"If you can’t measure it, you can’t improve it." -- Peter Drucker

SpeechIO leaderboard serves as an ASR benchmarking platform by providing 3 components:

  1. TestSet Zoo: A collection of test sets covering wide range of speech recognition tasks & scenarios

  2. Model Zoo: A collection of models including commercial APIs & open-sourced models

  3. Benchmarking Pipeline: a simple & well-specified pipeline to take care of data preparation / recognition / post processing / error rate evaluation.

People should be able to easily benchmark, reproduce, examine ASR systems from each other

Overview


2. TestSet Zoo: datasets/*

Academic Test Sets (EN & ZH)

已公开
UNLOCKED
编号
DATASET_ID
说明
DESCRIPTION
语言
LANGUAGE
AISHELL1_TESTtest set of AISHELL-1zh
AISHELL2_IOS_TESTtest set of AISHELL-2 (iOS channel)zh
AISHELL2_ANDROID_TESTtest set of AISHELL-2 (Android channel)zh
AISHELL2_MIC_TESTtest set of AISHELL-2 (Microphone channel)zh
ALIMEETING_EVAL_NEAR_FIELDAliMeetingzh
ALIMEETING_TEST_NEAR_FIELDAliMeetingzh
ALIMEETING_EVAL_FAR_FIELDAliMeetingzh
ALIMEETING_TEST_FAR_FIELDAliMeetingzh
LIBRISPEECH_TEST_CLEAN"test_clean" set of LibriSpeechen
LIBRISPEECH_TEST_OTHER"test_other" set of LibriSpeechen
TEDLIUM_RELEASE3_LEGACY_DEVtedlium release 3, legacy dir dev set TEDLium3en
TEDLIUM_RELEASE3_LEGACY_TESTtedlium release 3, legacy dir test set TEDLium3en
GIGASPEECH_V1.0.0_DEVdev set of GigaSpeechen
GIGASPEECH_V1.0.0_TESTtest set of GigaSpeechen
VOXPOPULI_V1.0_EN_DEVdev set of VoxPopulien
VOXPOPULI_V1.0_EN_TESTtest set of VoxPopulien
VOXPOPULI_V1.0_EN_ACCENTED_TESTaccented test set of VoxPopulien
COMMON_VOICE_V11.0_DEVdev set of Common Voiceen
COMMON_VOICE_V11.0_TESTtest set of Common Voiceen

SpeechIO Test Sets (ZH)

SpeechIO test sets are carefully curated by SpeechIO authors, crawled from publicly available sources (Youtube, TV programs, Podcast etc), covering various well-known scenarios and topics, transcribed by payed professional annotators.
已公开
UNLOCKED
编号
DATASET_ID
名称
NAME
场景
SCENARIO
内容领域
TOPIC
有效时长
DURATION (HOURS)
难度(1-5)
DIFFICULTY
SPEECHIO_ASR_ZH00000调试集
for debugging
视频会议、论坛演讲
conference & speech
经济、货币、金融
economy, currency, finance
1.0★★☆
SPEECHIO_ASR_ZH00001新闻联播新闻播报
TV News
时政
news & politics
9
SPEECHIO_ASR_ZH00002鲁豫有约访谈电视节目
TV interview
名人工作/生活
celebrity & film & music & daily
3★★☆
SPEECHIO_ASR_ZH00003天下足球专题电视节目
TV program
足球
Sports & Football & Worldcup
2.7★★☆
SPEECHIO_ASR_ZH00004罗振宇跨年演讲会场演讲
Stadium Public Speech
社会、人文、商业
Society & Culture & Business Trend
2.7★★
SPEECHIO_ASR_ZH00005李永乐讲堂在线教育
Online Education
科普
Popular Science
4.4★★★
SPEECHIO_ASR_ZH00006王者荣耀
张大仙 & 骚白
直播
Live Broadcasting
游戏
Game
1.6★★★☆
SPEECHIO_ASR_ZH00007直播带货
李佳琪 & 薇娅
直播
Live Broadcasting
电商、美妆
Makeup & Online shopping/advertising
0.9★★★★☆
SPEECHIO_ASR_ZH00008老罗语录线下培训
Offline lecture
段子、做人
Life & Purpose & Ethics
1.3★★★★☆
SPEECHIO_ASR_ZH00009故事FM播客
Podcast
人生故事、见闻
Ordinary Life Story Telling
4.5★★☆
SPEECHIO_ASR_ZH00010创业内幕播客
Podcast
创业、产品、投资
Startup & Enterprenuer & Product & Investment
4.2★★☆
SPEECHIO_ASR_ZH00011罗翔刑法法考在线教育
Online Education
法律 法考
Law & Lawyer Qualification Exams
3.4★★☆
SPEECHIO_ASR_ZH00012张雪峰考研在线教育
Online Education
考研 高校报考
University & Graduate School Entrance Exams
3.4★★★☆
SPEECHIO_ASR_ZH00013谷阿莫
牛叔说电影
短视频
VLog
电影剪辑
Movie Cuts
1.8★★★
SPEECHIO_ASR_ZH00014贫穷料理
琼斯爱生活
短视频
VLog
美食、烹饪
Food & Cooking & Gourmet
1★★★☆
SPEECHIO_ASR_ZH00015单田芳 白眉大侠评书
Traditional Podcast
江湖、武侠
Kongfu Fiction
2.2★★☆
SPEECHIO_ASR_ZH00016德云社演出剧场相声
Theater Crosstalk Show
包袱段子
Funny Stories
1★★★
SPEECHIO_ASR_ZH00017吐槽大会脱口秀电视节目
Standup Comedy
明星糗事
Celebrity Jokes
1.8★★☆
SPEECHIO_ASR_ZH00018小猪佩奇
熊出没
少儿动画
Children Cartoon
童话故事、日常
Fairy Tale
0.9★☆
SPEECHIO_ASR_ZH00019CCTV5 NBA 转播体育赛事解说
Sports Game Live
篮球、NBA
NBA Game
0.7★★★
SPEECHIO_ASR_ZH00020篮球人物纪录片
Documentary
篮球明星、成长
NBA Super Stars' Life & History
2.2★★
SPEECHIO_ASR_ZH00021汽车之家评测短视频
VLog
汽车测评
Car benchmarks, Road driving test
1.7★★★☆
SPEECHIO_ASR_ZH00022小艾大叔 豪宅带看短视频
VLog
房地产、豪宅
Realestate, Mansion tour
1.7★★★
SPEECHIO_ASR_ZH00023无聊开箱
Zealer评测
短视频
VLog
产品开箱评测
Unboxing
2★★★
SPEECHIO_ASR_ZH00024付老师种植技术短视频
VLog
农业、种植
Agriculture, Planting
2.7★★★☆
SPEECHIO_ASR_ZH00025石国鹏讲历史线下培训
Offline lecture
历史,古希腊哲学
History, Greek philosophy
1.3★★☆
SPEECHIO_ASR_ZH00026张震鬼故事广播节目
Broadcasting Program
鬼故事
Horror Stories
2.4★★★
SPEECHIO_ASR_ZH00027华语辩论世界杯辩论赛
Debates Contest
兴趣、技能、成长
Hobby, Skill, Growth
1.4★★★
SPEECHIO_ASR_ZH00028时政现场同传同声传译
Simultaneous Translation
时政、社会公共治理
News & Events on Public Governance
2.1★★★☆
SPEECHIO_ASR_ZH00029港台明星访谈
周杰伦,曾志伟
张家辉,陈小春
周星驰
口音(港台)
HongKong/Taiwan Accents
娱乐、生活、演艺
Entertainment, Acting, Musics
1.5★★★☆
SPEECHIO_ASR_ZH00030世界青年说口音(老外)
Foreigner Accents
异国文化比较
Cultural Difference
2★★★☆
SPEECHIO_ASR_ZH00031东方甄选直播
broadcast
带货,英语教学
Online advertising & English Education
2.4★★★☆
SPEECHIO_ASR_ZH00032郎朗钢琴课长视频
long-form video
音乐乐理,钢琴
Music & piano
1.7★★☆
SPEECHIO_ASR_ZH00033老石谈芯短视频
VLog
芯片
chips
2.8★★★
SPEECHIO_ASR_ZH00034电丸科技AK短视频
VLog
网络 IT
Internet tech, IT
1.4★★★☆
SPEECHIO_ASR_ZH00035新氧医美短视频
VLog
医疗美容
Medical Cosmetology
1.4★★
SPEECHIO_ASR_ZH00036交通广播交通广播
traffic radio
路况,娱乐
Traffics
1.2★★★☆
SPEECHIO_ASR_ZH00037老俞闲聊在线会议
Online meeting
闲聊
chat
2.4★★★
SPEECHIO_ASR_ZH00038电影:疯狂石头+疯狂赛车电影
Film
重庆话、山东青岛、四川成都话、河北唐山话、粤语、天津话、河南话、陕西话、闽南话,武汉话等
multiple accents
1.3★★★★☆
SPEECHIO_ASR_ZH00039电影:1942电影
Film
河南话
HeNan Accent
0.9★★★★
SPEECHIO_ASR_ZH00040电影:白鹿原电影
Film
陕西话
ShaanXi Accent
1.1★★★★★
SPEECHIO_ASR_ZH00041电影:让子弹飞电影
Film
四川话
SiChuan Accent
1.1★★★★☆
SPEECHIO_ASR_ZH00042电影:人生大事电影
Film
武汉话
WuHan Accent
0.8★★★★

Download Dataset


3. Model Zoo: models/*

EN Models

编号
MODEL_ID
类型
TYPE
厂商/作者
PROVIDER/AUTHOR
简介
DESCRIPTION
链接
URL
aliyun_api_en
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号