#VoxLingua107
lang-id-voxlingua107-ecapa - 多语言语音识别模型 支持107种语言
SpeechBrain语言识别ECAPA-TDNNHuggingface模型Github开源项目多语言模型VoxLingua107
该模型基于VoxLingua107数据集训练,采用ECAPA-TDNN架构,能够识别107种不同语言的语音。模型支持直接进行语言识别或用作特征提取器,适用于16kHz采样的单声道音频。通过简单的Python API,可以方便地集成到各种应用中。模型在自动收集的YouTube数据上训练,在VoxLingua107开发数据集上的错误率为6.7%。
voxlingua107-epaca-tdnn - 全新多语言识别模型,覆盖107种语言,实现精确分类
数据集语言识别Github开源项目SpeechBrainHuggingfaceVoxLingua107模型
该多语言识别模型基于SpeechBrain训练于VoxLingua107数据集,采用ECAPA-TDNN架构,可识别多达107种语言的语音。模型可用于独立的语言识别或作为嵌入特征提取器,助力开发自定义语言识别系统。训练数据源于自动采集的YouTube视频,总计6628小时的语音样本。模型在评测数据集上的误差率为7%,但在处理小众语言及带口音的语音时性能可能受限。