#VoxLingua107

lang-id-voxlingua107-ecapa - 多语言语音识别模型支持107种语言

SpeechBrain语言识别ECAPA-TDNNHuggingface模型Github开源项目多语言模型VoxLingua107

该模型基于VoxLingua107数据集训练，采用ECAPA-TDNN架构，能够识别107种不同语言的语音。模型支持直接进行语言识别或用作特征提取器，适用于16kHz采样的单声道音频。通过简单的Python API，可以方便地集成到各种应用中。模型在自动收集的YouTube数据上训练，在VoxLingua107开发数据集上的错误率为6.7%。

voxlingua107-epaca-tdnn - 全新多语言识别模型，覆盖107种语言，实现精确分类

数据集语言识别Github开源项目SpeechBrainHuggingfaceVoxLingua107模型

该多语言识别模型基于SpeechBrain训练于VoxLingua107数据集，采用ECAPA-TDNN架构，可识别多达107种语言的语音。模型可用于独立的语言识别或作为嵌入特征提取器，助力开发自定义语言识别系统。训练数据源于自动采集的YouTube视频，总计6628小时的语音样本。模型在评测数据集上的误差率为7%，但在处理小众语言及带口音的语音时性能可能受限。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号