#SUPERB
hubert-base-superb-ks - 基于HuBERT的语音命令词识别与关键词检测模型
Github开源项目语音识别模型HuggingfaceHuBERT音频分类SUPERB关键词检测
该语音关键词检测系统基于HuBERT预训练模型开发,可识别Speech Commands数据集中的10类预设命令词、静音和未知类别。模型在测试集达到96.72%准确率,支持16kHz采样率音频输入,集成transformers pipeline接口,便于设备端快速部署和调用。
wav2vec2-base-superb-ks - 高效的关键词识别音频分类模型
Github开源项目模型Huggingface语音命令关键词识别音频分类Wav2Vec2SUPERB
Wav2Vec2-Base模型支持SUPERB关键字识别任务,具备高准确性和快速响应的特点。该模型预训练于16kHz语音音频,采用Speech Commands数据集,通过Hugging Face的管道实现关键词检测,适应实时设备应用。
wav2vec2-base-superb-er - 基于Wav2Vec2的语音情感识别模型实现高精度声学特征提取
Github开源项目语音识别模型Huggingface情感识别Wav2Vec2SUPERBIEMOCAP
wav2vec2-base-superb-er是一个针对SUPERB情感识别任务优化的语音情感识别模型。该模型可从16kHz采样的语音中提取声学特征,识别说话者的情感状态。经IEMOCAP数据集训练后,模型能识别4种主要情感类别,测试集识别准确率为62.58%。模型提供pipeline接口和直接调用方式,便于快速部署语音情感分析应用。