#Conformer
conformer - 结合卷积神经网络和Transformers的语音识别模型
ConformerPyTorch卷积神经网络Transformer语音识别Github开源项目
Conformer模型结合卷积神经网络和Transformers,能同时捕捉音频的局部和全局依赖关系,提高语音识别精度并节省参数。本项目提供该模型的PyTorch实现,包含详细的安装和使用指南,适用于Python 3.7及更高版本。
TensorflowASR - Tensorflow 2和Conformer结合的端到端语音识别解决方案
TensorflowASR语音识别ConformerCTCONNXGithub开源项目
Tensorflow 2和Conformer结构打造的端到端语音识别模型,支持在线流式和离线识别,实时率约为0.1。该项目提供VAD、降噪、TTS数据增强等功能,并支持ONNX推理优化。训练结果在Aishell-1测试集上表现优异,适用于语音识别。最新更新的Chunk Conformer结构进一步提升了长时间语音识别的准确性和效率。
wav2vec2-conformer-rope-large-960h-ft - Wav2Vec2 Conformer模型在Librispeech数据集上的语音识别应用
Huggingface模型语音识别Github开源项目LibriSpeechWav2Vec2自然语言处理Conformer
这是一个基于Wav2Vec2 Conformer架构的语音识别模型,采用旋转位置嵌入技术,在Librispeech数据集的960小时音频上完成预训练和微调。模型在Librispeech测试集上表现优异,'clean'和'other'子集的词错误率分别为1.96%和3.98%。支持16kHz采样的语音输入,适用于精确的语音转文本任务。