#Catalan
Wav2Vec2-Large-XLSR-53-catalan - 加泰罗尼亚语自动语音识别模型性能表现
Common VoiceWav2Vec2训练语音识别模型Github开源项目CatalanHuggingface
项目在Common Voice数据集上微调了Facebook的Wav2Vec2-Large-XLSR-53模型,专注于加泰罗尼亚语的自动语音识别,达到8.11%的WER。支持直接使用无需语言模型的音频处理,并提供使用和评估的详细方法和代码示例。模型训练中处理内存问题的策略也有介绍。用户可考虑更新版本以获取更好的性能。
alvocat-vocos-22khz - 高效的加泰罗尼亚语音频合成技术
声码器Catalan声音合成VocosHuggingfaceGithub开源项目模型语音合成
基于Vocos架构的加泰罗尼亚语音频合成器,通过80-bin Mel频谱生成高质量音频,与多种TTS模型兼容,专为从mel频谱到音频波形的转换而设计,训练于三种加泰罗尼亚语数据集,可作为hifi-gan的高效替代方案。
opus-mt-ca-pt - 加泰罗尼亚语到葡萄牙语神经机器翻译模型实现44.9 BLEU评分
PortugueseTatoebaCatalan开源项目神经网络模型模型Huggingface机器翻译Github
opus-mt-ca-pt是一个专门用于加泰罗尼亚语到葡萄牙语翻译的神经机器翻译模型。该模型采用transformer-align架构,使用SentencePiece进行分词预处理,在Tatoeba测试集上达到44.9的BLEU分数和0.658的chrF值。这个由赫尔辛基大学NLP团队于2020年发布的开源模型,提供单向翻译功能。