#测试集
seed-tts-eval - 零样本语音生成评估数据集与度量工具
TTS语音合成评估指标测试集AI安全Github开源项目
seed-tts-eval是一个开源项目,提供评估零样本语音生成能力的客观测试集。该测试集包含英语和中文公开语料库样本,并配备计算词错误率和说话人相似度的脚本。这套工具主要用于评估语音合成模型在跨语言和零样本场景下的性能。项目采用Common Voice和DiDiSpeech-2数据集,包含3000个测试样本。评估指标包括使用Whisper和Paraformer模型的词错误率,以及基于WavLM的说话人相似度。这些工具有助于客观评估语音合成技术的进展。
opus-mt-gem-gem - 多语言Transformer机器翻译模型 支持日耳曼语系互译
BLEU评分语言对开源项目模型Huggingface翻译模型测试集gem-gemGithub
OPUS-MT-GEM是一个基于Transformer架构的开源机器翻译模型,专注于28种日耳曼语系语言的互译需求。该模型通过SentencePiece技术进行文本预处理,采用32k规模词表,支持德语、英语、荷兰语等主流日耳曼语系语言。在WMT新闻翻译测试集上,英德互译的BLEU评分达到30分以上,展现出可靠的翻译能力。模型需要在输入句子开头添加目标语言标识符以指定翻译方向。
相关文章