项目概述
opus-mt-en-eu是一个专门用于英语(English)到巴斯克语(Basque)翻译的机器翻译模型。该项目由赫尔辛基大学NLP研究团队开发,是Tatoeba Challenge项目的一部分。这个模型采用了先进的transformer-align架构,能够提供高质量的英语到巴斯克语的翻译服务。
技术特点
这个翻译模型具有以下主要特点:
- 采用transformer-align模型架构
- 使用规范化和SentencePiece进行预处理,词汇量为32k
- 支持单向翻译:从英语到巴斯克语
- 模型训练完成时间为2020年6月17日
性能表现
在Tatoeba测试集上,该模型展现出了优秀的翻译性能:
- BLEU得分达到31.8分
- chrF评分为0.590
- 简洁度惩罚系数(Brevity Penalty)为0.944
- 参考译文长度为7080.0
资源获取
模型相关资源可以通过以下链接获取:
- 原始模型权重文件:opus-2020-06-17.zip
- 测试集翻译结果:opus-2020-06-17.test.txt
- 评估得分文件:opus-2020-06-17.eval.txt
- 详细文档可在GitHub上查看
使用许可
该项目采用Apache 2.0许可证,这意味着用户可以自由使用、修改和分发该模型,但需要遵守相应的开源协议规定。
技术支持
该模型由赫尔辛基大学NLP研究团队维护,用户可以通过项目的GitHub页面获取技术支持和最新更新。模型的部署和移植工作完成于2020年8月21日,在brutasse机器上完成部署。