#OPUS-MT

Opus-MT: 开放式神经机器翻译模型与服务

2 个月前
Cover of Opus-MT: 开放式神经机器翻译模型与服务
相关项目
Project Cover

Opus-MT

Opus-MT是一个开源的神经机器翻译项目,基于Marian-NMT框架开发。该项目利用OPUS数据集训练模型,结合SentencePiece分词和eflomal词对齐技术,提供多语言翻译功能。Opus-MT支持基于Tornado的Web应用和WebSocket服务两种部署方式,并提供大量预训练模型供用户下载。在Tiyaro.ai平台上,Opus-MT部署了543个在线演示API,方便用户体验。这个项目致力于为全球用户提供开放、便捷的翻译服务。

Project Cover

opus-mt-sv-en

opus-mt-sv-en是一个瑞典语到英语的神经机器翻译模型,基于transformer-align架构构建。该模型使用OPUS数据集训练,经过normalization和SentencePiece预处理。在Tatoeba测试集上,模型达到64.5 BLEU分数和0.763 chr-F分数,显示出较高的翻译质量。项目开源了预训练权重、测试集翻译结果和评估数据,便于研究者复现和评估模型性能。

Project Cover

opus-mt-tc-big-en-pt

该开源项目提供的神经机器翻译模型,旨在高效地将英语翻译为葡萄牙语。作为OPUS-MT项目的一部分,模型采用Marian NMT框架训练,并转化到PyTorch以兼容Transformers库。利用flores101-devtest等高质量数据集进行训练与评估,提供多语言目标支持,可应用于多种翻译场景。通过简单的Python示例代码,用户可以快速上手执行翻译任务。项目获得了欧盟资助,并得到了CSC -- IT Center for Science的支持。

Project Cover

opus-mt-en-he

这是一个基于transformer-align架构的英语-希伯来语翻译模型,采用Apache-2.0开源协议。模型在OPUS数据集上训练,使用规范化和SentencePiece进行预处理,在Tatoeba测试集上获得40.1 BLEU分和0.609 chr-F分。模型提供训练权重下载,可用于英语和希伯来语之间的翻译任务。

Project Cover

opus-mt-es-fr

opus-mt-es-fr是基于transformer-align架构开发的西班牙语-法语机器翻译模型。模型在新闻测试集上实现32-35的BLEU评分,在Tatoeba测试集达到58.4分。项目采用OPUS数据集训练,使用normalization和SentencePiece技术预处理数据。

Project Cover

opus-mt-tc-big-sh-en

opus-mt-tc-big-sh-en是OPUS-MT项目开发的神经机器翻译模型,专门用于塞尔维亚-克罗地亚语(sh)到英语(en)的翻译。该模型采用Marian NMT框架训练,并转换为PyTorch格式以便于使用。在多个基准测试中,模型展现了优秀的性能,BLEU评分范围从37.1到66.5不等,证明了其在不同测试集上的翻译能力。作为OPUS-MT项目的一部分,该模型旨在为全球多语言翻译需求提供高质量、易用的解决方案。

Project Cover

opus-mt-tc-big-zls-en

opus-mt-tc-big-zls-en是一个基于神经网络的机器翻译模型,用于南斯拉夫语系(zls)到英语(en)的翻译任务。作为OPUS-MT项目的组成部分,该模型采用Marian NMT框架开发,并已转换为PyTorch格式。模型支持包括保加利亚语、波斯尼亚语、克罗地亚语、马其顿语、斯洛文尼亚语和塞尔维亚语在内的多种南斯拉夫语言,可应用于相关语言的翻译工作。

Project Cover

opus-mt-tc-big-ar-en

OPUS-MT项目开发的opus-mt-tc-big-ar-en是一款阿拉伯语到英语的神经机器翻译模型。该模型使用Marian NMT框架训练,支持现代标准阿拉伯语及其方言。在多个测试集上,模型展现出优秀性能,BLEU评分介于42.6至47.3之间。模型已转换为PyTorch格式,可通过Hugging Face的transformers库轻松使用。

Project Cover

opus-mt-tc-base-en-sh

该项目提供的神经机器翻译模型,支持从英语到塞尔维亚-克罗地亚语及其他语言的翻译。采用Marian NMT框架训练,使用transformers库转换为pyTorch格式。此模型由赫尔辛基大学开发,数据集来自OPUS项目,并采用SentencePiece进行预处理。适用于文本翻译和生成,包含代码示例与评估细节,遵循CC-BY-4.0许可。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号