#SentencePiece
sentencepiece - 无监督神经网络文本分词与去分词工具
Github开源项目自然语言处理机器翻译分词SentencePiece子词单元
SentencePiece是一种用于神经网络文本生成系统的无监督分词工具。它支持多种子词算法,如BPE和unigram语言模型,可直接从原始文本训练。这个工具具有语言无关性,实现了子词正则化,运行速度快,占用资源少。SentencePiece能直接生成词汇ID序列,执行NFKC标准化,是一个完全端到端的系统,无需依赖特定语言的预处理或后处理。
opus-mt-en-az - 提供英语到阿塞拜疆语的开源翻译模型
Github开源项目模型HuggingfaceSentencePiecetranslationBLEU评分EnglishAzerbaijani
该开源项目提供了一种从英语到阿塞拜疆语的翻译工具,使用transformer-align模型进行语言转换。其运用了规范化与SentencePiece技术,确保翻译的准确性。根据Tatoeba测试集评估,该模型取得了18.6的BLEU分数及0.477的chr-F分数。用户可以通过链接下载模型权重和翻译测试结果,项目遵循Apache 2.0协议,适用于多个应用场景。
opus-mt-de-it - 德语到意大利语的开源翻译模型
Github开源项目翻译模型数据集HuggingfaceBLEUSentencePieceopus-mt-de-it
该开源项目使用transformer-align模型,提供德语到意大利语的高效翻译。通过Normalization和SentencePiece进行预处理,确保翻译的精准性和流畅性。用户可下载模型原始权重和测试集进行评估。模型在Tatoeba数据集上的评估显示,BLEU得分为45.3,chr-F得分为0.671,表现出良好的翻译性能。
opus-mt-de-ca - 德语到加泰罗尼亚语翻译技术模型,支持精准语句转换
Github开源项目翻译模型HuggingfaceBLEUSentencePiece德语deu-cat
该项目基于transformer-align模型,将德语文本转为加泰罗尼亚语,采用正常化及SentencePiece (spm12k) 进行预处理。模型在Tatoeba测试集上的BLEU评分为37.4,chr-F值为0.582,显示了优秀的翻译性能。用户可以下载原始模型权重和相应测试集数据,查看详细的转化结果。
opus-mt-en-el - 英语到希腊语的开放源代码翻译模型,基于高效的自然语言处理技术
Github开源项目翻译模型HuggingfaceBLEUSentencePieceopus-mt-en-el
项目提供从英语到希腊语的翻译模型,使用OPUS数据集和transformer-align模型进行训练,并包含预处理步骤如规范化和SentencePiece。用户可以下载原始模型权重和测试集合译文,模型在BLEU评分中取得56.4的成绩,强调翻译的准确性和流畅性。
opus-mt-et-en - 爱沙尼亚语到英语的高效翻译模型
Github开源项目翻译模型HuggingfaceBLEUSentencePiecetransformer-alignopus-mt-et-en
此项目是一个开源的爱沙尼亚语到英语翻译模型,采用transformer-align架构和SentencePiece技术进行预处理。基于opus数据集进行训练,提供模型权重和测试集文件的下载链接。在多种测试集上表现出色,例如在Tatoeba测试集上取得了59.9的BLEU得分。该模型适合处理需要高质量翻译的爱沙尼亚语到英语文本。
opus-mt-en-grk - 英希翻译模型与性能评估指标
Github开源项目AI绘图模型HuggingfaceSentencePiecetranslation希腊语正常化
项目提供基于transformer架构的英语到希腊语翻译模型,使用SentencePiece进行预处理,支持多语言目标,并提供测试集翻译、评估及模型权重下载。评估显示其在现代希腊语翻译中具有较高BLEU分数。相关资源含性能基准及原始代码链接。
opus-mt-eu-en - 欧-英机器翻译开源项目,提供精确翻译
Github开源项目模型翻译模型HuggingfaceSentencePieceBLEU评分transformer-alignopus
该开源项目提供欧-英翻译,基于transformer-align模型和SentencePiece预处理,BLEU评分为46.1,chr-F评分为0.638,适用于Tatoeba数据集。用户可下载模型权重和测试集翻译,满足多种高质量应用需求。
opus-mt-en-af - 英语到南非荷兰语翻译模型,使用变压器对齐和标准化预处理
Github开源项目翻译模型HuggingfaceSentencePieceBLEU评分transformer-alignopus-mt-en-af
该项目提供了英语到南非荷兰语的机器翻译模型,基于transformer-align算法和OPUS数据集,并采用了标准化和SentencePiece预处理。用户可以获取模型的原始权重和翻译测试结果,Tatoeba测试集的BLEU得分为56.1,显示出较高的翻译准确度。
opus-mt-ca-fr - 加泰罗尼亚语转法语的高效开源翻译工具
Github开源项目翻译模型HuggingfaceSentencePieceTatoeba-ChallengeCat-FraBLEU分数
该开源项目支持将加泰罗尼亚语翻译为法语,基于transformer-align模型进行构建,并包含规范化与SentencePiece预处理环节。在Tatoeba测试集上的BLEU评分达52.4,展现出可靠的翻译质量,适用于精确翻译和自然语言处理领域的应用。项目包含模型权重和测试集下载链接,便于用户进一步研究及使用。
opus-mt-en-hy - 英语到亚美尼亚语翻译模型,促进多语言交流
Github开源项目模型HuggingfaceBLEUSentencePiecetranslationeng-hye
该项目提供英亚(英语-亚美尼亚语)翻译模型,基于Transformer-Align架构,结合SentencePiece处理,实现文本转换。其翻译能力在Tatoeba测试集中获得16.6的BLEU分数,表明良好的质量。用户可在GitHub页面查看详情,下载原始权重及测试集文件。项目采用Apache-2.0协议,便于开发者和研究人员在多语言环境中使用和再开发。
opus-mt-cs-en - 捷克语到英语的开源机器翻译模型
Github开源项目翻译模型HuggingfaceBLEUSentencePiecetransformer-alignopus-mt-cs-en
opus-mt-cs-en是一种捷克语到英语的开源翻译模型,使用transformer-align架构和OPUS数据集,经过SentencePiece处理。可以下载2019年12月18日的模型权重以进行试用。
opus-mt-tc-big-fr-en - 法语到英语神经机器翻译模型概述
Github开源项目模型HuggingfaceBLEUSentencePiece神经机器翻译法语到英语opus-mt-tc-big-fr-en
OPUS-MT项目中的法英翻译模型,基于Marian NMT框架训练,通过Huggingface的transformers库转换为pyTorch模型,具有优秀的BLEU评分。模型支持多种数据集,使用SentencePiece进行分词,适用于多种翻译任务,适合学术研究及实际应用。
opus-mt-nl-fr - 荷兰语到法语的开源机器翻译模型
Github开源项目翻译模型HuggingfaceSentencePiecetransformer-alignopus-mt-nl-fr
这个开源项目用于实现荷兰语到法语的机器翻译,使用基于transformer-align的模型,并结合数据标准化与SentencePiece预处理。依托OPUS数据集,该项目在Tatoeba.nl.fr测试集上获得了51.3的BLEU分数,展示了较好的翻译效果。提供原始模型权重及测试集翻译文件,以供进一步研究和应用。