Logo

#机器翻译

Logo of alpaca-chinese-dataset
alpaca-chinese-dataset
此数据集通过机器翻译与self-instruct方法生成,并进行关键词清洗,提供高质量的中文指令微调数据。用户可以详细了解数据生成和清洗方法,并查看多个实际示例,以提升模型性能。
Logo of pytorch-seq2seq
pytorch-seq2seq
该项目提供一系列使用PyTorch实现seq2seq模型的教程,特别是对德语到英语的翻译。教程涵盖了seq2seq网络的基础、编码器-解码器模型、注意机制以及使用spaCy进行数据分词,并提供了详细的代码和示例,帮助学习者深入理解和应用相关技术。
Logo of translation-agent
translation-agent
这是一个基于自反式工作流的机器翻译演示项目。通过大型语言模型实现翻译、自我反馈和改进,具有高度可定制性。它支持调整输出风格、处理特殊术语和适应地区用语。虽然整体性能与商业产品相当,但在某些场景下表现优异。该项目支持多语言翻译,适用于正式/非正式文本、专业术语和地区方言的翻译需求。作为代理式翻译的起点,它为翻译研究和开源社区提供了新的可能性,欢迎贡献者参与改进和扩展。
Logo of Pangeanic
Pangeanic
Pangeanic专注于自然语言处理和人工智能,提供自适应生成式AI服务。核心产品ECOChat能快速构建多语言AI助手,基于专有机器翻译技术。公司还提供机器翻译、数据注释、文本分类等服务,将AI与人类智慧结合,为客户提供高效的语言数据处理解决方案。
Logo of AI Translator
AI Translator
AI Translator集成谷歌、DeepL、亚马逊等顶级AI翻译引擎,提供200多种语言的文本和文档翻译服务。平台不仅翻译内容,还能分析比较不同引擎的结果,推荐最佳翻译。适合专业人士、旅行者和企业用户使用的多语言翻译分析工具。
Logo of OPUS-MT-train
OPUS-MT-train
OPUS-MT-train是一个开源的神经机器翻译模型训练工具集。它基于MarianNMT和OPUS数据集,提供了模型训练、评估和发布的完整脚本。该项目包含丰富的预训练模型,支持多语言翻译,并附有详细文档和教程。OPUS-MT-train适用于CSC HPC集群环境,包含了安装、设置和使用的详细说明。它还提供了低资源语言模型训练和Tatoeba翻译挑战等教程,致力于推动神经机器翻译技术的普及,为研究人员和开发者提供了实用的工具,有助于推进神经机器翻译技术的研究和应用。
Logo of subword-nmt
subword-nmt
subword-nmt是一个文本子词分割预处理工具,主要应用于神经机器翻译领域。它实现了字节对编码(BPE)等算法,具备多语言联合学习、词汇过滤和BPE dropout等功能。该工具支持pip安装,提供命令行接口,适用于各类NMT任务,可有效处理罕见词。
Logo of nllb-serve
nllb-serve
nllb-serve是一个开源项目,为Meta的NLLB翻译模型提供web界面和REST API。该项目支持200种语言间的翻译,具有便捷的部署流程。它提供服务器配置、命令行工具、API文档和批量翻译功能,支持GPU加速和自定义模型,适用于需要大规模多语言翻译能力的场景。
Logo of lingvo
lingvo
Lingvo由Google维护的高质量框架,专用于在Tensorflow中构建神经网络,特别适用于序列模型的开发。此框架支持多种模型类型,包括自动语音识别、图片处理、语言建模和机器翻译等。Lingvo允许通过pip安装或源代码编译来灵活部署。借助详尽的文档和综合的模型库,用户可以轻松地构建、训练并评估自定义模型。此外,Lingvo还与最新版本的Tensorflow和Python兼容,确保与当前技术生态的同步。
Logo of joeynmt
joeynmt
Joey NMT框架专为教育而设计,提供简明和清晰的代码库,帮助初学者理解RNN和Transformer等经典NMT架构。其主要特点包括模块化设计,便于修改组件及训练流程,保持代码可读性。支持多个注意力机制、不同的分词类型和多语种翻译,包含详细的文档和教程,适用于模型训练、测试和翻译的各个阶段。最新版本引入分布式数据并行和多项优化,兼容最新的Python和PyTorch版本。
Logo of bergamot-translator
bergamot-translator
bergamot-translator是基于Marian NMT框架的机器翻译API,旨在提升浏览器端翻译性能。项目支持原生和WebAssembly编译,提供详细的构建指南。开发者可通过其API实现高效的机器翻译功能,适用于多种应用场景。原生版本可集成到各类项目中,WebAssembly版本则适用于浏览器环境,为开发者提供了灵活的机器翻译实现选择。
Logo of Lingvanex
Lingvanex
Lingvanex提供AI驱动的机器翻译和语音识别技术,支持100多种语言的文本、文档、音频和图像翻译,以及91种语言的语音转录。平台提供云端API、本地部署软件和移动SDK等多种解决方案,注重数据安全,采用固定价格模式。产品易于集成,广泛应用于教育、金融、政府和医疗等行业。
Logo of Neurooo
Neurooo
Neurooo作为一款基于人工智能的翻译工具,能够精确理解和转换各种语言的文本、文件和应用。该平台不仅可以处理成语和俚语,还能根据上下文推断意图,纠正错误,同时支持用户自定义翻译风格。Neurooo的核心优势体现在其出色的翻译质量和灵活性,为用户提供全面而精准的翻译解决方案。独特功能如'一键选择翻译语气'和'个性化调整翻译结果',让用户能够轻松获得符合需求的高质量翻译。
Logo of Opus-MT
Opus-MT
Opus-MT是一个开源的神经机器翻译项目,基于Marian-NMT框架开发。该项目利用OPUS数据集训练模型,结合SentencePiece分词和eflomal词对齐技术,提供多语言翻译功能。Opus-MT支持基于Tornado的Web应用和WebSocket服务两种部署方式,并提供大量预训练模型供用户下载。在Tiyaro.ai平台上,Opus-MT部署了543个在线演示API,方便用户体验。这个项目致力于为全球用户提供开放、便捷的翻译服务。
Logo of a-PyTorch-Tutorial-to-Transformers
a-PyTorch-Tutorial-to-Transformers
本项目提供了一个基于PyTorch的Transformer模型实现教程。教程深入讲解了Transformer的核心概念,如多头注意力机制和编码器-解码器架构,并以机器翻译为例展示应用。内容涵盖模型实现、训练、推理和评估等环节,适合想要深入理解和应用Transformer技术的学习者。
Logo of GuoFeng-Webnovel
GuoFeng-Webnovel
GuoFeng-Webnovel是一个多语言网络小说语料库,包含丰富的语言文化特征和长文本上下文。覆盖14种小说类型,提供中英、中德、中俄等语言对。数据经严格处理和人工校对,可用于机器翻译和语言模型研究。研究人员可在遵守版权规定下免费用于非商业研究。
Logo of dsnote
dsnote
Speech Note是一款集成多语言支持的Linux桌面与Sailfish OS平台应用,提供离线语音识别和翻译,保证了极高的隐私性,无需联网即可快速完成文字和语音的转换和翻译。适用于对隐私要求高的笔记、阅读和翻译等多场景使用。
Logo of fairseq
fairseq
Fairseq 是一个序列建模工具包,适用于机器翻译和文本生成。支持多GPU训练,提供灵活配置和扩展能力,以及多种预训练模型和参考实现。内置束搜索和抽样等算法,支持混合精度训练和参数CPU卸载,为研究人员和开发人员提供高效解决方案。
Logo of sockeye
sockeye
Sockeye是基于PyTorch的开源神经机器翻译工具包,实现了分布式训练和优化推理。虽已进入维护模式,但仍具高性能和灵活性,支持大规模数据训练。项目提供详细文档和教程,适用于学术和工业研究。Sockeye为Amazon Translate等应用提供技术支持,是NMT领域的重要开源项目。Sockeye 3.x版本完全基于PyTorch,支持并行训练和推理优化,突显其技术优势。
Logo of MachineTranslation.com
MachineTranslation.com
MachineTranslation.com整合Google、DeepL、Amazon和ChatGPT等主流翻译引擎,提供多语种翻译功能并对比不同引擎结果,推荐最佳翻译。平台致力于提高机器翻译的可用性和可靠性,适合广泛用户群体。团队由语言学家、研究人员和工程师组成,运用AI和机器学习技术持续优化翻译质量和效率。
Logo of Robo Translator
Robo Translator
Robo Translator是基于AI的机器翻译平台,提供文本、音频和视频的高精度翻译,支持字幕和软件本地化。采用按需付费模式,简化多语言内容转换流程,助力全球化传播。
Logo of sentencepiece
sentencepiece
SentencePiece是一种用于神经网络文本生成系统的无监督分词工具。它支持多种子词算法,如BPE和unigram语言模型,可直接从原始文本训练。这个工具具有语言无关性,实现了子词正则化,运行速度快,占用资源少。SentencePiece能直接生成词汇ID序列,执行NFKC标准化,是一个完全端到端的系统,无需依赖特定语言的预处理或后处理。
Logo of Easy-Translate
Easy-Translate
Easy-Translate是一款适合各级用户的文本翻译工具,支持M2M100、NLLB200和SeamlessM4T等多种翻译模型。该工具可在不同硬件环境下运行,具备自动调整批处理大小、多种解码策略和加载大型模型等功能。此外,Easy-Translate还提供了翻译质量评估功能,可计算多种评估指标。
Logo of Is-ChatGPT-A-Good-Translator
Is-ChatGPT-A-Good-Translator
这项研究对ChatGPT和GPT-4的机器翻译性能进行了全面评估。结果显示,ChatGPT在高资源欧洲语言翻译方面与商业产品相当,但在低资源和远距离语言对上存在不足。研究者通过轴心提示等方法尝试提升ChatGPT的翻译质量。GPT-4则展现出显著进步,某些方面甚至优于Google翻译。通过自动和人工分析,研究深入探讨了两个模型在各种翻译场景中的表现特点。
Logo of rust-bert
rust-bert
rust-bert是基于Rust语言开发的高效自然语言处理库,支持问答、命名实体识别、翻译和摘要生成等多种任务。此库支持多线程分词和GPU推断,具备丰富的API,便于开发者和研究人员快速部署使用多种预训练模型。
Logo of LibreTranslate
LibreTranslate
LibreTranslate是一款开源自托管的机器翻译API,无需依赖第三方服务。其翻译引擎基于Argos Translate开源库,支持多语言互译。提供API接口和网页界面,具备自动语言检测、HTML翻译等功能。部署简便,支持Docker,可与多种编程语言集成。适合需要自主控制翻译服务的用户和开发者。
Logo of SONAR
SONAR
SONAR是Meta AI推出的开源多语言多模态句子表示模型。它支持200种语言的文本处理和37种语言的语音处理,在多语言相似性搜索任务中性能优异。SONAR可用于文本和语音嵌入、文本重构、跨语言翻译等多种自然语言处理任务,为多语言多模态AI应用提供了强大的基础。
Logo of Spoken AI
Spoken AI
Spoken AI是一个创新的在线翻译平台,提供多种语言和方言间的转换服务。该平台采用先进的人工智能技术,不仅支持标准语言翻译,还能实现方言间的精确转换。通过AI生成模型和本地语言同化技术,Spoken AI将机器翻译质量提升至接近专业水平,为用户提供自然、准确的翻译体验。这一服务适用于需要高质量、多样化语言翻译的各类场景,是传统翻译方法的高效替代选择。
Logo of slAItor
slAItor
slAItor融合GPT技术与传统机器翻译,提供高质量翻译服务。具备翻译解释、错误纠正和多风格选择等功能。支持28种语言对,兼容多种设备。特色功能包含翻译检查、替代方案和风格校准,适应各种翻译场景需求。
Logo of MORT
MORT
MORT是一款开源的屏幕实时OCR和翻译工具,支持从屏幕提取文本并进行实时翻译。它集成了多种OCR引擎如TesseractOCR、Windows OCR等,以及Papago、Google等翻译服务。MORT具备多区域OCR、图像调整和自定义API等功能,可应用于游戏、视频等场景的实时翻译。该工具支持英语和日语的默认提取与翻译,并可通过剪贴板功能与钩子程序联动。
Logo of llama
llama
LLAMA是Facebook AI Research开发的开源语言模型项目,致力于提高机器翻译质量。该项目专注于源语言处理,采用创新方法改进翻译效果。LLAMA为机器翻译研究提供了重要工具,有望推动该领域的技术进步。
Logo of deepl-python
deepl-python
DeepL Python Library是一个功能丰富的Python接口,用于访问DeepL的机器翻译服务。该库支持文本和文档翻译、自定义术语表和多语言处理。适用于Python 3.6及以上版本,安装简便,API调用直观。开发者可借助此库轻松集成DeepL的翻译功能,实现多样化的语言处理应用。