#机器翻译
lingvo - Tensorflow中高效的序列模型神经网络构建框架
LingvoTensorflow神经网络模型训练机器翻译Github开源项目
Lingvo由Google维护的高质量框架,专用于在Tensorflow中构建神经网络,特别适用于序列模型的开发。此框架支持多种模型类型,包括自动语音识别、图片处理、语言建模和机器翻译等。Lingvo允许通过pip安装或源代码编译来灵活部署。借助详尽的文档和综合的模型库,用户可以轻松地构建、训练并评估自定义模型。此外,Lingvo还与最新版本的Tensorflow和Python兼容,确保与当前技术生态的同步。
dsnote - 支持多语言的离线语音及文本处理应用
Speech Note语音识别语音合成机器翻译数据隐私Github开源项目
Speech Note是一款集成多语言支持的Linux桌面与Sailfish OS平台应用,提供离线语音识别和翻译,保证了极高的隐私性,无需联网即可快速完成文字和语音的转换和翻译。适用于对隐私要求高的笔记、阅读和翻译等多场景使用。
rust-bert - 基于Rust语言开发的高效自然语言处理库
rust-bert自然语言处理机器翻译情感分析问答系统Github开源项目
rust-bert是基于Rust语言开发的高效自然语言处理库,支持问答、命名实体识别、翻译和摘要生成等多种任务。此库支持多线程分词和GPU推断,具备丰富的API,便于开发者和研究人员快速部署使用多种预训练模型。
pytorch-seq2seq - 使用PyTorch实现序列到序列模型的教程
PyTorchseq2seq神经网络翻译机器翻译Github开源项目
该项目提供一系列使用PyTorch实现seq2seq模型的教程,特别是对德语到英语的翻译。教程涵盖了seq2seq网络的基础、编码器-解码器模型、注意机制以及使用spaCy进行数据分词,并提供了详细的代码和示例,帮助学习者深入理解和应用相关技术。
joeynmt - 简洁而清晰的NMT模型实现,促进教育和学习
Joey NMT机器翻译PyTorchTransformerGRUGithub开源项目
Joey NMT框架专为教育而设计,提供简明和清晰的代码库,帮助初学者理解RNN和Transformer等经典NMT架构。其主要特点包括模块化设计,便于修改组件及训练流程,保持代码可读性。支持多个注意力机制、不同的分词类型和多语种翻译,包含详细的文档和教程,适用于模型训练、测试和翻译的各个阶段。最新版本引入分布式数据并行和多项优化,兼容最新的Python和PyTorch版本。
fairseq - 序列建模工具包,支持机器翻译与文本生成
Fairseq序列建模文本生成PyTorch机器翻译Github开源项目
Fairseq 是一个序列建模工具包,适用于机器翻译和文本生成。支持多GPU训练,提供灵活配置和扩展能力,以及多种预训练模型和参考实现。内置束搜索和抽样等算法,支持混合精度训练和参数CPU卸载,为研究人员和开发人员提供高效解决方案。
LibreTranslate - 自托管开源机器翻译API
LibreTranslate机器翻译API开源自托管Github开源项目
LibreTranslate是一款开源自托管的机器翻译API,无需依赖第三方服务。其翻译引擎基于Argos Translate开源库,支持多语言互译。提供API接口和网页界面,具备自动语言检测、HTML翻译等功能。部署简便,支持Docker,可与多种编程语言集成。适合需要自主控制翻译服务的用户和开发者。
translation-agent - 高度可定制的自反式机器翻译工作流
机器翻译反思工作流LLM开源自定义翻译Github开源项目
这是一个基于自反式工作流的机器翻译演示项目。通过大型语言模型实现翻译、自我反馈和改进,具有高度可定制性。它支持调整输出风格、处理特殊术语和适应地区用语。虽然整体性能与商业产品相当,但在某些场景下表现优异。该项目支持多语言翻译,适用于正式/非正式文本、专业术语和地区方言的翻译需求。作为代理式翻译的起点,它为翻译研究和开源社区提供了新的可能性,欢迎贡献者参与改进和扩展。
bergamot-translator - 高性能开源机器翻译库支持原生和WebAssembly
Bergamot Translator机器翻译WASMEmscriptenAPIGithub开源项目
bergamot-translator是基于Marian NMT框架的机器翻译API,旨在提升浏览器端翻译性能。项目支持原生和WebAssembly编译,提供详细的构建指南。开发者可通过其API实现高效的机器翻译功能,适用于多种应用场景。原生版本可集成到各类项目中,WebAssembly版本则适用于浏览器环境,为开发者提供了灵活的机器翻译实现选择。
sockeye - 基于PyTorch的开源神经机器翻译工具包
Sockeye机器翻译PyTorch开源框架神经网络Github开源项目
Sockeye是基于PyTorch的开源神经机器翻译工具包,实现了分布式训练和优化推理。虽已进入维护模式,但仍具高性能和灵活性,支持大规模数据训练。项目提供详细文档和教程,适用于学术和工业研究。Sockeye为Amazon Translate等应用提供技术支持,是NMT领域的重要开源项目。Sockeye 3.x版本完全基于PyTorch,支持并行训练和推理优化,突显其技术优势。
SONAR - 先进的多语言多模态句子表示模型
SONAR多语言多模态句子嵌入机器翻译Github开源项目
SONAR是Meta AI推出的开源多语言多模态句子表示模型。它支持200种语言的文本处理和37种语言的语音处理,在多语言相似性搜索任务中性能优异。SONAR可用于文本和语音嵌入、文本重构、跨语言翻译等多种自然语言处理任务,为多语言多模态AI应用提供了强大的基础。
Pangeanic - 自适应生成式AI助手和专有机器翻译解决方案
AI工具人工智能机器翻译自然语言处理数据处理虚拟助手
Pangeanic专注于自然语言处理和人工智能,提供自适应生成式AI服务。核心产品ECOChat能快速构建多语言AI助手,基于专有机器翻译技术。公司还提供机器翻译、数据注释、文本分类等服务,将AI与人类智慧结合,为客户提供高效的语言数据处理解决方案。
Lingvanex - AI多语言翻译和语音识别技术平台
AI工具Lingvanex机器翻译语音识别人工智能语言技术
Lingvanex提供AI驱动的机器翻译和语音识别技术,支持100多种语言的文本、文档、音频和图像翻译,以及91种语言的语音转录。平台提供云端API、本地部署软件和移动SDK等多种解决方案,注重数据安全,采用固定价格模式。产品易于集成,广泛应用于教育、金融、政府和医疗等行业。
MachineTranslation.com - 多引擎机器翻译比较与推荐服务
AI工具机器翻译在线翻译多语言翻译AI翻译语言服务
MachineTranslation.com整合Google、DeepL、Amazon和ChatGPT等主流翻译引擎,提供多语种翻译功能并对比不同引擎结果,推荐最佳翻译。平台致力于提高机器翻译的可用性和可靠性,适合广泛用户群体。团队由语言学家、研究人员和工程师组成,运用AI和机器学习技术持续优化翻译质量和效率。
Spoken AI - AI多语言方言翻译平台提供300余种语言和方言转换
AI工具AI翻译方言翻译Spoken AI机器翻译人工智能
Spoken AI是一个创新的在线翻译平台,提供多种语言和方言间的转换服务。该平台采用先进的人工智能技术,不仅支持标准语言翻译,还能实现方言间的精确转换。通过AI生成模型和本地语言同化技术,Spoken AI将机器翻译质量提升至接近专业水平,为用户提供自然、准确的翻译体验。这一服务适用于需要高质量、多样化语言翻译的各类场景,是传统翻译方法的高效替代选择。
AI Translator - 多语言AI翻译分析比较平台
AI工具机器翻译AI翻译翻译引擎多语言支持在线翻译工具
AI Translator集成谷歌、DeepL、亚马逊等顶级AI翻译引擎,提供200多种语言的文本和文档翻译服务。平台不仅翻译内容,还能分析比较不同引擎的结果,推荐最佳翻译。适合专业人士、旅行者和企业用户使用的多语言翻译分析工具。
Neurooo - 智能多语言翻译平台,提供精准自然的翻译服务
AI工具Neurooo机器翻译自然语言处理AI翻译语言智能
Neurooo作为一款基于人工智能的翻译工具,能够精确理解和转换各种语言的文本、文件和应用。该平台不仅可以处理成语和俚语,还能根据上下文推断意图,纠正错误,同时支持用户自定义翻译风格。Neurooo的核心优势体现在其出色的翻译质量和灵活性,为用户提供全面而精准的翻译解决方案。独特功能如'一键选择翻译语气'和'个性化调整翻译结果',让用户能够轻松获得符合需求的高质量翻译。
Robo Translator - 多语言机器翻译平台提供高精度内容本地化服务
AI工具机器翻译内容本地化AI翻译字幕翻译软件本地化
Robo Translator是基于AI的机器翻译平台,提供文本、音频和视频的高精度翻译,支持字幕和软件本地化。采用按需付费模式,简化多语言内容转换流程,助力全球化传播。
slAItor - 多功能智能翻译引擎 支持28种语言对互译
AI工具slAItor人工智能翻译机器翻译语言对翻译功能
slAItor融合GPT技术与传统机器翻译,提供高质量翻译服务。具备翻译解释、错误纠正和多风格选择等功能。支持28种语言对,兼容多种设备。特色功能包含翻译检查、替代方案和风格校准,适应各种翻译场景需求。
OPUS-MT-train - 用于训练多语言神经机器翻译模型的开源工具集
Opus-MT机器翻译模型训练开源软件多语言翻译Github开源项目
OPUS-MT-train是一个开源的神经机器翻译模型训练工具集。它基于MarianNMT和OPUS数据集,提供了模型训练、评估和发布的完整脚本。该项目包含丰富的预训练模型,支持多语言翻译,并附有详细文档和教程。OPUS-MT-train适用于CSC HPC集群环境,包含了安装、设置和使用的详细说明。它还提供了低资源语言模型训练和Tatoeba翻译挑战等教程,致力于推动神经机器翻译技术的普及,为研究人员和开发者提供了实用的工具,有助于推进神经机器翻译技术的研究和应用。
Opus-MT - 多语言神经机器翻译的开源框架
OPUS-MT机器翻译开源多语言Marian-NMTGithub开源项目
Opus-MT是一个开源的神经机器翻译项目,基于Marian-NMT框架开发。该项目利用OPUS数据集训练模型,结合SentencePiece分词和eflomal词对齐技术,提供多语言翻译功能。Opus-MT支持基于Tornado的Web应用和WebSocket服务两种部署方式,并提供大量预训练模型供用户下载。在Tiyaro.ai平台上,Opus-MT部署了543个在线演示API,方便用户体验。这个项目致力于为全球用户提供开放、便捷的翻译服务。
sentencepiece - 无监督神经网络文本分词与去分词工具
SentencePiece分词子词单元自然语言处理机器翻译Github开源项目
SentencePiece是一种用于神经网络文本生成系统的无监督分词工具。它支持多种子词算法,如BPE和unigram语言模型,可直接从原始文本训练。这个工具具有语言无关性,实现了子词正则化,运行速度快,占用资源少。SentencePiece能直接生成词汇ID序列,执行NFKC标准化,是一个完全端到端的系统,无需依赖特定语言的预处理或后处理。
MORT - 多语言屏幕实时OCR和翻译工具
MORTOCR实时翻译机器翻译多语言支持Github开源项目
MORT是一款开源的屏幕实时OCR和翻译工具,支持从屏幕提取文本并进行实时翻译。它集成了多种OCR引擎如TesseractOCR、Windows OCR等,以及Papago、Google等翻译服务。MORT具备多区域OCR、图像调整和自定义API等功能,可应用于游戏、视频等场景的实时翻译。该工具支持英语和日语的默认提取与翻译,并可通过剪贴板功能与钩子程序联动。
subword-nmt - 神经机器翻译子词分割预处理工具
分词机器翻译BPE神经网络自然语言处理Github开源项目
subword-nmt是一个文本子词分割预处理工具,主要应用于神经机器翻译领域。它实现了字节对编码(BPE)等算法,具备多语言联合学习、词汇过滤和BPE dropout等功能。该工具支持pip安装,提供命令行接口,适用于各类NMT任务,可有效处理罕见词。
a-PyTorch-Tutorial-to-Transformers - PyTorch实现Transformer模型的详细教程与实践指南
PyTorchTransformer机器翻译注意力机制编码器-解码器架构Github开源项目
本项目提供了一个基于PyTorch的Transformer模型实现教程。教程深入讲解了Transformer的核心概念,如多头注意力机制和编码器-解码器架构,并以机器翻译为例展示应用。内容涵盖模型实现、训练、推理和评估等环节,适合想要深入理解和应用Transformer技术的学习者。
Easy-Translate - 高效多语言文本翻译工具支持多种模型
Easy-Translate机器翻译多语言翻译大规模语言模型自然语言处理Github开源项目
Easy-Translate是一款适合各级用户的文本翻译工具,支持M2M100、NLLB200和SeamlessM4T等多种翻译模型。该工具可在不同硬件环境下运行,具备自动调整批处理大小、多种解码策略和加载大型模型等功能。此外,Easy-Translate还提供了翻译质量评估功能,可计算多种评估指标。
llama - Facebook开源语言模型推进机器翻译研究
LLaMA机器翻译Facebook AI自然语言处理开源项目Github
LLAMA是Facebook AI Research开发的开源语言模型项目,致力于提高机器翻译质量。该项目专注于源语言处理,采用创新方法改进翻译效果。LLAMA为机器翻译研究提供了重要工具,有望推动该领域的技术进步。
nllb-serve - 开源多语言翻译服务器与API实现
NLLB机器翻译REST API多语言人工智能Github开源项目
nllb-serve是一个开源项目,为Meta的NLLB翻译模型提供web界面和REST API。该项目支持200种语言间的翻译,具有便捷的部署流程。它提供服务器配置、命令行工具、API文档和批量翻译功能,支持GPU加速和自定义模型,适用于需要大规模多语言翻译能力的场景。
GuoFeng-Webnovel - 多语言网络小说语料库推动机器翻译和语言模型研究
GuoFeng Webnovel文学翻译多语言语料库网络小说机器翻译Github开源项目
GuoFeng-Webnovel是一个多语言网络小说语料库,包含丰富的语言文化特征和长文本上下文。覆盖14种小说类型,提供中英、中德、中俄等语言对。数据经严格处理和人工校对,可用于机器翻译和语言模型研究。研究人员可在遵守版权规定下免费用于非商业研究。
Is-ChatGPT-A-Good-Translator - ChatGPT和GPT-4机器翻译能力研究及优化方法探索
ChatGPT机器翻译GPT-4多语言翻译翻译鲁棒性Github开源项目
这项研究对ChatGPT和GPT-4的机器翻译性能进行了全面评估。结果显示,ChatGPT在高资源欧洲语言翻译方面与商业产品相当,但在低资源和远距离语言对上存在不足。研究者通过轴心提示等方法尝试提升ChatGPT的翻译质量。GPT-4则展现出显著进步,某些方面甚至优于Google翻译。通过自动和人工分析,研究深入探讨了两个模型在各种翻译场景中的表现特点。
deepl-python - DeepL Python库 多功能的机器翻译接口
DeepLPython库语言翻译API机器翻译Github开源项目
DeepL Python Library是一个功能丰富的Python接口,用于访问DeepL的机器翻译服务。该库支持文本和文档翻译、自定义术语表和多语言处理。适用于Python 3.6及以上版本,安装简便,API调用直观。开发者可借助此库轻松集成DeepL的翻译功能,实现多样化的语言处理应用。
t5_translate_en_ru_zh_small_1024 - 多语言T5机器翻译模型,支持中、俄、英文翻译
多语言Github模型开源项目T5Huggingface机器翻译同步翻译翻译
该项目基于T5模型实现多语言翻译,支持中、俄、英语言的直接转换。输入文本前添加目标语言标识符即可进行翻译,无需指定源语言,能处理多语言内容。模型兼容GPU和CPU运行,提供个性化翻译体验。
mt5-base-parsinlu-opus-translation_fa_en - mT5-based波斯语至英语翻译工具
开源项目翻译mT5模型GithubHuggingface机器翻译波斯语
mT5-base-parsinlu-opus-translation_fa_en是一个开源的机器翻译模型,使用mT5技术将波斯语翻译为英语。通过借助Parsinlu数据集,该模型实现了高效精准的翻译。利用简单的Python代码即可进行调用,并以sacrebleu指标评估性能。适用于在cc-by-nc-sa-4.0许可下使用的开发者和研究人员,致力于提升跨语言交流能力。
mbart-large-50-one-to-many-mmt - 多语言机器翻译工具,支持从英语到49种语言的转换
神经网络Huggingface翻译模型mBART-50模型Github开源项目机器翻译多语言
模型基于mBART-large-50,专注于多语言机器翻译任务。其为英语翻译至49种语言提供支持,包括中文、西班牙语、法语等,翻译过程中会强制目标语言ID为首个生成标记。适用于处理大量跨语言文本的场景,提升翻译灵活性与多样性。
opus-mt-en-jap - 英日神经机器翻译模型:基于OPUS数据集的高效翻译工具
语言模型模型英日翻译机器翻译BLEU评分Githubopus-mt-en-japHuggingface开源项目
opus-mt-en-jap是一个基于transformer架构的英日神经机器翻译模型。该模型在OPUS数据集上训练,采用SentencePiece进行预处理。在bible-uedin测试集上,模型获得了42.1的BLEU分数和0.960的chr-F分数,显示出优秀的翻译能力。这一开源项目为需要进行英日文本转换的研究人员和开发者提供了实用的工具,适用于文献翻译、跨语言交流等领域。作为高效的机器翻译和英日翻译工具,它为用户提供了强大的语言转换支持。
alpaca-chinese-dataset - 中文指令微调数据集生成与清洗方法
alpaca中文指令数据集机器翻译self-instructGithub开源项目
此数据集通过机器翻译与self-instruct方法生成,并进行关键词清洗,提供高质量的中文指令微调数据。用户可以详细了解数据生成和清洗方法,并查看多个实际示例,以提升模型性能。
相关文章