#翻译模型

pyvideotrans - 视频翻译与多语言配音解决方案
pyvideotrans视频翻译配音工具语音识别翻译模型Github开源项目
这款工具支持将视频内容翻译为多种指定语言,并自动生成字幕和配音。集成了faster-whisper、openai-whisper、GoogleSpeech等多个语音识别、翻译和文本合成模块,支持中文、英语、韩语、日语等20多种语言。用户可以进行视频翻译、字幕生成和批量处理,并可以选择保留背景音乐,适用于Windows、MacOS、Linux等多种平台。
opus-mt-en-es - 基于Transformer的英西机器翻译模型
翻译模型西班牙语OPUS英语Huggingface模型TatoebaGithub开源项目
opus-mt-en-es是一个开源的英语到西班牙语机器翻译模型,基于Transformer架构。该模型在新闻测试集上BLEU分数介于30-39之间,在Tatoeba测试集上BLEU分数达54.9,chrF分数为0.721。模型采用SentencePiece进行预处理,适用于各种英西翻译任务。项目开源于Hugging Face,提供模型权重下载。模型由Helsinki-NLP团队开发,使用OPUS平行语料库训练。除了高性能表现外,opus-mt-en-es还提供了完整的测试集翻译结果和评估分数,便于研究人员进行比较和分析。该模型适用于需要高质量英西翻译的各种应用场景。
opus-mt-de-es - 德语到西班牙语的智能翻译工具,支持更高的翻译准确性
翻译模型开源项目模型Githubopus-mt-de-esHuggingface预处理BLEU评分语言对
该开源项目通过使用transformer-align模型,将德语翻译为西班牙语,依托opus数据集,进行标准化和SentencePiece的预处理,提升翻译的准确性。用户可以下载模型的原始权重并查看相应的翻译测试集及评分,以了解其性能。在Tatoeba.de.es测试集中获得了48.5分的BLEU评分和0.676的chr-F得分,其高效性能在翻译领域具备一定的竞争力。
mbart-large-50-one-to-many-mmt - 多语言机器翻译工具,支持从英语到49种语言的转换
神经网络Huggingface翻译模型mBART-50模型Github开源项目机器翻译多语言
模型基于mBART-large-50,专注于多语言机器翻译任务。其为英语翻译至49种语言提供支持,包括中文、西班牙语、法语等,翻译过程中会强制目标语言ID为首个生成标记。适用于处理大量跨语言文本的场景,提升翻译灵活性与多样性。
TowerBase-7B-v0.1 - 增强翻译及多语种任务的多语言模型性能
GithubUnbabel文本生成开源项目翻译模型TowerBase-7B多语言Huggingface模型
TowerBase-7B-v0.1是一个多语言模型,通过继续在Llama 2的基础上对20亿条多语种数据进行预训练,在10种主要语言中表现出色。非常适合用于翻译和相关应用任务,在AI2 Reasoning Challenge和HellaSwag等测试中展现出优异的归一化准确率。该模型支持快速无监督调优,为相应语言的研究提供支持。技术报告将提供详细信息。
opus-mt-gem-gem - 多语言Transformer机器翻译模型 支持日耳曼语系互译
BLEU评分语言对开源项目模型Huggingface翻译模型测试集gem-gemGithub
OPUS-MT-GEM是一个基于Transformer架构的开源机器翻译模型,专注于28种日耳曼语系语言的互译需求。该模型通过SentencePiece技术进行文本预处理,采用32k规模词表,支持德语、英语、荷兰语等主流日耳曼语系语言。在WMT新闻翻译测试集上,英德互译的BLEU评分达到30分以上,展现出可靠的翻译能力。模型需要在输入句子开头添加目标语言标识符以指定翻译方向。
Sakura-14B-Qwen2.5-v1.0-GGUF - 增强翻译准确性与推理效率
术语表开源项目准确率轻小说模型Huggingface翻译模型多线程推理Github
该版本改善了翻译质量,特别是在人称准确性和术语一致性方面,并提高了推理速度和显存效率。支持术语表以确保专有名词和人称一致,并提高了简单控制符的保留能力,减少行数不一致的可能性。采用GQA底模,显著提升多线程推理效率,详细教程请参考相关文件。
opus-mt-eu-en - 欧-英机器翻译开源项目,提供精确翻译
SentencePiece翻译模型transformer-alignBLEU评分Github开源项目模型opusHuggingface
该开源项目提供欧-英翻译,基于transformer-align模型和SentencePiece预处理,BLEU评分为46.1,chr-F评分为0.638,适用于Tatoeba数据集。用户可下载模型权重和测试集翻译,满足多种高质量应用需求。