#英语

Link Grammar Parser解析器句法结构英语自然语言处理Github开源项目

Link Grammar Parser 支持多种语言的句法解析，包括英语、泰语、俄语、阿拉伯语和波斯语等。通过连字符（边）构成的图展示句子的语法结构，提供比传统解析器更详尽的信息。该项目于卡内基梅隆大学开发，现在支持多线程和UTF-8，性能和安全性显著提升。支持多种编程语言API，并包含命令行工具和生成语句的实验系统。该项目在LGPL许可下开放，适用于私人和商业用途。更多信息请访问官方网页。

ttsMP3.com - 免费多语言文本转语音与MP3生成工具

AI工具文字转语音英语语音合成AWS Polly多语言支持

ttsMP3.com是一款支持多语言的免费文本转语音工具。它能将文字转换为自然语音，并支持MP3下载。适用于在线学习、演示、视频制作和网站无障碍化。用户可在线试听和下载MP3，每日限额3000字符。该工具还提供丰富的语音效果和定制选项，如插入停顿、强调词语、调整语速和音调等。

Open Translation AI - 多语言智能翻译平台

AI工具翻译AI语言英语西班牙语

Open Translation AI 是一个先进的多语言翻译平台，提供高质量的翻译服务。该平台支持英语、西班牙语等50多种语言，为用户提供接近人类水平的翻译效果。凭借快速的翻译速度和高度的准确性，平台适用于个人和企业的跨语言交流和内容本地化需求。Open Translation AI 旨在消除语言障碍，促进全球交流，为用户提供便捷有效的翻译解决方案。

Tinder Ice Breakers AI - 智能聊天开场白生成工具

AI工具AI对话聊天话题幽默英语约会

Tinder Ice Breakers AI为社交平台用户提供智能生成的聊天开场白。这款工具适用于Tinder、Bumble等平台，能够生成幽默、有趣且富有创意的对话起始语。它旨在帮助用户轻松打破社交尴尬，吸引对方注意，并建立有趣的对话连接。无论是社交达人还是内向人士，都能找到合适的开场白，从而提升在线社交体验。

UD_English-EWT - UD英语网络树库依存句法标注语料库

Universal Dependencies语料库英语依存句法标注Github开源项目

UD英语网络树库包含254,820个单词和16,622个句子,涵盖博客、新闻组、电子邮件等多种网络文本。语料采用CoNLL-U格式,依存关系经人工校正,部分双重标注。该语料库遵循通用依存关系规范,为自然语言处理研究提供了高质量的英语语言资源。

profane-words - 英语脏话和粗俗语言的综合词汇列表

profane-words英语脏话列表npm包开源项目Github

profane-words提供了一个英语脏话和粗俗语言的综合词汇列表，主要用于内容过滤、语言审核等需要识别不当用语的场景。该项目以npm包形式发布，便于在JavaScript项目中集成使用。列表内容来源广泛，经过整合筛选，并持续更新以确保准确性。开发者可通过简单的API检查特定词汇是否包含在列表中。该项目采用WTFPL许可证开源，欢迎开发者使用和贡献。

opus-mt-en-es - 基于Transformer的英西机器翻译模型

翻译模型西班牙语OPUS英语Huggingface模型TatoebaGithub开源项目

opus-mt-en-es是一个开源的英语到西班牙语机器翻译模型，基于Transformer架构。该模型在新闻测试集上BLEU分数介于30-39之间，在Tatoeba测试集上BLEU分数达54.9，chrF分数为0.721。模型采用SentencePiece进行预处理，适用于各种英西翻译任务。项目开源于Hugging Face，提供模型权重下载。模型由Helsinki-NLP团队开发，使用OPUS平行语料库训练。除了高性能表现外，opus-mt-en-es还提供了完整的测试集翻译结果和评估分数，便于研究人员进行比较和分析。该模型适用于需要高质量英西翻译的各种应用场景。

opus-mt-en-ar - 英语到阿拉伯语的开源神经机器翻译模型

模型Tatoeba阿拉伯语机器翻译Github英语开源项目HuggingfaceOPUS

opus-mt-en-ar是Helsinki-NLP团队开发的英语到阿拉伯语翻译模型。这个基于Transformer的模型支持包括现代标准阿拉伯语在内的多种阿拉伯语变体，使用SentencePiece进行分词，并要求输入特定的语言标记。在Tatoeba测试集上，模型获得了14.0的BLEU分数和0.437的chrF值，显示了其在英阿翻译任务上的性能。

longformer-large-4096 - 专为长序列处理设计的transformer模型

模型语言英语开源项目国际交流Huggingface编程Github学习

Longformer-large-4096是一种为长序列处理设计的transformer模型。该模型通过改进的注意力机制，克服了传统transformer处理长文本的限制。它可处理长达4096个token的输入，适用于文档摘要和问答系统等长文本理解任务。Longformer-large-4096能高效捕捉长距离依赖关系，为自然语言处理提供了新的解决方案。

mms-tts-eng - Facebook开源英语文本转语音AI模型

模型MMS多语言语音英语开源项目Huggingface文字转语音GithubVITS

Facebook开发的MMS项目推出英语文本转语音模型，采用VITS架构实现高质量语音合成。该开源模型可通过Hugging Face Transformers库调用，支持非确定性合成以生成富有表现力的语音。作为多语言语音技术项目的一部分，此模型旨在推动语音合成技术在更多语言中的应用。

opus-mt-tc-big-tr-en - OPUS-MT 项目开源的土耳其语-英语神经机器翻译模型

模型机器翻译英语开源项目Huggingface土耳其语OPUS-MTtransformerGithub

opus-mt-tc-big-tr-en 是 OPUS-MT 项目开发的土耳其语到英语神经机器翻译模型。该模型基于 Marian NMT 框架训练，并转换为 PyTorch 格式以兼容 Hugging Face transformers 库。在多个测试集上表现优异，Tatoeba 测试集上 BLEU 分数达 57.6。模型采用 transformer-big 架构，使用 OPUS 和 Tatoeba Challenge 数据训练，为研究人员和开发者提供了高质量的开源翻译工具。

translation-model-opus - Helsinki-NLP团队开发的英西翻译模型基于OPUS数据集

模型西班牙语机器翻译英语开源项目HuggingfaceOPUSTatoebaGithub

Helsinki-NLP团队基于transformer架构和OPUS数据集开发了这个英语到西班牙语的翻译模型。模型在多个新闻测试集上BLEU得分达30-39，Tatoeba测试集更高达54.9。采用normalization和SentencePiece预处理技术，为英西文本翻译需求提供了高质量的开源解决方案。

opus-mt-en-bg - 英语到保加利亚语的开源神经机器翻译模型

模型Tatoeba机器翻译Github保加利亚语英语开源项目HuggingfaceOPUS

opus-mt-en-bg是一个基于Transformer架构的英语到保加利亚语机器翻译模型。该模型在Tatoeba测试集上达到50.6的BLEU分数和0.680的chrF值。它使用SentencePiece进行预处理,支持保加利亚语的拉丁字母变体,需要添加目标语言标记。这个模型是Helsinki-NLP开发的Tatoeba-Challenge项目的一部分,为英语到保加利亚语的翻译提供了开源解决方案。模型采用了normalization和SentencePiece (spm32k,spm32k)预处理方法,需要在句子开头添加'>>id<<'形式的目标语言标记。用户可以下载原始权重、测试集翻译和评分结果。该项目遵循Apache-2.0许可协议,为研究人员和开发者提供了可靠的英语到保加利亚语机器翻译资源。

opus-mt-pl-en - 基于OPUS数据集的波兰语-英语机器翻译模型

模型机器翻译opus-mt-pl-enBLEU评分波兰语Github英语Huggingface开源项目

opus-mt-pl-en项目提供了模型权重下载、测试集翻译结果和评分文件。该模型采用transformer-align架构，专注于波兰语到英语的翻译。在Tatoeba测试集上，模型展现了优秀的性能，BLEU得分为54.9，chr-F得分为0.701。项目使用OPUS数据集训练，并应用了规范化和SentencePiece预处理技术，为波兰语-英语机器翻译研究和应用提供了有价值的资源。

jais-adapted-13b-chat - 基于Llama-2的双语英阿大规模语言模型

Jais开源项目阿拉伯语Huggingface模型英语大语言模型人工智能Github

jais-adapted-13b-chat是一个基于Llama-2的双语英阿大规模语言模型。它通过添加32,000个阿拉伯语词元进行预训练适配,显著提升了计算效率。该模型在1.6万亿个阿拉伯语、英语和代码数据上训练,并经过指令微调支持对话功能。凭借出色的阿拉伯语和英语能力,该模型可广泛应用于各类自然语言处理任务。

opus-mt-da-en - 基于Transformer架构的丹麦语-英语神经机器翻译模型

模型transformer-alignOPUS-MT机器翻译Github丹麦语英语Huggingface开源项目

opus-mt-da-en是一个丹麦语到英语的神经机器翻译模型，基于transformer-align架构。该模型使用OPUS数据集训练，应用了归一化和SentencePiece预处理技术。在Tatoeba测试集上，模型获得了63.6的BLEU分数和0.769的chr-F分数，显示出良好的翻译效果。模型提供预训练权重下载，可用于丹麦语到英语的翻译任务。

llama-3.2-Korean-Bllossom-3B - 基于Llama 3.2的韩英双语增强语言模型

语言模型模型Bllossom-3BGithubLLaMA英语开源项目Huggingface韩语

llama-3.2-Korean-Bllossom-3B是基于Llama 3.2-3B的韩英双语增强模型。通过150GB精选韩语数据的全面微调和指令调优，该模型在保持英语能力的同时显著提升了韩语表现。在LogicKor基准测试中，它创下了3B-5B规模模型的最高分。这个开源模型支持商业使用，为韩语自然语言处理任务提供了有力支持。

opus-mt-uk-en - 乌克兰语至英语的开源神经机器翻译模型

transformer-align机器翻译HuggingfaceOPUS英语模型Github开源项目乌克兰语

opus-mt-uk-en是一个开源的乌克兰语到英语神经机器翻译模型，基于transformer-align架构开发。该模型使用OPUS数据集训练，经过normalization和SentencePiece预处理。在Tatoeba测试集上，模型达到了64.1的BLEU分数和0.757的chr-F分数，显示出良好的翻译效果。研究者可以下载预训练权重和测试集结果进行进一步评估和应用。

opus-mt-en-hi - 开源英语-印地语Transformer机器翻译模型

机器翻译HuggingfaceOPUS英语模型印地语Github开源项目Tatoeba-Challenge

opus-mt-en-hi是OPUS项目开发的英语到印地语机器翻译模型，基于Transformer架构。模型在Tatoeba测试集上获得16.1 BLEU分数和0.447 chrF分数。它采用SentencePiece进行预处理，适用于多种翻译任务。作为开源资源，该模型为自然语言处理研究和应用开发提供了有价值的工具。

opus-mt-sv-en - 基于OPUS数据集的瑞典语-英语神经机器翻译模型

机器翻译HuggingfaceOPUS-MT模型英语瑞典语Github开源项目BLEU评分

opus-mt-sv-en是一个瑞典语到英语的神经机器翻译模型，基于transformer-align架构构建。该模型使用OPUS数据集训练，经过normalization和SentencePiece预处理。在Tatoeba测试集上，模型达到64.5 BLEU分数和0.763 chr-F分数，显示出较高的翻译质量。项目开源了预训练权重、测试集翻译结果和评估数据，便于研究者复现和评估模型性能。

mformer-loyalty - 构建高效的机器学习转换器框架

开源协议GithubMIT英语软件许可Huggingface开源项目transformers模型

mformer-loyalty是一个基于MIT许可证的开源项目，集成于transformers库中。该项目使用英语进行开发维护。

mformer-authority - 基于Transformers的开源自然语言处理库

transformers自然语言处理开源许可Github英语模型机器学习库Huggingface开源项目

mformer-authority是一个基于MIT许可的开源自然语言处理库，提供了便捷的Transformers模型使用接口。该库支持多语言处理，可帮助开发者快速构建和部署NLP应用。作为一个轻量级工具，mformer-authority适用于各种自然语言处理任务，包括文本分类、命名实体识别等。它具有易用性高、性能优良的特点，是开发者进行NLP项目的理想选择。

opus-mt-en-eu - 基于Transformer的英语-巴斯克语机器翻译模型 Tatoeba测试集BLEU 31.8

机器翻译开源项目模型英语transformer-alignGithubHuggingface巴斯克语Tatoeba-Challenge

opus-mt-en-eu是一个英语到巴斯克语的机器翻译模型，基于transformer-align架构构建。模型使用SentencePiece进行预处理，在Tatoeba测试集上达到31.8 BLEU分数和0.590 chr-F分数。由Helsinki-NLP开发并以Apache-2.0许可发布，适用于英语到巴斯克语的翻译任务。模型支持单向翻译，可应用于需要高质量英巴翻译的场景。

vinai-translate-vi2en-v2 - 精确的越南语与英语神经翻译模型

Github开源项目语言翻译VinAI Translate越南语模型Huggingface神经机器翻译英语

VinAI Translate是一个实现越南语和英语互译的神经机器翻译系统，以其创新架构和优异的实验结果，受到业界关注。研究人员可通过项目主页获取更多信息，并在使用时引用相关论文。

opus-mt-en-vi - 基于Transformer架构的英越翻译模型实现37.2 BLEU评分

HuggingfaceOPUSTatoeba开源项目模型英语越南语Github机器翻译

基于transformer-align架构开发的英语到越南语机器翻译模型，在Tatoeba测试集上达到37.2 BLEU分和0.542 chrF评分。模型使用SentencePiece技术进行分词预处理，支持英语到越南语（含喃字）的翻译功能。作为OPUS项目的组成部分，该模型于2020年6月发布，并提供完整的模型权重与测试数据集。

spelling-correction-english-base - 英语基础拼写校正模型，提升文本准确性

实验Github开源项目局限性拼写校正模型Huggingface英语

本项目提供一个实验性模型，用于英语拼写和标点校正，适合多种文本输入。利用pipeline界面测试的长文本支持功能，可提高文本的准确性。专为英语拼写错误校正而设计，适合不同应用场景。项目仍在开发中，可能会进一步改善。模型在MIT许可证下可用，代码位于GitHub，适合进行不同语言实验训练的用户。

opus-mt-ca-en - 基于Transformer架构的加泰罗尼亚语-英语机器翻译模型

机器翻译opus-mt-ca-enGithub开源项目英语Huggingface模型评估加泰罗尼亚语模型

该模型采用transformer-align架构，实现加泰罗尼亚语到英语的翻译功能。模型使用normalization和SentencePiece进行预处理，在Tatoeba测试集达到51.4 BLEU评分。作为OPUS项目的组成部分，模型开放训练权重下载及测试评估数据，可用于加泰罗尼亚语-英语的自动翻译场景。

translation-en-pt-t5 - 针对英语到葡萄牙语翻译优化的T5模型

Github翻译开源项目葡萄牙语模型Huggingface英语T5

介绍英语到葡萄牙语翻译的改进T5模型，利用预训练模型提升翻译准确性和效率。

opus-mt-gmq-en - 北日耳曼语到英语的翻译模型

Github模型开源项目英语HuggingfaceTatoeba-ChallengeNorth Germanic languages翻译

这是一个基于transformer模型的项目，专注于将北日耳曼语言翻译为英语。使用了SentencePiece进行预处理，支持多种语言，比如丹麦语、挪威语和瑞典语。在Tatoeba测试集上，获得了58.1的BLEU评分。用户可以通过提供的链接下载原始模型权重和测试集，适合对多语言翻译有研究兴趣的开发者和研究人员。

UD_English-EWT: 英语通用依存关系树库

3 个月前

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com