#英语
link-grammar - 多语言句法分析工具
Link Grammar Parser解析器句法结构英语自然语言处理Github开源项目
Link Grammar Parser 支持多种语言的句法解析,包括英语、泰语、俄语、阿拉伯语和波斯语等。通过连字符(边)构成的图展示句子的语法结构,提供比传统解析器更详尽的信息。该项目于卡内基梅隆大学开发,现在支持多线程和UTF-8,性能和安全性显著提升。支持多种编程语言API,并包含命令行工具和生成语句的实验系统。该项目在LGPL许可下开放,适用于私人和商业用途。更多信息请访问官方网页。
ttsMP3.com - 免费多语言文本转语音与MP3生成工具
AI工具文字转语音英语语音合成AWS Polly多语言支持
ttsMP3.com是一款支持多语言的免费文本转语音工具。它能将文字转换为自然语音,并支持MP3下载。适用于在线学习、演示、视频制作和网站无障碍化。用户可在线试听和下载MP3,每日限额3000字符。该工具还提供丰富的语音效果和定制选项,如插入停顿、强调词语、调整语速和音调等。
Open Translation AI - 多语言智能翻译平台
AI工具翻译AI语言英语西班牙语
Open Translation AI 是一个先进的多语言翻译平台,提供高质量的翻译服务。该平台支持英语、西班牙语等50多种语言,为用户提供接近人类水平的翻译效果。凭借快速的翻译速度和高度的准确性,平台适用于个人和企业的跨语言交流和内容本地化需求。Open Translation AI 旨在消除语言障碍,促进全球交流,为用户提供便捷有效的翻译解决方案。
Tinder Ice Breakers AI - 智能聊天开场白生成工具
AI工具AI对话聊天话题幽默英语约会
Tinder Ice Breakers AI为社交平台用户提供智能生成的聊天开场白。这款工具适用于Tinder、Bumble等平台,能够生成幽默、有趣且富有创意的对话起始语。它旨在帮助用户轻松打破社交尴尬,吸引对方注意,并建立有趣的对话连接。无论是社交达人还是内向人士,都能找到合适的开场白,从而提升在线社交体验。
UD_English-EWT - UD英语网络树库 依存句法标注语料库
Universal Dependencies语料库英语依存句法标注Github开源项目
UD英语网络树库包含254,820个单词和16,622个句子,涵盖博客、新闻组、电子邮件等多种网络文本。语料采用CoNLL-U格式,依存关系经人工校正,部分双重标注。该语料库遵循通用依存关系规范,为自然语言处理研究提供了高质量的英语语言资源。
profane-words - 英语脏话和粗俗语言的综合词汇列表
profane-words英语脏话列表npm包开源项目Github
profane-words提供了一个英语脏话和粗俗语言的综合词汇列表,主要用于内容过滤、语言审核等需要识别不当用语的场景。该项目以npm包形式发布,便于在JavaScript项目中集成使用。列表内容来源广泛,经过整合筛选,并持续更新以确保准确性。开发者可通过简单的API检查特定词汇是否包含在列表中。该项目采用WTFPL许可证开源,欢迎开发者使用和贡献。
opus-mt-en-es - 基于Transformer的英西机器翻译模型
翻译模型西班牙语OPUS英语Huggingface模型TatoebaGithub开源项目
opus-mt-en-es是一个开源的英语到西班牙语机器翻译模型,基于Transformer架构。该模型在新闻测试集上BLEU分数介于30-39之间,在Tatoeba测试集上BLEU分数达54.9,chrF分数为0.721。模型采用SentencePiece进行预处理,适用于各种英西翻译任务。项目开源于Hugging Face,提供模型权重下载。模型由Helsinki-NLP团队开发,使用OPUS平行语料库训练。除了高性能表现外,opus-mt-en-es还提供了完整的测试集翻译结果和评估分数,便于研究人员进行比较和分析。该模型适用于需要高质量英西翻译的各种应用场景。
opus-mt-en-ar - 英语到阿拉伯语的开源神经机器翻译模型
模型Tatoeba阿拉伯语机器翻译Github英语开源项目HuggingfaceOPUS
opus-mt-en-ar是Helsinki-NLP团队开发的英语到阿拉伯语翻译模型。这个基于Transformer的模型支持包括现代标准阿拉伯语在内的多种阿拉伯语变体,使用SentencePiece进行分词,并要求输入特定的语言标记。在Tatoeba测试集上,模型获得了14.0的BLEU分数和0.437的chrF值,显示了其在英阿翻译任务上的性能。
longformer-large-4096 - 专为长序列处理设计的transformer模型
模型语言英语开源项目国际交流Huggingface编程Github学习
Longformer-large-4096是一种为长序列处理设计的transformer模型。该模型通过改进的注意力机制,克服了传统transformer处理长文本的限制。它可处理长达4096个token的输入,适用于文档摘要和问答系统等长文本理解任务。Longformer-large-4096能高效捕捉长距离依赖关系,为自然语言处理提供了新的解决方案。
mms-tts-eng - Facebook开源英语文本转语音AI模型
模型MMS多语言语音英语开源项目Huggingface文字转语音GithubVITS
Facebook开发的MMS项目推出英语文本转语音模型,采用VITS架构实现高质量语音合成。该开源模型可通过Hugging Face Transformers库调用,支持非确定性合成以生成富有表现力的语音。作为多语言语音技术项目的一部分,此模型旨在推动语音合成技术在更多语言中的应用。
opus-mt-tc-big-tr-en - OPUS-MT 项目开源的土耳其语-英语神经机器翻译模型
模型机器翻译英语开源项目Huggingface土耳其语OPUS-MTtransformerGithub
opus-mt-tc-big-tr-en 是 OPUS-MT 项目开发的土耳其语到英语神经机器翻译模型。该模型基于 Marian NMT 框架训练,并转换为 PyTorch 格式以兼容 Hugging Face transformers 库。在多个测试集上表现优异,Tatoeba 测试集上 BLEU 分数达 57.6。模型采用 transformer-big 架构,使用 OPUS 和 Tatoeba Challenge 数据训练,为研究人员和开发者提供了高质量的开源翻译工具。
translation-model-opus - Helsinki-NLP团队开发的英西翻译模型 基于OPUS数据集
模型西班牙语机器翻译英语开源项目HuggingfaceOPUSTatoebaGithub
Helsinki-NLP团队基于transformer架构和OPUS数据集开发了这个英语到西班牙语的翻译模型。模型在多个新闻测试集上BLEU得分达30-39,Tatoeba测试集更高达54.9。采用normalization和SentencePiece预处理技术,为英西文本翻译需求提供了高质量的开源解决方案。
opus-mt-en-bg - 英语到保加利亚语的开源神经机器翻译模型
模型Tatoeba机器翻译Github保加利亚语英语开源项目HuggingfaceOPUS
opus-mt-en-bg是一个基于Transformer架构的英语到保加利亚语机器翻译模型。该模型在Tatoeba测试集上达到50.6的BLEU分数和0.680的chrF值。它使用SentencePiece进行预处理,支持保加利亚语的拉丁字母变体,需要添加目标语言标记。这个模型是Helsinki-NLP开发的Tatoeba-Challenge项目的一部分,为英语到保加利亚语的翻译提供了开源解决方案。模型采用了normalization和SentencePiece (spm32k,spm32k)预处理方法,需要在句子开头添加'>>id<<'形式的目标语言标记。用户可以下载原始权重、测试集翻译和评分结果。该项目遵循Apache-2.0许可协议,为研究人员和开发者提供了可靠的英语到保加利亚语机器翻译资源。
opus-mt-pl-en - 基于OPUS数据集的波兰语-英语机器翻译模型
模型机器翻译opus-mt-pl-enBLEU评分波兰语Github英语Huggingface开源项目
opus-mt-pl-en项目提供了模型权重下载、测试集翻译结果和评分文件。该模型采用transformer-align架构,专注于波兰语到英语的翻译。在Tatoeba测试集上,模型展现了优秀的性能,BLEU得分为54.9,chr-F得分为0.701。项目使用OPUS数据集训练,并应用了规范化和SentencePiece预处理技术,为波兰语-英语机器翻译研究和应用提供了有价值的资源。
jais-adapted-13b-chat - 基于Llama-2的双语英阿大规模语言模型
Jais开源项目阿拉伯语Huggingface模型英语大语言模型人工智能Github
jais-adapted-13b-chat是一个基于Llama-2的双语英阿大规模语言模型。它通过添加32,000个阿拉伯语词元进行预训练适配,显著提升了计算效率。该模型在1.6万亿个阿拉伯语、英语和代码数据上训练,并经过指令微调支持对话功能。凭借出色的阿拉伯语和英语能力,该模型可广泛应用于各类自然语言处理任务。
opus-mt-da-en - 基于Transformer架构的丹麦语-英语神经机器翻译模型
模型transformer-alignOPUS-MT机器翻译Github丹麦语英语Huggingface开源项目
opus-mt-da-en是一个丹麦语到英语的神经机器翻译模型,基于transformer-align架构。该模型使用OPUS数据集训练,应用了归一化和SentencePiece预处理技术。在Tatoeba测试集上,模型获得了63.6的BLEU分数和0.769的chr-F分数,显示出良好的翻译效果。模型提供预训练权重下载,可用于丹麦语到英语的翻译任务。
llama-3.2-Korean-Bllossom-3B - 基于Llama 3.2的韩英双语增强语言模型
语言模型模型Bllossom-3BGithubLLaMA英语开源项目Huggingface韩语
llama-3.2-Korean-Bllossom-3B是基于Llama 3.2-3B的韩英双语增强模型。通过150GB精选韩语数据的全面微调和指令调优,该模型在保持英语能力的同时显著提升了韩语表现。在LogicKor基准测试中,它创下了3B-5B规模模型的最高分。这个开源模型支持商业使用,为韩语自然语言处理任务提供了有力支持。
opus-mt-uk-en - 乌克兰语至英语的开源神经机器翻译模型
transformer-align机器翻译HuggingfaceOPUS英语模型Github开源项目乌克兰语
opus-mt-uk-en是一个开源的乌克兰语到英语神经机器翻译模型,基于transformer-align架构开发。该模型使用OPUS数据集训练,经过normalization和SentencePiece预处理。在Tatoeba测试集上,模型达到了64.1的BLEU分数和0.757的chr-F分数,显示出良好的翻译效果。研究者可以下载预训练权重和测试集结果进行进一步评估和应用。
opus-mt-en-hi - 开源英语-印地语Transformer机器翻译模型
机器翻译HuggingfaceOPUS英语模型印地语Github开源项目Tatoeba-Challenge
opus-mt-en-hi是OPUS项目开发的英语到印地语机器翻译模型,基于Transformer架构。模型在Tatoeba测试集上获得16.1 BLEU分数和0.447 chrF分数。它采用SentencePiece进行预处理,适用于多种翻译任务。作为开源资源,该模型为自然语言处理研究和应用开发提供了有价值的工具。
opus-mt-sv-en - 基于OPUS数据集的瑞典语-英语神经机器翻译模型
机器翻译HuggingfaceOPUS-MT模型英语瑞典语Github开源项目BLEU评分
opus-mt-sv-en是一个瑞典语到英语的神经机器翻译模型,基于transformer-align架构构建。该模型使用OPUS数据集训练,经过normalization和SentencePiece预处理。在Tatoeba测试集上,模型达到64.5 BLEU分数和0.763 chr-F分数,显示出较高的翻译质量。项目开源了预训练权重、测试集翻译结果和评估数据,便于研究者复现和评估模型性能。
mformer-loyalty - 构建高效的机器学习转换器框架
开源协议GithubMIT英语软件许可Huggingface开源项目transformers模型
mformer-loyalty是一个基于MIT许可证的开源项目,集成于transformers库中。该项目使用英语进行开发维护。
mformer-authority - 基于Transformers的开源自然语言处理库
transformers自然语言处理开源许可Github英语模型机器学习库Huggingface开源项目
mformer-authority是一个基于MIT许可的开源自然语言处理库,提供了便捷的Transformers模型使用接口。该库支持多语言处理,可帮助开发者快速构建和部署NLP应用。作为一个轻量级工具,mformer-authority适用于各种自然语言处理任务,包括文本分类、命名实体识别等。它具有易用性高、性能优良的特点,是开发者进行NLP项目的理想选择。
opus-mt-en-eu - 基于Transformer的英语-巴斯克语机器翻译模型 Tatoeba测试集BLEU 31.8
机器翻译开源项目模型英语transformer-alignGithubHuggingface巴斯克语Tatoeba-Challenge
opus-mt-en-eu是一个英语到巴斯克语的机器翻译模型,基于transformer-align架构构建。模型使用SentencePiece进行预处理,在Tatoeba测试集上达到31.8 BLEU分数和0.590 chr-F分数。由Helsinki-NLP开发并以Apache-2.0许可发布,适用于英语到巴斯克语的翻译任务。模型支持单向翻译,可应用于需要高质量英巴翻译的场景。
vinai-translate-vi2en-v2 - 精确的越南语与英语神经翻译模型
Github开源项目语言翻译VinAI Translate越南语模型Huggingface神经机器翻译英语
VinAI Translate是一个实现越南语和英语互译的神经机器翻译系统,以其创新架构和优异的实验结果,受到业界关注。研究人员可通过项目主页获取更多信息,并在使用时引用相关论文。
opus-mt-en-vi - 基于Transformer架构的英越翻译模型 实现37.2 BLEU评分
HuggingfaceOPUSTatoeba开源项目模型英语越南语Github机器翻译
基于transformer-align架构开发的英语到越南语机器翻译模型,在Tatoeba测试集上达到37.2 BLEU分和0.542 chrF评分。模型使用SentencePiece技术进行分词预处理,支持英语到越南语(含喃字)的翻译功能。作为OPUS项目的组成部分,该模型于2020年6月发布,并提供完整的模型权重与测试数据集。
spelling-correction-english-base - 英语基础拼写校正模型,提升文本准确性
实验Github开源项目局限性拼写校正模型Huggingface英语
本项目提供一个实验性模型,用于英语拼写和标点校正,适合多种文本输入。利用pipeline界面测试的长文本支持功能,可提高文本的准确性。专为英语拼写错误校正而设计,适合不同应用场景。项目仍在开发中,可能会进一步改善。模型在MIT许可证下可用,代码位于GitHub,适合进行不同语言实验训练的用户。
opus-mt-ca-en - 基于Transformer架构的加泰罗尼亚语-英语机器翻译模型
机器翻译opus-mt-ca-enGithub开源项目英语Huggingface模型评估加泰罗尼亚语模型
该模型采用transformer-align架构,实现加泰罗尼亚语到英语的翻译功能。模型使用normalization和SentencePiece进行预处理,在Tatoeba测试集达到51.4 BLEU评分。作为OPUS项目的组成部分,模型开放训练权重下载及测试评估数据,可用于加泰罗尼亚语-英语的自动翻译场景。
translation-en-pt-t5 - 针对英语到葡萄牙语翻译优化的T5模型
Github翻译开源项目葡萄牙语模型Huggingface英语T5
介绍英语到葡萄牙语翻译的改进T5模型,利用预训练模型提升翻译准确性和效率。
opus-mt-gmq-en - 北日耳曼语到英语的翻译模型
Github模型开源项目英语HuggingfaceTatoeba-ChallengeNorth Germanic languages翻译
这是一个基于transformer模型的项目,专注于将北日耳曼语言翻译为英语。使用了SentencePiece进行预处理,支持多种语言,比如丹麦语、挪威语和瑞典语。在Tatoeba测试集上,获得了58.1的BLEU评分。用户可以通过提供的链接下载原始模型权重和测试集,适合对多语言翻译有研究兴趣的开发者和研究人员。