#跨语言模型

text2text学习资料汇总 - 跨语言NLP/G工具包

3 个月前

Text2Text 跨语言模型自然语言处理文本生成语言翻译 Github 开源项目

3 个月前

Text2Text: 革命性的跨语言自然语言处理工具包

2024年08月31日

Text2Text 跨语言模型自然语言处理文本生成语言翻译 Github 开源项目

2024年08月31日

相关项目

text2text

提供跨语言文本生成、翻译、嵌入和问答等功能的NLP工具包，支持百种语言。可在Google Colab平台免费运行，适用学术研究、企业应用和个性化开发。通过示例和快速入门指南，用户能快速掌握强大的多语言模型，高效处理文本。

SapBERT-UMLS-2020AB-all-lang-from-XLMR

SapBERT-UMLS-2020AB-all-lang-from-XLMR是基于XLM-RoBERTa的跨语言生物医学实体表示学习框架。该模型利用UMLS 2020AB数据集训练，生成高质量的多语言生物医学实体嵌入。在ACL 2021和NAACL 2021会议上获得认可，为生物医学实体链接和语义相似度计算提供有力支持。研究人员可便捷提取实体表示，推动跨语言生物医学文本挖掘研究发展。

infoxlm-large

InfoXLM是一个基于信息论的跨语言预训练模型。它通过创新的预训练目标和技术，最大化不同语言间的互信息，学习通用的多语言表示。这种方法显著提升了模型在多语言和跨语言任务中的性能，为自然语言处理领域提供了有力支持。

cross-en-de-roberta-sentence-transformer

cross-en-de-roberta-sentence-transformer是一个基于RoBERTa的跨语言句向量模型，专门针对德语和英语文本进行优化。该模型通过多语言微调和语言交叉训练，在语义相似度计算、语义搜索和释义挖掘等任务中表现优异。它不仅在德语和英语单语环境下表现出色，在跨语言场景中也展现了卓越性能，为双语自然语言处理应用提供了有力支持。

msmarco-MiniLM-L6-en-de-v1

这是一个基于MS MARCO数据集训练的跨语言文本重排序模型，支持英语和德语文本的相关性排序。模型可处理英语-英语、德语-英语和德语-德语的文本匹配任务。在TREC-DL19和GermanDPR基准测试中表现出色，处理速度可达每秒1600个文档对。兼容SentenceTransformers和Transformers框架，为跨语言信息检索应用提供了高效方案。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com