#检索

Huggingface情感分析模型gte-large-en-v1.5Github聚类检索开源项目分类

gte-large-en-v1.5是一个英语语义相似度模型,在MTEB基准测试中表现优异。该模型在文本分类、检索和聚类等任务上成绩突出,尤其适用于亚马逊评论分类和问答检索等场景。基于Sentence-Transformers框架开发,gte-large-en-v1.5可应用于多种自然语言处理任务,为文本表示提供了有力支持。

UAE-Large-V1 - 高性能多语言语义嵌入模型

特征提取sentence embeddingHuggingface模型GithubMTEB开源项目检索分类

UAE-Large-V1是一款多语言语义嵌入模型，在文本分类、检索、聚类和语义相似度等多个自然语言处理任务中展现出优秀性能。该模型支持多语言处理，可应用于问答系统、文档检索和情感分析等多种场景。UAE-Large-V1为NLP应用开发提供了一个多功能工具，有助于提高各类自然语言处理任务的效果。

bge-small-en - 英文文本嵌入模型在多种自然语言处理任务中展现出色性能

Huggingface模型GithubMTEB聚类检索开源项目句子变换器分类

bge-small-en是一个针对英文文本优化的嵌入模型，在MTEB基准测试中展现出优异性能。该模型在分类、检索、聚类等多种自然语言处理任务中表现出色，尤其在处理Amazon评论和ArguAna论证分析等数据集时效果显著。bge-small-en为需要高质量文本表示的应用场景提供了有力支持。

mxbai-embed-large-v1 - 多语言NLP嵌入模型在MTEB基准测试中展现卓越性能

模型检索开源项目Huggingface聚类分类transformersGithubMTEB

mxbai-embed-large-v1是一个多语言嵌入模型，在MTEB基准测试中表现优异。该模型在文本分类、检索、聚类和语义相似度等NLP任务中取得了良好成绩。基于transformer技术，mxbai-embed-large-v1生成高质量文本表示，可应用于信息检索、问答系统和文本分析等领域。

multilingual-e5-small - 多语言句子嵌入模型支持100多种语言

检索模型多语言聚类Github句子转换器分类Huggingface开源项目

multilingual-e5-small是一个支持100多种语言的句子嵌入模型。该模型在MTEB基准测试的分类、检索、聚类等任务中表现良好，适用于跨语言文本匹配和相似度计算。作为轻量级模型，它可在信息检索、文本分类和机器翻译等领域发挥作用，同时保持较低的计算资源需求。

bge-reranker-base - 高性能中英文文本重排序模型

文本嵌入Huggingface模型模型微调Github开源项目检索FlagEmbeddingBGE

bge-reranker-base是一款基于交叉编码器的中英文文本重排序模型。该模型能对搜索引擎返回的候选文档进行精准重排,有效提升检索质量。在多个重排序任务中表现出色,适用于优化各类信息检索和问答系统的结果。

multilingual-e5-large-instruct - 支持100+语言的多语言大规模指令型自然语言处理模型

模型评估Huggingface模型Github多语言MTEB开源项目检索分类

multilingual-e5-large-instruct是一个多语言大规模指令型语言模型，支持100多种语言的文本处理。该模型在MTEB基准测试的分类、检索、聚类等任务中表现优秀，展现了优异的跨语言能力。它可应用于多语言文本嵌入、语义搜索、文本分类等场景，为自然语言处理提供了实用的多语言解决方案。

MiniCPM-Embedding - 高效中英双语文本嵌入和跨语言检索模型

Huggingface中英双语MiniCPM-Embedding模型跨语言嵌入模型Github开源项目检索

MiniCPM-Embedding是一款中英双语文本嵌入模型，由面壁智能、清华大学和东北大学共同开发。模型基于MiniCPM-2B-sft-bf16训练，采用双向注意力和加权平均池化技术，在中英文检索和跨语言检索任务中表现出色。模型参数为2.4B，嵌入维度2304，最大支持512个输入tokens。MiniCPM-Embedding在多项评测中展现了优秀性能，尤其在跨语言检索任务中表现突出，为中英文文本处理和检索提供了有力工具。

bge-multilingual-gemma2 - 基于Gemma 2架构的多语言文本嵌入模型

Huggingface模型Github多语言MTEB开源项目检索评估指标句子相似度

bge-multilingual-gemma2是基于Gemma 2架构开发的多语言文本嵌入模型。该模型在MTEB NFCorpus、MSMARCO、FiQA2018等多个检索任务数据集上表现优异。它能有效处理多语言文本并生成高质量语义表示，适用于信息检索、句子相似度计算等自然语言处理任务。在MTEB FEVER数据集上，该模型的主要评分达90.38，展现出较强的检索能力。

NV-Embed-v1 - 多任务自然语言处理领域的高性能嵌入式模型

检索模型聚类Githubsentence-transformers分类MTEBHuggingface开源项目

NV-Embed-v1是一款在多项自然语言处理任务中表现出色的嵌入式模型。模型在分类、检索、聚类、重排序和语义相似度等任务中均取得优异成绩，尤其在情感分析和问答系统方面表现突出。NV-Embed-v1支持多语言处理，适用范围广泛，是自然语言处理领域的实用工具。

snowflake-arctic-embed-m - 多语言句子嵌入模型助力相似度计算和语义搜索

模型检索开源项目Huggingface聚类分类相似度计算sentence-transformersGithub

snowflake-arctic-embed-m是一个开源的句子嵌入模型，主要用于多语言环境下的相似度计算和语义搜索。在MTEB基准测试中，该模型在分类、聚类和检索等任务上展现了不错的性能。它能够处理多种语言，有效提取句子的语义信息，为各类自然语言处理应用提供嵌入表示。模型适用于文本分类、信息检索和语义相似度计算等场景。

gte-base-en-v1.5 - 英文文本嵌入模型在自然语言处理任务中的应用

模型检索开源项目Huggingface分类transformerssentence-transformersGithubMTEB

gte-base-en-v1.5是一个英文文本嵌入模型,在MTEB基准测试中展现出优秀性能。该模型在句子相似度、文本分类和信息检索等自然语言处理任务中表现突出,能有效捕捉文本语义并为下游应用提供高质量的文本表示。测试结果显示,gte-base-en-v1.5在多个评估指标上取得了良好成绩,体现了其在不同应用场景中的实用价值。

snowflake-arctic-embed-xs - 轻量级多语言句子嵌入模型，专注文本相似度分析

模型检索开源项目Huggingface聚类语义相似度分类sentence-transformersGithub

snowflake-arctic-embed-xs是一款轻量级句子嵌入模型，针对多语言相似度任务优化。该模型在MTEB基准测试中展现出优异性能，尤其在文本分类、信息检索和聚类分析方面表现突出。尽管体积小巧，它仍在多个数据集上保持较高的准确率和F1分数，适合需要高效文本表示的各类应用场景。

NV-Embed-v2 - 多语言嵌入模型提升各类自然语言处理任务性能

检索模型聚类语义文本相似度Github分类MTEBHuggingface开源项目

NV-Embed-v2是一款多语言嵌入模型，针对多种自然语言处理任务进行了优化。该模型在文本分类、检索、聚类和语义相似度等基准测试中展现出优异表现，体现了其在跨语言和跨领域应用中的实力。通过深度学习技术，NV-Embed-v2能够生成高质量的文本表示，为各类NLP应用奠定了良好基础。

SFR-Embedding-2_R - 增强自然语言处理性能的多任务算法模型

检索评估开源项目Salesforce/SFR-Embedding-2_R模型分类HuggingfaceGithub

SFR-Embedding-2_R项目结合分类、检索、聚类及重排序任务，提供高级自然语言处理解决方案。在MTEB多个数据集上进行测试，展示了在情感分类、亚马逊评论分类等任务中的高性能表现，适用于需要高效灵活性的应用场景，尤其在复杂数据集中的表现更加出色。

cde-small-v1 - 增强文本分类与信息检索能力的多任务模型

MTEB分类聚类检索Huggingface句子嵌入Github开源项目模型

该项目在多任务环境下表现优异，尤其在文本分类与检索任务中。模型在多个数据集上表现出高准确率与精度，广泛适用于商业、教育与研究领域。其卓越的性能满足了对高精确度的需求，提供了一致而可靠的结果。

cloudy-large-zh - 支持多任务评估的高级句子相似性和特征提取模型

Huggingface排序重排开源项目模型Github数据集sentence-transformers句子相似性检索

cloudy-large-zh项目专注于句子相似性和特征提取，利用MTEB数据集进行广泛的任务评估。在中医问答、电子商务和视频检索等领域表现优异，特别是在MTEB CMedQAv2重新排序任务中获得89.47的MRR分数。采用先进算法提高检索性能，确保各领域内容的准确排序和高效检索。

chinese-clip-vit-huge-patch14 - 基于ViT-H/14和RoBERTa的中文图文对比学习模型

检索图像编码器Chinese-CLIP中文数据集开源项目文本编码器模型HuggingfaceGithub

chinese-clip-vit-huge-patch14是一个基于ViT-H/14和RoBERTa-wwm-large的中文CLIP模型，在大规模中文图文数据上训练，表现卓越。支持在MUGE、Flickr30K-CN和COCO-CN等数据集中的图文检索和零样本分类。提供API实现简便的图文特征提取及相似度计算，详情请参见GitHub仓库。

bge-en-icl - 先进的多语言自然语言处理模型

分类检索Huggingfacesentence-transformersGithub开源项目模型特征提取句子相似度

bge-en-icl是一个开源的句子嵌入模型，在MTEB基准测试的多项自然语言处理任务中表现出色。该模型支持多语言处理，适用于句子相似度计算、文本分类和信息检索等应用场景。在AmazonPolarity分类任务中，bge-en-icl达到了96.98%的准确率；在FEVER检索任务中，准确率达到92.83%。此外，该模型在其他任务如ArguAna检索和Banking77分类中也取得了优异成绩。bge-en-icl为研究人员和开发者提供了一个强大的工具，用于处理和分析各种文本数据。

e5-large - 句子嵌入模型应用于文本分类与检索，提升准确率

MTEB分类Sentence Transformers检索HuggingfaceGithub开源项目模型sentence-similarity

项目利用Sentence Transformers技术，提升自然语言处理任务中的句子嵌入效率，涵盖分类、检索、聚类及重排序等。该模型在多数据集上优异，尤其是在Amazon极性分类的准确率达90.05%。通过优化句子相似性，增强了在BIOSSES等任务中的相关性得分，是语义搜索和信息检索的理想之选，支持多语言文本分析。

Linq-Embed-Mistral - 多任务文本分析工具

重排聚类Huggingface开源项目模型Github分类Linq-Embed-Mistral检索

Linq-Embed-Mistral模型在多任务文本处理表现优秀，如情感分析、分类及信息检索。在MTEB AmazonPolarityClassification中准确率达95.7%，在MTEB FEVER的MAP@1为82.52%，适用于大规模文本数据的分析，支持电商、银行、出版等领域。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com