#检索
gte-large-en-v1.5 - 英语语义相似度模型用于文本分类和检索
Huggingface情感分析模型gte-large-en-v1.5Github聚类检索开源项目分类
gte-large-en-v1.5是一个英语语义相似度模型,在MTEB基准测试中表现优异。该模型在文本分类、检索和聚类等任务上成绩突出,尤其适用于亚马逊评论分类和问答检索等场景。基于Sentence-Transformers框架开发,gte-large-en-v1.5可应用于多种自然语言处理任务,为文本表示提供了有力支持。
UAE-Large-V1 - 高性能多语言语义嵌入模型
特征提取sentence embeddingHuggingface模型GithubMTEB开源项目检索分类
UAE-Large-V1是一款多语言语义嵌入模型,在文本分类、检索、聚类和语义相似度等多个自然语言处理任务中展现出优秀性能。该模型支持多语言处理,可应用于问答系统、文档检索和情感分析等多种场景。UAE-Large-V1为NLP应用开发提供了一个多功能工具,有助于提高各类自然语言处理任务的效果。
bge-small-en - 英文文本嵌入模型在多种自然语言处理任务中展现出色性能
Huggingface模型GithubMTEB聚类检索开源项目句子变换器分类
bge-small-en是一个针对英文文本优化的嵌入模型,在MTEB基准测试中展现出优异性能。该模型在分类、检索、聚类等多种自然语言处理任务中表现出色,尤其在处理Amazon评论和ArguAna论证分析等数据集时效果显著。bge-small-en为需要高质量文本表示的应用场景提供了有力支持。
mxbai-embed-large-v1 - 多语言NLP嵌入模型在MTEB基准测试中展现卓越性能
模型检索开源项目Huggingface聚类分类transformersGithubMTEB
mxbai-embed-large-v1是一个多语言嵌入模型,在MTEB基准测试中表现优异。该模型在文本分类、检索、聚类和语义相似度等NLP任务中取得了良好成绩。基于transformer技术,mxbai-embed-large-v1生成高质量文本表示,可应用于信息检索、问答系统和文本分析等领域。
multilingual-e5-small - 多语言句子嵌入模型支持100多种语言
检索模型多语言聚类Github句子转换器分类Huggingface开源项目
multilingual-e5-small是一个支持100多种语言的句子嵌入模型。该模型在MTEB基准测试的分类、检索、聚类等任务中表现良好,适用于跨语言文本匹配和相似度计算。作为轻量级模型,它可在信息检索、文本分类和机器翻译等领域发挥作用,同时保持较低的计算资源需求。
bge-reranker-base - 高性能中英文文本重排序模型
文本嵌入Huggingface模型模型微调Github开源项目检索FlagEmbeddingBGE
bge-reranker-base是一款基于交叉编码器的中英文文本重排序模型。该模型能对搜索引擎返回的候选文档进行精准重排,有效提升检索质量。在多个重排序任务中表现出色,适用于优化各类信息检索和问答系统的结果。
multilingual-e5-large-instruct - 支持100+语言的多语言大规模指令型自然语言处理模型
模型评估Huggingface模型Github多语言MTEB开源项目检索分类
multilingual-e5-large-instruct是一个多语言大规模指令型语言模型,支持100多种语言的文本处理。该模型在MTEB基准测试的分类、检索、聚类等任务中表现优秀,展现了优异的跨语言能力。它可应用于多语言文本嵌入、语义搜索、文本分类等场景,为自然语言处理提供了实用的多语言解决方案。
MiniCPM-Embedding - 高效中英双语文本嵌入和跨语言检索模型
Huggingface中英双语MiniCPM-Embedding模型跨语言嵌入模型Github开源项目检索
MiniCPM-Embedding是一款中英双语文本嵌入模型,由面壁智能、清华大学和东北大学共同开发。模型基于MiniCPM-2B-sft-bf16训练,采用双向注意力和加权平均池化技术,在中英文检索和跨语言检索任务中表现出色。模型参数为2.4B,嵌入维度2304,最大支持512个输入tokens。MiniCPM-Embedding在多项评测中展现了优秀性能,尤其在跨语言检索任务中表现突出,为中英文文本处理和检索提供了有力工具。
bge-multilingual-gemma2 - 基于Gemma 2架构的多语言文本嵌入模型
Huggingface模型Github多语言MTEB开源项目检索评估指标句子相似度
bge-multilingual-gemma2是基于Gemma 2架构开发的多语言文本嵌入模型。该模型在MTEB NFCorpus、MSMARCO、FiQA2018等多个检索任务数据集上表现优异。它能有效处理多语言文本并生成高质量语义表示,适用于信息检索、句子相似度计算等自然语言处理任务。在MTEB FEVER数据集上,该模型的主要评分达90.38,展现出较强的检索能力。
NV-Embed-v1 - 多任务自然语言处理领域的高性能嵌入式模型
检索模型聚类Githubsentence-transformers分类MTEBHuggingface开源项目
NV-Embed-v1是一款在多项自然语言处理任务中表现出色的嵌入式模型。模型在分类、检索、聚类、重排序和语义相似度等任务中均取得优异成绩,尤其在情感分析和问答系统方面表现突出。NV-Embed-v1支持多语言处理,适用范围广泛,是自然语言处理领域的实用工具。
snowflake-arctic-embed-m - 多语言句子嵌入模型助力相似度计算和语义搜索
模型检索开源项目Huggingface聚类分类相似度计算sentence-transformersGithub
snowflake-arctic-embed-m是一个开源的句子嵌入模型,主要用于多语言环境下的相似度计算和语义搜索。在MTEB基准测试中,该模型在分类、聚类和检索等任务上展现了不错的性能。它能够处理多种语言,有效提取句子的语义信息,为各类自然语言处理应用提供嵌入表示。模型适用于文本分类、信息检索和语义相似度计算等场景。
gte-base-en-v1.5 - 英文文本嵌入模型在自然语言处理任务中的应用
模型检索开源项目Huggingface分类transformerssentence-transformersGithubMTEB
gte-base-en-v1.5是一个英文文本嵌入模型,在MTEB基准测试中展现出优秀性能。该模型在句子相似度、文本分类和信息检索等自然语言处理任务中表现突出,能有效捕捉文本语义并为下游应用提供高质量的文本表示。测试结果显示,gte-base-en-v1.5在多个评估指标上取得了良好成绩,体现了其在不同应用场景中的实用价值。
snowflake-arctic-embed-xs - 轻量级多语言句子嵌入模型,专注文本相似度分析
模型检索开源项目Huggingface聚类语义相似度分类sentence-transformersGithub
snowflake-arctic-embed-xs是一款轻量级句子嵌入模型,针对多语言相似度任务优化。该模型在MTEB基准测试中展现出优异性能,尤其在文本分类、信息检索和聚类分析方面表现突出。尽管体积小巧,它仍在多个数据集上保持较高的准确率和F1分数,适合需要高效文本表示的各类应用场景。
NV-Embed-v2 - 多语言嵌入模型提升各类自然语言处理任务性能
检索模型聚类语义文本相似度Github分类MTEBHuggingface开源项目
NV-Embed-v2是一款多语言嵌入模型,针对多种自然语言处理任务进行了优化。该模型在文本分类、检索、聚类和语义相似度等基准测试中展现出优异表现,体现了其在跨语言和跨领域应用中的实力。通过深度学习技术,NV-Embed-v2能够生成高质量的文本表示,为各类NLP应用奠定了良好基础。
SFR-Embedding-2_R - 增强自然语言处理性能的多任务算法模型
检索评估开源项目Salesforce/SFR-Embedding-2_R模型分类HuggingfaceGithub
SFR-Embedding-2_R项目结合分类、检索、聚类及重排序任务,提供高级自然语言处理解决方案。在MTEB多个数据集上进行测试,展示了在情感分类、亚马逊评论分类等任务中的高性能表现,适用于需要高效灵活性的应用场景,尤其在复杂数据集中的表现更加出色。
cde-small-v1 - 增强文本分类与信息检索能力的多任务模型
MTEB分类聚类检索Huggingface句子嵌入Github开源项目模型
该项目在多任务环境下表现优异,尤其在文本分类与检索任务中。模型在多个数据集上表现出高准确率与精度,广泛适用于商业、教育与研究领域。其卓越的性能满足了对高精确度的需求,提供了一致而可靠的结果。
cloudy-large-zh - 支持多任务评估的高级句子相似性和特征提取模型
Huggingface排序重排开源项目模型Github数据集sentence-transformers句子相似性检索
cloudy-large-zh项目专注于句子相似性和特征提取,利用MTEB数据集进行广泛的任务评估。在中医问答、电子商务和视频检索等领域表现优异,特别是在MTEB CMedQAv2重新排序任务中获得89.47的MRR分数。采用先进算法提高检索性能,确保各领域内容的准确排序和高效检索。
chinese-clip-vit-huge-patch14 - 基于ViT-H/14和RoBERTa的中文图文对比学习模型
检索图像编码器Chinese-CLIP中文数据集开源项目文本编码器模型HuggingfaceGithub
chinese-clip-vit-huge-patch14是一个基于ViT-H/14和RoBERTa-wwm-large的中文CLIP模型,在大规模中文图文数据上训练,表现卓越。支持在MUGE、Flickr30K-CN和COCO-CN等数据集中的图文检索和零样本分类。提供API实现简便的图文特征提取及相似度计算,详情请参见GitHub仓库。
bge-en-icl - 先进的多语言自然语言处理模型
分类检索Huggingfacesentence-transformersGithub开源项目模型特征提取句子相似度
bge-en-icl是一个开源的句子嵌入模型,在MTEB基准测试的多项自然语言处理任务中表现出色。该模型支持多语言处理,适用于句子相似度计算、文本分类和信息检索等应用场景。在AmazonPolarity分类任务中,bge-en-icl达到了96.98%的准确率;在FEVER检索任务中,准确率达到92.83%。此外,该模型在其他任务如ArguAna检索和Banking77分类中也取得了优异成绩。bge-en-icl为研究人员和开发者提供了一个强大的工具,用于处理和分析各种文本数据。
e5-large - 句子嵌入模型应用于文本分类与检索,提升准确率
MTEB分类Sentence Transformers检索HuggingfaceGithub开源项目模型sentence-similarity
项目利用Sentence Transformers技术,提升自然语言处理任务中的句子嵌入效率,涵盖分类、检索、聚类及重排序等。该模型在多数据集上优异,尤其是在Amazon极性分类的准确率达90.05%。通过优化句子相似性,增强了在BIOSSES等任务中的相关性得分,是语义搜索和信息检索的理想之选,支持多语言文本分析。
Linq-Embed-Mistral - 多任务文本分析工具
重排聚类Huggingface开源项目模型Github分类Linq-Embed-Mistral检索
Linq-Embed-Mistral模型在多任务文本处理表现优秀,如情感分析、分类及信息检索。在MTEB AmazonPolarityClassification中准确率达95.7%,在MTEB FEVER的MAP@1为82.52%,适用于大规模文本数据的分析,支持电商、银行、出版等领域。