#sentence-transformers

msmarco-MiniLM-L-6-v3 - 基于BERT的句子编码模型实现文本语义向量化和相似度计算

嵌入模型Github深度学习模型语义向量自然语言处理sentence-transformersHuggingface开源项目

msmarco-MiniLM-L-6-v3是一个基于sentence-transformers的句子编码模型，将文本映射至384维向量空间。模型基于BERT架构，支持文本相似度计算和聚类分析，可通过sentence-transformers或HuggingFace Transformers框架调用。

all-MiniLM-L12-v1 - 基于MiniLM的句子向量化与语义搜索模型

机器学习句子向量Github自然语言处理语义搜索Huggingface开源项目模型sentence-transformers

all-MiniLM-L12-v1是一个开源的句子向量化模型，基于MiniLM架构开发。该模型通过10亿对句子数据训练而成，可将文本转化为384维向量表示，广泛应用于文本聚类、语义检索等场景。模型支持多种调用方式，兼容sentence-transformers和HuggingFace框架，为开发者提供便捷的文本向量化解决方案。

gte-tiny - 轻量级句向量模型实现文本相似度检索和语义匹配

Githubsentence-transformers句子相似度特征提取开源项目自然语言处理Huggingface机器学习模型

gte-tiny是一个轻量级句向量模型，用于文本相似度计算和语义匹配。模型在MTEB基准测试的文本分类、检索和聚类任务中取得良好效果，适用于各类文本处理应用场景。

msmarco-distilbert-base-dot-prod-v3 - 基于DistilBERT的向量化文本映射与相似度计算模型

Githubsentence-transformers句子相似度向量嵌入开源项目自然语言处理语义搜索Huggingface模型

msmarco-distilbert-base-dot-prod-v3是一个开源的sentence-transformer模型，通过将文本映射为768维向量实现语义表示。模型采用点积方法计算文本相似度，支持语义搜索和文本聚类功能。集成sentence-transformers框架，可快速部署并应用于实际场景。该模型在句子嵌入基准测试中表现出色，适用于多种自然语言处理任务。

stsb-bert-tiny-onnx - 基于BERT的轻量级文本向量化模型

语义相似度文本嵌入Githubsentence-transformers开源项目自然语言处理Huggingface模型训练模型

这是一个轻量级的文本向量化模型，基于sentence-transformers框架开发。模型可将文本转换为128维向量表示，主要应用于文本聚类和语义搜索。支持通过sentence-transformers和HuggingFace两种方式调用，提供完整的模型评估数据。

vietnamese-sbert - 基于SBERT的越南语句子相似度与语义分析模型

语义相似度Githubsentence-transformers向量嵌入开源项目越南语自然语言处理Huggingface模型

基于sentence-transformers框架开发的越南语NLP模型，通过RoBERTa架构将文本映射至768维向量空间。支持句子相似度计算、语义搜索及文本聚类功能，可通过sentence-transformers和HuggingFace进行快速部署。该模型经过专门优化，为越南语自然语言处理任务提供精确的语义表示。

ko-sbert-nli - 基于SBERT架构的韩语语义相似度模型实现文本向量化

文本嵌入Githubsentence-transformers开源项目自然语言处理语义搜索Huggingface韩语模型模型

该模型基于sentence-transformers框架，将韩语文本转化为768维向量。经KorNLI数据集训练，在KorSTS评估中获83.16%相关性。适用于句子编码、语义搜索和文本聚类，支持Python接口和pip安装。

all-MiniLM-L6-v1 - 基于MiniLM的神经网络句子编码模型

语义相似度语义搜索开源项目自然语言处理模型Huggingface句向量sentence-transformersGithub

all-MiniLM-L6-v1是基于transformer架构的句子编码模型，能将文本转换为384维向量表示。该模型在10亿规模的句子数据集上采用对比学习方法训练，适用于文本聚类和语义检索等自然语言处理任务。模型同时支持sentence-transformers和Hugging Face两个主流框架，便于开发者快速集成和部署。

paraphrase-distilroberta-base-v2 - DistilRoBERTa句子向量模型用于文本相似度和语义分析

语义搜索向量嵌入开源项目自然语言处理模型深度学习Huggingfacesentence-transformersGithub

paraphrase-distilroberta-base-v2是一个轻量级句子转换模型，将文本映射至768维向量空间。该模型适用于句子相似度计算和文本聚类，支持sentence-transformers和HuggingFace Transformers库集成。模型采用平均池化处理词嵌入，提供完整架构和评估基准，在保持性能的同时优化了模型大小。

sentence-bert-base-italian-xxl-uncased - 提升语义分析与聚类效果的意大利语句子相似度模型

句子嵌入模型训练开源项目自然语言处理句子相似性模型Huggingfacesentence-transformersGithub

这个意大利语句子相似度模型能将文本映射到768维度的密集向量空间，适用于语义搜索和语句聚类。其基于dbmdz/bert-base-italian-xxl-uncased构建，为文本理解与分析提供支持。在sentence-transformers库的支持下，模型的安装与使用变得极为简便，即使不使用该库，也可通过HuggingFace Transformers实现。其性能在Sentence Embeddings Benchmark中经过自动化评估，可供参考。

mmlw-roberta-large - 增强自然语言处理适用性的多任务学习模型

文本分类开源项目聚类模型Huggingface特征提取sentence-transformers句子相似度Github

该开源项目mmlw-roberta-large通过多任务学习提高了自然语言处理性能，尤其在句子相似性、分类和检索等任务上表现突出。模型适用于多种数据集，如MTEB AllegroReviews和MTEB ArguAna-PL，实现了较高的准确率和F1值。使用了sentence-transformers和transformers技术，确保在大规模数据集上的优异表现。

e5-small - 高效轻量的句子相似度计算模型

数据集开源项目sentence-transformersGithubMTEB机器学习性能评估Huggingface模型

e5-small是一个轻量级神经网络模型，专注于句子相似度计算。该模型在文本分类、检索和聚类等多项基准测试中表现优异。支持多语言处理，适用于需要高效文本嵌入的场景。其轻量设计在保持性能的同时减少计算资源消耗，适合各类文本相似度应用。

mmlw-e5-small - 波兰语文本嵌入模型用于自然语言处理任务

模型评估Huggingfacesentence-transformers模型Github开源项目性能指标自然语言处理机器学习

mmlw-e5-small是一个针对波兰语优化的文本嵌入模型。它在MTEB基准测试的多个任务中表现优异，包括聚类、分类和检索。模型支持多种评估指标，如准确率、F1分数、MAP和NDCG。该工具主要用于句子相似度、特征提取和检索等自然语言处理任务。

stsb-distilroberta-base-v2 - 基于DistilRoBERTa的文本向量化与语义搜索模型

语义相似度向量嵌入自然语言处理sentence-transformersHuggingfaceGithub开源项目模型特征提取

基于DistilRoBERTa架构的预训练语言模型，将文本转换为768维向量表示。模型整合sentence-transformers框架，支持句子相似度计算、文本聚类和语义搜索功能。通过平均池化策略优化文本嵌入处理，在保证性能的同时降低资源消耗，适用于大规模文本向量化场景。

gte-micro-v3 - 轻量级语义嵌入模型用于高效文本相似度计算

sentence-transformersGithub模型开源项目Huggingface文本嵌入gte-micro-v3语义相似度自然语言处理

gte-micro-v3是一个轻量级语义嵌入模型，由gte-tiny蒸馏而来。该模型主要用于语义自动补全，可生成句子嵌入向量，实现文本相似度计算。基于sentence-transformers框架开发，支持最多512个token的英文输入。在MTEB评测中表现优异，适用于要求高效文本语义理解的应用。

snowflake-arctic-embed-m-v1.5 - 基于Transformers的句子相似度检索模型

Huggingface检索任务特征提取开源项目模型Githubsentence-transformers句子相似度模型评估

snowflake-arctic-embed-m-v1.5是基于Transformers.js开发的句子相似度模型,主要应用于文本检索和特征提取。该模型采用sentence-transformers架构,在MTEB ArguAna等基准测试中主要评估指标达到59.53,能够提供准确的文本匹配和检索功能。

cloudy-large-zh - 支持多任务评估的高级句子相似性和特征提取模型

Huggingface排序重排开源项目模型Github数据集sentence-transformers句子相似性检索

cloudy-large-zh项目专注于句子相似性和特征提取，利用MTEB数据集进行广泛的任务评估。在中医问答、电子商务和视频检索等领域表现优异，特别是在MTEB CMedQAv2重新排序任务中获得89.47的MRR分数。采用先进算法提高检索性能，确保各领域内容的准确排序和高效检索。

BioBERT-mnli-snli-scinli-scitail-mednli-stsb - 基于BioBERT的多领域句子嵌入模型

BioBERTsentence-transformers语义相似度模型Github开源项目嵌入向量自然语言处理Huggingface

该项目是一个基于BioBERT的句子嵌入模型，通过多个领域数据集训练而成。模型能将文本映射至768维向量空间，适用于聚类和语义搜索等任务。它不仅在生物医学领域表现出色，还可应用于其他文本分析场景。模型支持sentence-transformers和HuggingFace Transformers两种调用方式，为用户提供了便捷的使用体验。

jina-embeddings-v2-base-de - 德英双语文本嵌入模型，优化跨语言相似度计算和检索

文本分类Githubsentence-transformers开源项目数据分析MTEBHuggingface模型评估模型

jina-embeddings-v2-base-de是一款针对德语和英语的双语文本嵌入模型。该模型在MTEB基准测试中表现出色，尤其在文本分类、检索和聚类任务中效果显著。模型不仅能处理德语文本，还支持德英跨语言相似度计算，适用于多语言文本检索和相似度匹配等场景。

bge-en-icl - 先进的多语言自然语言处理模型

分类检索Huggingfacesentence-transformersGithub开源项目模型特征提取句子相似度

bge-en-icl是一个开源的句子嵌入模型，在MTEB基准测试的多项自然语言处理任务中表现出色。该模型支持多语言处理，适用于句子相似度计算、文本分类和信息检索等应用场景。在AmazonPolarity分类任务中，bge-en-icl达到了96.98%的准确率；在FEVER检索任务中，准确率达到92.83%。此外，该模型在其他任务如ArguAna检索和Banking77分类中也取得了优异成绩。bge-en-icl为研究人员和开发者提供了一个强大的工具，用于处理和分析各种文本数据。

zpoint_large_embedding_zh - 基于BERT架构的中文语义表示模型

中文嵌入Huggingface开源项目模型Githubsentence-transformers模型评估MTEB自然语言处理

zpoint_large_embedding_zh是一个中文语义嵌入模型，支持文本相似度、分类、聚类、重排序和检索等多项自然语言处理任务。该模型在AFQMC、ATEC、BQ等标准数据集上进行了评测，可应用于多种中文NLP场景。

snowflake-arctic-embed-m-long - 探索句子相似性与特征提取的新前沿

Huggingface特征提取开源项目模型Githubsentence-transformers数据集句子相似性分类

Snowflake-arctic-m-long模型基于transformers.js框架，提升了句子相似性和特征提取能力。支持的任务包括分类、检索与聚类，尤其在MTEB数据集上的表现优异。在Amazon分类任务中，其准确率超过78%，在ArguAna和CQADupstack检索任务中，检索性能高达50%以上。通过优化多项评测指标，如准确率、F1得分和检索率，这一模型为文本处理与分析提供了坚实的支持。

bert-large-nli-mean-tokens - 句子相似性嵌入与聚类应用

BERTHuggingface开源项目模型预训练模型句子嵌入Githubsentence-transformers句子相似性

该模型为sentence-transformers的一部分，能够将句子和段落转化为1024维的密集向量空间，用于聚类和语义搜索。虽然该模型已被标记为弃用且句子嵌入质量较低，推荐选择其他更优质的模型。适用的工具可以通过pip安装，并提供Python实现的代码示例。尽管如此，该模型仍作为一种句子嵌入学习方法的参考，对自然语言处理技术爱好者具有借鉴意义。

sentence-bert-swedish-cased - 瑞典句子变换模型，多语言句子嵌入优化

Githubsentence-transformers开源项目特征提取语义相似性Huggingface知识蒸馏多语言模型模型

该项目利用知识蒸馏技术，使单语言瑞典语与英语句子嵌入具备多语言能力，适用于聚类、语义搜索等任务。最新的v2.0版本在更强教师模型指导下训练，支持处理更长段落，并在SweParaphrase和SweFAQ等测试集中表现出色。

all-MiniLM-L6-v2-similarity-es - 西班牙语句子相似性与聚类分析的高效模型

Github嵌入模型sentence-transformers开源项目模型RobertaHuggingface句子相似性相似句子数据集

该微调模型专注于西班牙语句子相似性任务，使用sentence-transformers框架，将语句转换为768维向量，支持语义搜索和聚类。便捷安装：通过pip获取sentence-transformers或使用HuggingFace Transformers进行高级处理。训练于西班牙语相似句子数据集，取得了80.1%的斯皮尔曼相关性。

paraphrase-albert-base-v2 - 基于ALBERT的句子嵌入模型用于文本聚类和语义搜索

语义搜索开源项目文本嵌入自然语言处理模型向量计算Huggingfacesentence-transformersGithub

这是一个基于ALBERT架构的句子嵌入模型，可将文本映射至768维向量空间。该模型支持sentence-transformers和HuggingFace Transformers两种集成方式，适用于文本聚类、语义搜索等任务。通过平均池化处理，模型能高效生成文本向量表示，尤其适合需要计算句子相似度的应用场景。

nq-distilbert-base-v1 - 句子向量化提升语义搜索与聚类效率

Transformer句子嵌入开源项目模型评估模型Huggingfacesentence-transformers句子相似度Github

nq-distilbert-base-v1模型以sentence-transformers为基础，将句子和段落转换为768维向量，以支持聚类和语义搜索任务。通过安装sentence-transformers库可轻松使用，具备丰富的使用选项，包括通过HuggingFace Transformers实现上下文嵌入和均值池化等应用，广泛适用于文本相似性评估、内容聚类和语义检索等自然语言处理任务，提供可靠性能与灵活应用场景。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com