#sentence-transformers
German_Semantic_STS_V2 - 德语语义相似度计算模型 实现文本搜索与聚类
GithubBERT自然语言处理Huggingface德语模型开源项目模型语义相似度sentence-transformers
这是一个专注于德语文本处理的语义模型,能够准确计算文本间的语义相似度。模型在德语基准测试中表现出色,相似度评分达到0.86,优于现有主流方案。主要应用于智能文本搜索、文档聚类等场景,并提供简单的集成方式。
msmarco-MiniLM-L-6-v3 - 基于BERT的句子编码模型实现文本语义向量化和相似度计算
嵌入模型Github深度学习模型语义向量自然语言处理sentence-transformersHuggingface开源项目
msmarco-MiniLM-L-6-v3是一个基于sentence-transformers的句子编码模型,将文本映射至384维向量空间。模型基于BERT架构,支持文本相似度计算和聚类分析,可通过sentence-transformers或HuggingFace Transformers框架调用。
all-MiniLM-L12-v1 - 基于MiniLM的句子向量化与语义搜索模型
机器学习句子向量Github自然语言处理语义搜索Huggingface开源项目模型sentence-transformers
all-MiniLM-L12-v1是一个开源的句子向量化模型,基于MiniLM架构开发。该模型通过10亿对句子数据训练而成,可将文本转化为384维向量表示,广泛应用于文本聚类、语义检索等场景。模型支持多种调用方式,兼容sentence-transformers和HuggingFace框架,为开发者提供便捷的文本向量化解决方案。
gte-tiny - 轻量级句向量模型实现文本相似度检索和语义匹配
Githubsentence-transformers句子相似度特征提取开源项目自然语言处理Huggingface机器学习模型
gte-tiny是一个轻量级句向量模型,用于文本相似度计算和语义匹配。模型在MTEB基准测试的文本分类、检索和聚类任务中取得良好效果,适用于各类文本处理应用场景。
msmarco-distilbert-base-dot-prod-v3 - 基于DistilBERT的向量化文本映射与相似度计算模型
Githubsentence-transformers句子相似度向量嵌入开源项目自然语言处理语义搜索Huggingface模型
msmarco-distilbert-base-dot-prod-v3是一个开源的sentence-transformer模型,通过将文本映射为768维向量实现语义表示。模型采用点积方法计算文本相似度,支持语义搜索和文本聚类功能。集成sentence-transformers框架,可快速部署并应用于实际场景。该模型在句子嵌入基准测试中表现出色,适用于多种自然语言处理任务。
stsb-bert-tiny-onnx - 基于BERT的轻量级文本向量化模型
语义相似度文本嵌入Githubsentence-transformers开源项目自然语言处理Huggingface模型训练模型
这是一个轻量级的文本向量化模型,基于sentence-transformers框架开发。模型可将文本转换为128维向量表示,主要应用于文本聚类和语义搜索。支持通过sentence-transformers和HuggingFace两种方式调用,提供完整的模型评估数据。
vietnamese-sbert - 基于SBERT的越南语句子相似度与语义分析模型
语义相似度Githubsentence-transformers向量嵌入开源项目越南语自然语言处理Huggingface模型
基于sentence-transformers框架开发的越南语NLP模型,通过RoBERTa架构将文本映射至768维向量空间。支持句子相似度计算、语义搜索及文本聚类功能,可通过sentence-transformers和HuggingFace进行快速部署。该模型经过专门优化,为越南语自然语言处理任务提供精确的语义表示。
ko-sbert-nli - 基于SBERT架构的韩语语义相似度模型实现文本向量化
文本嵌入Githubsentence-transformers开源项目自然语言处理语义搜索Huggingface韩语模型模型
该模型基于sentence-transformers框架,将韩语文本转化为768维向量。经KorNLI数据集训练,在KorSTS评估中获83.16%相关性。适用于句子编码、语义搜索和文本聚类,支持Python接口和pip安装。
all-MiniLM-L6-v1 - 基于MiniLM的神经网络句子编码模型
语义相似度语义搜索开源项目自然语言处理模型Huggingface句向量sentence-transformersGithub
all-MiniLM-L6-v1是基于transformer架构的句子编码模型,能将文本转换为384维向量表示。该模型在10亿规模的句子数据集上采用对比学习方法训练,适用于文本聚类和语义检索等自然语言处理任务。模型同时支持sentence-transformers和Hugging Face两个主流框架,便于开发者快速集成和部署。
paraphrase-distilroberta-base-v2 - DistilRoBERTa句子向量模型用于文本相似度和语义分析
语义搜索向量嵌入开源项目自然语言处理模型深度学习Huggingfacesentence-transformersGithub
paraphrase-distilroberta-base-v2是一个轻量级句子转换模型,将文本映射至768维向量空间。该模型适用于句子相似度计算和文本聚类,支持sentence-transformers和HuggingFace Transformers库集成。模型采用平均池化处理词嵌入,提供完整架构和评估基准,在保持性能的同时优化了模型大小。
sentence-bert-base-italian-xxl-uncased - 提升语义分析与聚类效果的意大利语句子相似度模型
句子嵌入模型训练开源项目自然语言处理句子相似性模型Huggingfacesentence-transformersGithub
这个意大利语句子相似度模型能将文本映射到768维度的密集向量空间,适用于语义搜索和语句聚类。其基于dbmdz/bert-base-italian-xxl-uncased构建,为文本理解与分析提供支持。在sentence-transformers库的支持下,模型的安装与使用变得极为简便,即使不使用该库,也可通过HuggingFace Transformers实现。其性能在Sentence Embeddings Benchmark中经过自动化评估,可供参考。
mmlw-roberta-large - 增强自然语言处理适用性的多任务学习模型
文本分类开源项目聚类模型Huggingface特征提取sentence-transformers句子相似度Github
该开源项目mmlw-roberta-large通过多任务学习提高了自然语言处理性能,尤其在句子相似性、分类和检索等任务上表现突出。模型适用于多种数据集,如MTEB AllegroReviews和MTEB ArguAna-PL,实现了较高的准确率和F1值。使用了sentence-transformers和transformers技术,确保在大规模数据集上的优异表现。
e5-small - 高效轻量的句子相似度计算模型
数据集开源项目sentence-transformersGithubMTEB机器学习性能评估Huggingface模型
e5-small是一个轻量级神经网络模型,专注于句子相似度计算。该模型在文本分类、检索和聚类等多项基准测试中表现优异。支持多语言处理,适用于需要高效文本嵌入的场景。其轻量设计在保持性能的同时减少计算资源消耗,适合各类文本相似度应用。
mmlw-e5-small - 波兰语文本嵌入模型用于自然语言处理任务
模型评估Huggingfacesentence-transformers模型Github开源项目性能指标自然语言处理机器学习
mmlw-e5-small是一个针对波兰语优化的文本嵌入模型。它在MTEB基准测试的多个任务中表现优异,包括聚类、分类和检索。模型支持多种评估指标,如准确率、F1分数、MAP和NDCG。该工具主要用于句子相似度、特征提取和检索等自然语言处理任务。
stsb-distilroberta-base-v2 - 基于DistilRoBERTa的文本向量化与语义搜索模型
语义相似度向量嵌入自然语言处理sentence-transformersHuggingfaceGithub开源项目模型特征提取
基于DistilRoBERTa架构的预训练语言模型,将文本转换为768维向量表示。模型整合sentence-transformers框架,支持句子相似度计算、文本聚类和语义搜索功能。通过平均池化策略优化文本嵌入处理,在保证性能的同时降低资源消耗,适用于大规模文本向量化场景。
gte-micro-v3 - 轻量级语义嵌入模型用于高效文本相似度计算
sentence-transformersGithub模型开源项目Huggingface文本嵌入gte-micro-v3语义相似度自然语言处理
gte-micro-v3是一个轻量级语义嵌入模型,由gte-tiny蒸馏而来。该模型主要用于语义自动补全,可生成句子嵌入向量,实现文本相似度计算。基于sentence-transformers框架开发,支持最多512个token的英文输入。在MTEB评测中表现优异,适用于要求高效文本语义理解的应用。
snowflake-arctic-embed-m-v1.5 - 基于Transformers的句子相似度检索模型
Huggingface检索任务特征提取开源项目模型Githubsentence-transformers句子相似度模型评估
snowflake-arctic-embed-m-v1.5是基于Transformers.js开发的句子相似度模型,主要应用于文本检索和特征提取。该模型采用sentence-transformers架构,在MTEB ArguAna等基准测试中主要评估指标达到59.53,能够提供准确的文本匹配和检索功能。
cloudy-large-zh - 支持多任务评估的高级句子相似性和特征提取模型
Huggingface排序重排开源项目模型Github数据集sentence-transformers句子相似性检索
cloudy-large-zh项目专注于句子相似性和特征提取,利用MTEB数据集进行广泛的任务评估。在中医问答、电子商务和视频检索等领域表现优异,特别是在MTEB CMedQAv2重新排序任务中获得89.47的MRR分数。采用先进算法提高检索性能,确保各领域内容的准确排序和高效检索。
BioBERT-mnli-snli-scinli-scitail-mednli-stsb - 基于BioBERT的多领域句子嵌入模型
BioBERTsentence-transformers语义相似度模型Github开源项目嵌入向量自然语言处理Huggingface
该项目是一个基于BioBERT的句子嵌入模型,通过多个领域数据集训练而成。模型能将文本映射至768维向量空间,适用于聚类和语义搜索等任务。它不仅在生物医学领域表现出色,还可应用于其他文本分析场景。模型支持sentence-transformers和HuggingFace Transformers两种调用方式,为用户提供了便捷的使用体验。
jina-embeddings-v2-base-de - 德英双语文本嵌入模型,优化跨语言相似度计算和检索
文本分类Githubsentence-transformers开源项目数据分析MTEBHuggingface模型评估模型
jina-embeddings-v2-base-de是一款针对德语和英语的双语文本嵌入模型。该模型在MTEB基准测试中表现出色,尤其在文本分类、检索和聚类任务中效果显著。模型不仅能处理德语文本,还支持德英跨语言相似度计算,适用于多语言文本检索和相似度匹配等场景。
bge-en-icl - 先进的多语言自然语言处理模型
分类检索Huggingfacesentence-transformersGithub开源项目模型特征提取句子相似度
bge-en-icl是一个开源的句子嵌入模型,在MTEB基准测试的多项自然语言处理任务中表现出色。该模型支持多语言处理,适用于句子相似度计算、文本分类和信息检索等应用场景。在AmazonPolarity分类任务中,bge-en-icl达到了96.98%的准确率;在FEVER检索任务中,准确率达到92.83%。此外,该模型在其他任务如ArguAna检索和Banking77分类中也取得了优异成绩。bge-en-icl为研究人员和开发者提供了一个强大的工具,用于处理和分析各种文本数据。
zpoint_large_embedding_zh - 基于BERT架构的中文语义表示模型
中文嵌入Huggingface开源项目模型Githubsentence-transformers模型评估MTEB自然语言处理
zpoint_large_embedding_zh是一个中文语义嵌入模型,支持文本相似度、分类、聚类、重排序和检索等多项自然语言处理任务。该模型在AFQMC、ATEC、BQ等标准数据集上进行了评测,可应用于多种中文NLP场景。
snowflake-arctic-embed-m-long - 探索句子相似性与特征提取的新前沿
Huggingface特征提取开源项目模型Githubsentence-transformers数据集句子相似性分类
Snowflake-arctic-m-long模型基于transformers.js框架,提升了句子相似性和特征提取能力。支持的任务包括分类、检索与聚类,尤其在MTEB数据集上的表现优异。在Amazon分类任务中,其准确率超过78%,在ArguAna和CQADupstack检索任务中,检索性能高达50%以上。通过优化多项评测指标,如准确率、F1得分和检索率,这一模型为文本处理与分析提供了坚实的支持。
bert-large-nli-mean-tokens - 句子相似性嵌入与聚类应用
BERTHuggingface开源项目模型预训练模型句子嵌入Githubsentence-transformers句子相似性
该模型为sentence-transformers的一部分,能够将句子和段落转化为1024维的密集向量空间,用于聚类和语义搜索。虽然该模型已被标记为弃用且句子嵌入质量较低,推荐选择其他更优质的模型。适用的工具可以通过pip安装,并提供Python实现的代码示例。尽管如此,该模型仍作为一种句子嵌入学习方法的参考,对自然语言处理技术爱好者具有借鉴意义。
sentence-bert-swedish-cased - 瑞典句子变换模型,多语言句子嵌入优化
Githubsentence-transformers开源项目特征提取语义相似性Huggingface知识蒸馏多语言模型模型
该项目利用知识蒸馏技术,使单语言瑞典语与英语句子嵌入具备多语言能力,适用于聚类、语义搜索等任务。最新的v2.0版本在更强教师模型指导下训练,支持处理更长段落,并在SweParaphrase和SweFAQ等测试集中表现出色。
all-MiniLM-L6-v2-similarity-es - 西班牙语句子相似性与聚类分析的高效模型
Github嵌入模型sentence-transformers开源项目模型RobertaHuggingface句子相似性相似句子数据集
该微调模型专注于西班牙语句子相似性任务,使用sentence-transformers框架,将语句转换为768维向量,支持语义搜索和聚类。便捷安装:通过pip获取sentence-transformers或使用HuggingFace Transformers进行高级处理。训练于西班牙语相似句子数据集,取得了80.1%的斯皮尔曼相关性。
paraphrase-albert-base-v2 - 基于ALBERT的句子嵌入模型用于文本聚类和语义搜索
语义搜索开源项目文本嵌入自然语言处理模型向量计算Huggingfacesentence-transformersGithub
这是一个基于ALBERT架构的句子嵌入模型,可将文本映射至768维向量空间。该模型支持sentence-transformers和HuggingFace Transformers两种集成方式,适用于文本聚类、语义搜索等任务。通过平均池化处理,模型能高效生成文本向量表示,尤其适合需要计算句子相似度的应用场景。
nq-distilbert-base-v1 - 句子向量化提升语义搜索与聚类效率
Transformer句子嵌入开源项目模型评估模型Huggingfacesentence-transformers句子相似度Github
nq-distilbert-base-v1模型以sentence-transformers为基础,将句子和段落转换为768维向量,以支持聚类和语义搜索任务。通过安装sentence-transformers库可轻松使用,具备丰富的使用选项,包括通过HuggingFace Transformers实现上下文嵌入和均值池化等应用,广泛适用于文本相似性评估、内容聚类和语义检索等自然语言处理任务,提供可靠性能与灵活应用场景。