#语义相似度

gte-micro-v3 - 轻量级语义嵌入模型用于高效文本相似度计算

sentence-transformersGithub模型开源项目Huggingface文本嵌入gte-micro-v3语义相似度自然语言处理

gte-micro-v3是一个轻量级语义嵌入模型，由gte-tiny蒸馏而来。该模型主要用于语义自动补全，可生成句子嵌入向量，实现文本相似度计算。基于sentence-transformers框架开发，支持最多512个token的英文输入。在MTEB评测中表现优异，适用于要求高效文本语义理解的应用。

BioBERT-mnli-snli-scinli-scitail-mednli-stsb - 基于BioBERT的多领域句子嵌入模型

BioBERTsentence-transformers语义相似度模型Github开源项目嵌入向量自然语言处理Huggingface

该项目是一个基于BioBERT的句子嵌入模型，通过多个领域数据集训练而成。模型能将文本映射至768维向量空间，适用于聚类和语义搜索等任务。它不仅在生物医学领域表现出色，还可应用于其他文本分析场景。模型支持sentence-transformers和HuggingFace Transformers两种调用方式，为用户提供了便捷的使用体验。

LLM2Vec-Meta-Llama-3-8B-Instruct-mntp - 基于大语言模型的文本编码器实现语义检索与文本嵌入

语义相似度机器学习Huggingface开源项目LLM2Vec模型Github语言模型文本编码

LLM2Vec项目将解码器型大语言模型转换为文本编码器。项目采用双向注意力机制、掩码token预测和无监督对比学习方法，用于文本嵌入和语义相似度计算。通过Python接口实现文本理解和检索功能，支持自定义指令查询，可进行模型微调以提升性能。

Conan-embedding-v1 - 中文文本处理的开源深度学习工具

检索性能语义相似度Huggingface句子转换器conan-embeddingGithub文本分类开源项目模型

Conan-embedding-v1是一个开源项目，采用sentence-transformers库，支持多种中文自然语言处理任务如STS、分类、重排序、检索和聚类。通过在AFQMC、ATEC和AmazonReviewsClassification等数据集上的测试，该项目展示了其在复杂中文语境中的有效性。其分析与性能指标对比提供了开发者和研究人员一种提升自然语言处理效率和准确性的方法。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号