#语义文本相似度
NV-Embed-v2 - 多语言嵌入模型提升各类自然语言处理任务性能
检索模型聚类语义文本相似度Github分类MTEBHuggingface开源项目
NV-Embed-v2是一款多语言嵌入模型,针对多种自然语言处理任务进行了优化。该模型在文本分类、检索、聚类和语义相似度等基准测试中展现出优异表现,体现了其在跨语言和跨领域应用中的实力。通过深度学习技术,NV-Embed-v2能够生成高质量的文本表示,为各类NLP应用奠定了良好基础。
e5-base-sts-en-de - 基于E5微调的德语文本语义相似度模型
e5-base语义文本相似度开源项目模型Huggingface多语言模型微调数据集Github
这是一个基于多语言E5基础模型开发的德语语义相似度模型。模型通过德语释义语料库、PAWS-X和STSB多语言数据集进行训练,结合多负例排序和余弦相似度两种损失函数。模型在STSB测试集达到0.904的相关性分数,能够有效完成德语文本相似度计算任务。