#语义相似性
bge-m3-korean - 多语言句子相似度与文本分析模型
向量空间Sentence TransformerHuggingface语义相似性特征提取开源项目多语言模型Github
该模型基于BAAI/bge-m3,通过KorSTS和KorNLI进行微调,支持多语言语义相似性分析与文本分类等任务,利用Sentence Transformer将句子和段落映射为1024维稠密向量,适用于多种文本嵌入应用。
bge-99GPT-v1 - 提升句子相似度分析和特征提取效果的创新模型
数据可视化员工数据科学学习99P Labs语义相似性Github模型开源项目自动驾驶Huggingface
SentenceTransformer模型专注于提升句子相似度分析及特征提取的精度。基于marroyo777/bge-99GPT-v1进行微调,支持多种应用如语义文本相似性、语义搜索、文本分类等。使用余弦相似度作为评估标准,该模型可将句子映射到384维的向量空间,提供高效的文本分析能力。
timely-arctic-small - 语义相似度分析模型:句子向量化工具
Snowflake/snowflake-arctic-embed-sHuggingfaceGithub文本分类相似性函数语义相似性开源项目模型数据集
基于Sentence Transformers的模型,采用Snowflake/snowflake-arctic-embed-s进行语义相似度分析。模型将句子转化为384维向量,适用于语义搜索、同义词挖掘、文本分类和聚类等领域。使用余弦相似度作为基本算法,支持最长512个token的序列,训练与评估数据集分别包含55736与1000条样本,提升精确度。更多技术细节与用法,请参考GitHub和相关文档。
sentence-bert-swedish-cased - 瑞典句子变换模型,多语言句子嵌入优化
Githubsentence-transformers开源项目特征提取语义相似性Huggingface知识蒸馏多语言模型模型
该项目利用知识蒸馏技术,使单语言瑞典语与英语句子嵌入具备多语言能力,适用于聚类、语义搜索等任务。最新的v2.0版本在更强教师模型指导下训练,支持处理更长段落,并在SweParaphrase和SweFAQ等测试集中表现出色。