#相似性检测
quora-roberta-large - 利用Cross-Encoder模型判断Quora重复问题,增强问答匹配效果
开源项目预训练模型Cross-Encoder模型QuoraHuggingface相似性检测句子变换器Github
此模型使用SentenceTransformers的Cross-Encoder类别进行训练,针对Quora的重复问题数据集评分0至1。虽然不适合评估问题相似性,但在识别重复问题上表现良好。用户可通过sentence_transformers或Transformers的AutoModel类应用该模型,以提升问答系统的精准性和效率。
quora-distilroberta-base - 客观识别Quora问题重复性的开源模型
HuggingfaceCross-Encoder相似性检测开源项目模型Quora Duplicate QuestionsGithubQuora数据集模型训练
该模型基于SentenceTransformers的Cross-Encoder类进行训练,旨在用于检测Quora问题的重复性。通过比较成对问题,模型将输出0到1之间的分数以判断问题是否重复。需注意,该模型不适合判断问题相似度,如“如何学习Java”和“如何学习Python”将获得较低分。用户可以通过sentence_transformers或Transformers的AutoModel类使用此预训练模型。