#句子变换器

INVOICE-DISPUTE - SetFit模型高效应用于文本分类的少样本学习方法
对比学习开源项目文本分类SetFitGithubHuggingface模型LogisticRegression句子变换器
本项目介绍了SetFit模型在文本分类任务中的应用,利用高效的少样本学习技术,通过对Sentence Transformer进行对比学习微调,并使用微调后的特征训练Logistic Regression分类头,实现文本分类。SetFit模型支持最大512个令牌的序列长度,适用于二分类任务。通过SetFit库,用户可以便捷地安装并使用该模型进行推理,更多信息可在GitHub和相关论文中查阅。
bge-small-en - 英文文本嵌入模型在多种自然语言处理任务中展现出色性能
Huggingface模型GithubMTEB聚类检索开源项目句子变换器分类
bge-small-en是一个针对英文文本优化的嵌入模型,在MTEB基准测试中展现出优异性能。该模型在分类、检索、聚类等多种自然语言处理任务中表现出色,尤其在处理Amazon评论和ArguAna论证分析等数据集时效果显著。bge-small-en为需要高质量文本表示的应用场景提供了有力支持。
MedEmbed-small-v0.1 - 模型在医疗信息检索和分类中的应用
开源项目MedEmbed模型信息检索Huggingface医疗嵌入句子变换器Github临床嵌入
项目专注于利用组合数据集进行信息检索与分类操作,如MedicalQARetrieval、NFCorpus和PublicHealthQA等。模型的评估指标包括精确率、召回率和F1-分数,在多任务如医疗问答和亚马逊评论分类中展现了良好性能。分类和检索任务测试结果显示,该模型在精度和性能上表现优异,为医疗嵌入和临床信息检索提供了有效的解决方案。
quora-roberta-large - 利用Cross-Encoder模型判断Quora重复问题,增强问答匹配效果
开源项目预训练模型Cross-Encoder模型QuoraHuggingface相似性检测句子变换器Github
此模型使用SentenceTransformers的Cross-Encoder类别进行训练,针对Quora的重复问题数据集评分0至1。虽然不适合评估问题相似性,但在识别重复问题上表现良好。用户可通过sentence_transformers或Transformers的AutoModel类应用该模型,以提升问答系统的精准性和效率。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号