项目介绍: botpress_Vaganet_new_model
背景概述
botpress_Vaganet_new_model是一个基于SetFit的文本分类模型,该项目使用的是sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2作为句子嵌入模型,并采用Logistic Regression进行分类。它具备多语言支持,能够处理不同语言的文本输入。
模型细节
模型描述
- 模型类型: SetFit
- 句子嵌入模型: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
- 分类器: Logistic Regression 实例
- 最大序列长度: 128个标记
- 类别数量: 34种类别
训练技术
该模型使用了一种高效的少样本学习技术,包括:
- 通过对比学习微调句子转换器。
- 利用微调后的特征来训练分类头。
模型来源
- GitHub项目库: SetFit on GitHub
- 相关论文: Efficient Few-Shot Learning Without Prompts
- 博客文章: SetFit: Efficient Few-Shot Learning Without Prompts
标签与用途
模型能对多种操作请求进行分类,例如请求资产的利用率报告、请求资产的转移、检查资产的功能状况、请求资产的修复等等。具体分类标签和示例如下:
- 请求资产利用报告 (例如 "如何请求投影仪的利用率报告?")
- 请求资产转移 (例如 "转移发电机的步骤是什么?")
- 检查资产安全状态 (例如 "可以检查打印机的安全状态吗?")
评估与指标
准确性
该模型在分类任务中的准确度达到了约88.97%的准确率。
使用方法
直接使用来进行推断
首先需要安装SetFit库:
pip install setfit
然后可以加载此模型并进行推断:
from setfit import SetFitModel
# 从🤗 Hub下载模型
model = SetFitModel.from_pretrained("Decius/botpress_Vaganet_new_model")
# 进行推断
preds = model("L'ordinateur portable est-il libre à l'instant?")
训练详情
训练超参数
- 批量大小: (3, 3)
- 训练轮数: (3, 3)
- 采样策略: 过采样
- 句子嵌入学习率: (2e-05, 1e-05)
- 分类头学习率: 0.01
训练结果
在训练过程中,模型在各个阶段的损失逐步减少,显示出模型良好的学习能力。
通过这些丰富的信息,我们对botpress_Vaganet_new_model有了全面的了解,模型为文本分类任务提供了高效的解决方案,能够支持多语言环境,并且通过少样本学习技术实现了良好的性能。