ACCOUNT-OWNERSHIP项目介绍
概述
ACCOUNT-OWNERSHIP项目运用了名为SetFit的模型,用于文本分类任务。该模型依托于一种高效的少样本学习技术,并通过对Sentence Transformer进行对比学习的微调,以及结合训练Logistic Regression分类头,使模型能够在资源有限的情况下有效进行分类。
模型详情
模型描述
- 模型类型: SetFit
- 分类头: 使用Logistic Regression实例
- 最大序列长度: 最多支持512个标记
- 类别数量: 涉及2个类别的分类任务
模型资源
- 代码库: 该模型的代码可在SetFit的GitHub页面中找到
- 论文: 相关研究论文为Efficient Few-Shot Learning Without Prompts
- 博客文章: 可参考SetFit: Efficient Few-Shot Learning Without Prompts获取更多背景信息
使用方法
推理中的直接使用
首先,用户需要安装SetFit库:
pip install setfit
安装完成后,即可加载模型并进行推理。例如:
from setfit import SetFitModel
# 从🤗 Hub下载模型
model = SetFitModel.from_pretrained("setfit_model_id")
# 进行推理操作
preds = model("I loved the spiderman movie!")
训练细节
ACCOUNT-OWNERSHIP项目所用的平台和相关库的具体版本如下:
- Python: 版本3.11.7
- SetFit: 版本1.0.3
- Sentence Transformers: 版本2.3.1
- Transformers: 版本4.37.2
- PyTorch: 版本2.2.0
- Datasets: 版本2.16.1
- Tokenizers: 版本0.15.1
引用方式
如果需要引用相关研究,可以使用以下BibTeX格式:
@article{https://doi.org/10.48550/arxiv.2209.11055,
doi = {10.48550/ARXIV.2209.11055},
url = {https://arxiv.org/abs/2209.11055},
author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {Efficient Few-Shot Learning Without Prompts},
publisher = {arXiv},
year = {2022},
copyright = {Creative Commons Attribution 4.0 International}
}
该项目通过提供高效的文本分类解决方案,特别适用于需要少量样本进行学习的应用场景,使得文本分类任务在资源有限的情况下也能得到有效解决。