项目介绍:amd-partial-phonetree-v1
项目背景
amd-partial-phonetree-v1是基于SetFit框架的文本分类模型,主要用于电话语音的分类任务。它结合了高效的少样本学习技术和强大的句子嵌入模型(sentence-transformers/paraphrase-mpnet-base-v2)实现对文本的准确分类。该模型特别适用于需要将语音消息和电话菜单分类的场景。
模型细节
模型描述
- 模型类型: SetFit
- 句子嵌入模型: paraphrase-mpnet-base-v2
- 分类头: LogisticRegression实例
- 最大序列长度: 512个标记
- 分类类别: 2个类别(语音信箱和电话菜单)
模型来源
模型标签
标签 | 示例 |
---|
语音信箱 | '您的电话已被转接至自动语音信箱'、'劳拉·伯顿——不在。请在提示音后留言'、'抱歉,当前无人接听。' |
电话菜单 | '感谢您的来电'、'拨打400热线。拨打400热线,只需说您要拨打的号码'、'感谢拨打NatWest集团热线' |
使用方法
直接推理
首先,安装SetFit库:
pip install setfit
然后,可以加载模型并运行推理:
from setfit import SetFitModel
# 从🤗 Hub下载模型
model = SetFitModel.from_pretrained("nikcheerla/amd-partial-phonetree-v1")
# 运行推理
preds = model("Thank you for calling CHS. If you are a CHS owner,")
训练细节
训练数据指标
训练超参数
- 批量大小: (64, 64)
- 训练轮数: (3, 3)
- 最大步骤: -1
- 采样策略: 过采样
- 迭代次数: 20
- 主体学习率: (2e-05, 1e-05)
- 头部学习率: 0.01
- 损失: CosineSimilarityLoss
- 距离度量: cosine_distance
- 边距: 0.25
- 端到端: False
- 使用AMP: True
- 暖启动比例: 0.1
- 随机种子: 42
- 评估最大步骤: -1
- 最后加载最优模型: True
训练结果
轮数 | 步骤 | 训练损失 | 验证损失 |
---|
0.0002 | 1 | 0.2457 | - |
1.0 | 6560 | 0.0057 | 0.1113 |
2.0 | 13120 | 0.0198 | 0.1127 |
3.0 | 19680 | 0.0193 | 0.117 |
框架版本
- Python: 3.10.12
- SetFit: 1.0.1
- Sentence Transformers: 2.2.2
- Transformers: 4.35.2
- PyTorch: 2.0.1+cu118
- Datasets: 2.16.1
- Tokenizers: 0.15.0
引用
BibTeX
@article{https://doi.org/10.48550/arxiv.2209.11055,
doi = {10.48550/ARXIV.2209.11055},
url = {https://arxiv.org/abs/2209.11055},
author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {Efficient Few-Shot Learning Without Prompts},
publisher = {arXiv},
year = {2022},
copyright = {Creative Commons Attribution 4.0 International}
}