项目介绍:lm-ner-linkedin-skills-recognition
lm-ner-linkedin-skills-recognition 是一个专注于识别领英平台上的技能的模型。该模型是通过微调 algiraldohe/distilbert-base-uncased-linkedin-domain-adaptation 模型而创建的,虽然其训练数据集未知,但在评价集中取得了令人印象深刻的结果:损失为 0.0307,精准率为 91.19%,召回率为 93.12%,F1 分数为 92.14%,准确率达到了 99.12%。
模型描述
该模型的详细信息仍需补充。它的主要目的是在职业社交网络中识别用户技能,因此在相关领域如招聘或者职业发展中具有应用价值。
预期用途与限制
尽管该模型具有很高的精度和准确度,但其预期用途和限制仍需进一步说明。一般来说,用户可以利用这个模型来识别和分析领英用户的技能数据,从而在人才招聘或职业分析中得出更多的见解。
训练与评估数据
当前关于用于训练和评估的数据集的信息尚未披露。然而,模型的良好表现表明其使用的数据集质量较高。
训练过程
训练超参数
该模型在训练过程中使用了以下超参数:
- 学习率:2e-05
- 训练批量大小:64
- 评估批量大小:64
- 随机种子:42
- 优化器:Adam,设置 betas=(0.9,0.999)、epsilon=1e-08
- 学习率调度类型:线性
- 训练迭代次数:3
训练结果
模型在训练过程中不断提高其性能,具体结果如下:
- 第1轮:训练损失为0.1301,验证损失为0.0468,精准率87.86%,召回率87.15%,F1 评分87.50%,准确率98.63%。
- 第2轮:训练损失降至0.0432,验证损失为0.0345,精准率89.94%,召回率92.19%,F1 评分91.05%,准确率99.00%。
- 第3轮:最终训练损失为0.0332,验证损失为0.0307,精准率91.19%,召回率93.12%,F1 评分92.14%,准确率99.12%。
使用框架版本
- Transformers: 4.30.2
- Pytorch: 2.0.1+cu118
- Datasets: 2.13.1
- Tokenizers: 0.13.3
总体而言,lm-ner-linkedin-skills-recognition 是一个性能优良的技能识别模型,适合需要高精准与高效能的领英技能识别任务。它的进一步发展与用途仍有待探索以及说明。