项目简介
这是一个基于BERT的德语命名实体识别(NER)模型。该模型通过在德语wikiann数据集上对bert-base-multilingual-cased模型进行微调而得到。它能够识别德语文本中的命名实体,包括地点(Location)、组织机构(Organization)和人名(Person)等。
模型性能
该模型在评估集上取得了优秀的性能表现:
- 总体准确率达到96.06%
- 总体F1分数为0.8829
- 在各类实体识别方面:
- 地点实体(Location)的F1分数为0.9067
- 组织机构实体(Organization)的F1分数为0.8278
- 人名实体(Person)的F1分数为0.9152
训练细节
训练过程采用了以下超参数配置:
- 学习率设置为2e-05
- 训练批次大小为16
- 评估批次大小为16
- 随机种子设为42
- 优化器使用Adam,beta参数为(0.9,0.999),epsilon为1e-08
- 学习率调度采用线性衰减
- 训练轮数为7轮
训练过程
模型训练表现出良好的收敛性能:
- 训练损失从初始的0.252逐步下降到0.0181
- 验证损失维持在较低水平,最终为0.2450
- 各项评估指标随着训练轮次稳步提升
- 在训练后期,模型在识别人名和地点实体方面表现尤为出色,F1分数均超过0.90
应用示例
模型可以处理各种德语文本中的实体识别任务,例如:
- 识别人名:如"Herr Schmidt"
- 识别地名:如"Berlin"、"München"
- 识别组织机构:如"Deutsche Bahn"、"BMW"、"Siemens"等
该模型采用Apache-2.0许可证开源,任何人都可以自由使用和修改。