UniNER-7B-all 项目介绍
UniNER-7B-all是目前表现最优秀的UniNER模型。为了训练这个模型,研究人员采用了三种不同的数据集组合:(1) 由ChatGPT生成的数据集Pile-NER-type,(2) 由ChatGPT生成的数据集Pile-NER-definition,以及(3) 在Universal NER基准测试中使用的40个监督数据集(具体请参考论文中的图4)。从每个数据集的训练部分中随机抽样最多1万个实例用于训练。值得注意的是,CrossNER和MIT数据集被排除在训练之外,这样可以用于进行OOD(开集)评估。
更详细的信息可以通过查阅我们的论文。如果你想了解如何使用这个模型,可以访问我们的代码库。
推理使用
在进行推理时,可以使用以下模板:
用户将提供文本,虚拟助手基于该文本回答问题。
用户:文本:{在这里填写输入文本}
助理:我已经阅读了这个文本。
用户:文本中哪个部分描述了{在这里填写实体类型}?
助理:{模型的预测结果以JSON格式显示}
需要注意的是,每次推理仅基于一种实体类型。如果需要针对多种实体类型进行推理,需要为每种类型分别创建实例。
许可协议
该模型及其相关数据基于CC BY-NC 4.0许可协议发布,主要用于科研目的。
引用格式
如果您在研究中使用了该模型,请引用以下参考文献:
@article{zhou2023universalner,
title={UniversalNER: Targeted Distillation from Large Language Models for Open Named Entity Recognition},
author={Wenxuan Zhou and Sheng Zhang and Yu Gu and Muhao Chen and Hoifung Poon},
year={2023},
eprint={2308.03279},
archivePrefix={arXiv},
primaryClass={cs.CL}
}