#Named Entity Recognition
entity-recognition-datasets - 多领域实体识别和命名实体识别任务数据集
Entity RecognitionNamed Entity RecognitionDatasetsNERAnnotationsGithub开源项目
此库包含多个领域的实体识别和命名实体识别(NER)任务数据集,包括新闻、社交媒体、医学等。项目提供数据目录和转换代码,部分数据因许可证限制无法直接共享。虽然自2020年起更新较少,但仍接受通过issue或pull request添加的数据集,并支持多种语言的NER数据,如德语、西班牙语和荷兰语等。
SpanMarkerNER - 命名实体识别的高效训练框架
SpanMarkerNamed Entity RecognitionHugging FaceBERTRoBERTaGithub开源项目
SpanMarker是一个基于Transformer库的命名实体识别框架,支持BERT、RoBERTa和ELECTRA等编码器。框架提供模型加载、保存、超参数优化、日志记录、检查点、回调、混合精度训练和8位推理等功能。用户可以方便地使用预训练模型,并通过免费API进行快速原型开发和部署。
biomedical-ner-all - 基于英语的生物医学实体识别AI模型
生物医学Named Entity Recognition开源项目AI模型Huggingfacetransformers库MaccrobatGithub
该AI模型基于Maccrobat数据集训练,可以识别107种生物医学实体,适用于案例报告等文本工作。通过distilbert-base-uncased构建,拥有低碳排放(0.0279千克)和30.17分钟的训练时间。通过Huggingface API或transformers库,可便捷应用于生物医学领域;教程视频提供详细使用说明。
thainer-corpus-v2-base-model - 泰语命名实体识别模型,支持地名、人名等信息的高精度识别
泰语WangchanBERTaNamed Entity Recognition模型训练开源项目实体识别模型模型HuggingfaceGithub
该命名实体识别模型基于Thai NER v2.0语料库训练,专为泰语文本的实体分类而设计。通过WangchanBERTa基础模型训练,提供高精度和F1分数,确保识别结果准确。需要使用自定义代码进行推理以避免错误标签,相关信息和下载链接在HuggingFace Hub提供。