#GLiNER

GLiNER: 一种通用轻量级的命名实体识别模型

3 个月前
Cover of GLiNER: 一种通用轻量级的命名实体识别模型
相关项目
Project Cover

GLiNER

GLiNER是一个通用轻量级的命名实体识别模型,采用双向转换器编码器架构。它能识别任意类型的实体,填补了传统NER模型和大型语言模型之间的空白。GLiNER具有灵活性高、体积小、效率高的特点,适用于资源受限的场景。该模型支持自定义实体类型,可应用于信息提取、文本分类等多种自然语言处理任务。

Project Cover

NuNER_Zero

NuNER Zero是一种基于GLiNER架构的零样本命名实体识别模型,通过NuNER v2.0数据集训练。作为token分类器,它可识别任意长度的实体。在GLiNER基准测试中,NuNER Zero的token级F1分数较GLiNER-large-v2.1提升3.1%,成为当前性能领先的紧凑型零样本NER模型。该模型采用实体类型与文本拼接的输入方式,并具有便捷的安装与使用流程。

Project Cover

gliner_multi

GLiNER-multi是一个基于双向Transformer架构的开源多语言命名实体识别模型。它能够灵活识别各种实体类型,填补了传统NER模型与大型语言模型之间的空白。该模型在Pile-NER数据集上训练,支持多语言处理,易于集成到不同的自然语言处理应用中。GLiNER-multi在保证性能的同时优化了模型规模,适用于计算资源有限的场景。

Project Cover

GLiNER_ITA_LARGE

GLiNER_ITA_LARGE是一个基于GLiNER框架的意大利语命名实体识别模型。该模型采用双向Transformer技术,支持自定义标签,适用于多种自然语言处理任务。通过简单安装GLiNER库,研究人员和开发者可以轻松应用此模型进行意大利语文本分析。可用于新闻文本、社交媒体内容等意大利语语料的实体识别分析。

Project Cover

gliner_multi-v2.1

GLiNER是一种基于双向Transformer编码器的多语言命名实体识别模型,能够识别任意类型的实体。与传统NER模型和大型语言模型相比,GLiNER在保持性能的同时提高了资源效率。该模型提供多个版本,参数量介于166M至459M之间,支持英语和多语言处理,并采用Apache-2.0开源许可。GLiNER为资源受限的应用场景提供了一个实用的NER解决方案。

Project Cover

gliner_multi_pii-v1

GLiNER是一个基于BERT的命名实体识别模型,专门用于识别个人身份信息(PII)。该模型支持60多种PII实体类型,包括姓名、组织、电话、地址和护照号码等,并可在多语言环境中使用。与传统NER模型和大型语言模型相比,GLiNER在保持灵活性的同时大幅降低了资源消耗,特别适合在资源受限的场景中进行PII检测。

Project Cover

gliner_medium-v2.1

GLiNER是一种基于双向Transformer编码器的命名实体识别模型,可识别任意类型的实体。该模型为资源受限场景提供了实用的替代方案,克服了传统NER模型仅限预定义实体的局限性,同时避免了大型语言模型的高成本问题。GLiNER支持多语言,提供不同规模的版本,安装使用简便。在NER基准测试中表现优异,适用于多种应用场景。

Project Cover

gliner_large-v1

GLiNER是通过双向转换器编码器实现的命名实体识别模型,可识别多种实体类型。它是传统NER模型和大型语言模型这两者的高效替代,特别适合资源有限的场合。GLiNER在Pile-NER数据集上经过训练,具备灵活性且不受实体类型限制。用户可通过安装并导入GLiNER库轻松进行实体识别。

Project Cover

universal_ner_ita

该模型适用于意大利语命名实体识别,通过零样本学习实现对多种实体的识别,无需特定训练。可联系Michele Montebovi进行定制以提升性能。模型支持CPU运行并可通过浏览器直接体验。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号