#GLiNER

GLiNER: 一种通用轻量级的命名实体识别模型

3 个月前

GLiNER 命名实体识别自然语言处理机器学习 BERT Github 开源项目

3 个月前

相关项目

GLiNER

GLiNER是一个通用轻量级的命名实体识别模型,采用双向转换器编码器架构。它能识别任意类型的实体,填补了传统NER模型和大型语言模型之间的空白。GLiNER具有灵活性高、体积小、效率高的特点,适用于资源受限的场景。该模型支持自定义实体类型,可应用于信息提取、文本分类等多种自然语言处理任务。

NuNER_Zero

NuNER Zero是一种基于GLiNER架构的零样本命名实体识别模型，通过NuNER v2.0数据集训练。作为token分类器，它可识别任意长度的实体。在GLiNER基准测试中，NuNER Zero的token级F1分数较GLiNER-large-v2.1提升3.1%，成为当前性能领先的紧凑型零样本NER模型。该模型采用实体类型与文本拼接的输入方式，并具有便捷的安装与使用流程。

gliner_multi

GLiNER-multi是一个基于双向Transformer架构的开源多语言命名实体识别模型。它能够灵活识别各种实体类型，填补了传统NER模型与大型语言模型之间的空白。该模型在Pile-NER数据集上训练，支持多语言处理，易于集成到不同的自然语言处理应用中。GLiNER-multi在保证性能的同时优化了模型规模，适用于计算资源有限的场景。

GLiNER_ITA_LARGE

GLiNER_ITA_LARGE是一个基于GLiNER框架的意大利语命名实体识别模型。该模型采用双向Transformer技术，支持自定义标签，适用于多种自然语言处理任务。通过简单安装GLiNER库，研究人员和开发者可以轻松应用此模型进行意大利语文本分析。可用于新闻文本、社交媒体内容等意大利语语料的实体识别分析。

gliner_multi-v2.1

GLiNER是一种基于双向Transformer编码器的多语言命名实体识别模型，能够识别任意类型的实体。与传统NER模型和大型语言模型相比，GLiNER在保持性能的同时提高了资源效率。该模型提供多个版本，参数量介于166M至459M之间，支持英语和多语言处理，并采用Apache-2.0开源许可。GLiNER为资源受限的应用场景提供了一个实用的NER解决方案。

gliner_multi_pii-v1

GLiNER是一个基于BERT的命名实体识别模型，专门用于识别个人身份信息(PII)。该模型支持60多种PII实体类型，包括姓名、组织、电话、地址和护照号码等，并可在多语言环境中使用。与传统NER模型和大型语言模型相比，GLiNER在保持灵活性的同时大幅降低了资源消耗，特别适合在资源受限的场景中进行PII检测。

gliner_medium-v2.1

GLiNER是一种基于双向Transformer编码器的命名实体识别模型，可识别任意类型的实体。该模型为资源受限场景提供了实用的替代方案，克服了传统NER模型仅限预定义实体的局限性，同时避免了大型语言模型的高成本问题。GLiNER支持多语言，提供不同规模的版本，安装使用简便。在NER基准测试中表现优异，适用于多种应用场景。

gliner_large-v1

GLiNER是通过双向转换器编码器实现的命名实体识别模型，可识别多种实体类型。它是传统NER模型和大型语言模型这两者的高效替代，特别适合资源有限的场合。GLiNER在Pile-NER数据集上经过训练，具备灵活性且不受实体类型限制。用户可通过安装并导入GLiNER库轻松进行实体识别。

universal_ner_ita

该模型适用于意大利语命名实体识别，通过零样本学习实现对多种实体的识别，无需特定训练。可联系Michele Montebovi进行定制以提升性能。模型支持CPU运行并可通过浏览器直接体验。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com