#序列标注
Pytorch-NLU - 轻量级NLP工具包 支持文本分类和序列标注
Pytorch-NLU自然语言处理文本分类序列标注预训练模型Github开源项目
Pytorch-NLU是一个轻量级自然语言处理工具包,专注于文本分类、序列标注和文本摘要任务。该工具包支持BERT、ERNIE等多种预训练模型,提供多种损失函数,具有依赖少、代码简洁、注释详细、配置灵活等特点。Pytorch-NLU包含丰富的数据集,使用方式简单,可快速应用于实际NLP项目中。
upos-english - Flair框架英语词性标注模型 实现98.6% F1分数
模型Github序列标注Flair词性标注开源项目Huggingface自然语言处理深度学习
该项目提供了基于Flair框架的英语通用词性标注模型。模型采用Flair嵌入和LSTM-CRF架构,在Ontonotes数据集上实现98.6%的F1分数。它能够预测17种通用词性,覆盖形容词、名词和动词等。模型使用简单,只需几行Python代码即可完成词性标注任务。项目同时开放了训练脚本,便于研究者进行复现和优化。
chunk-english-fast - Flair框架驱动的高效英语短语切分模型
语言模型Huggingface模型Github开源项目序列标注自然语言处理Flair分词
chunk-english-fast是一款基于Flair框架的英语短语切分模型。该模型在CoNLL-2000数据集上实现了96.22%的F1分数,能够精确识别句子中的名词短语、动词短语等10种不同结构。模型采用Flair嵌入和LSTM-CRF架构,通过简洁的Python接口即可轻松实现短语切分,为各类自然语言处理任务提供有力支持。
pos-english - 基于Flair框架的高精度英语词性标注模型
模型词性标注FlairGithub开源项目Huggingface机器学习序列标注自然语言处理
这是一个基于Flair框架的英语词性标注模型,在Ontonotes数据集上实现了98.19%的F1分数。模型采用Flair嵌入和LSTM-CRF架构,支持45种细粒度词性标签的准确预测。该模型易于集成到Flair库中,可应用于多种自然语言处理任务。
ner-german - 德语命名实体识别模型 集成Flair嵌入和LSTM-CRF技术
模型命名实体识别德语GithubFlairHuggingface开源项目序列标注自然语言处理
这是一个德语命名实体识别(NER)模型,基于Flair框架开发。模型可识别文本中的人名、地名、组织名和其他专有名词,在CoNLL-03德语修订版数据集上F1分数达87.94%。采用Flair嵌入和LSTM-CRF技术,提供高精度的德语NER功能。该模型易于使用,只需几行Python代码即可集成到NLP项目中。
hunflair2-ner - 基于Flair的生物医学实体识别开源模型
文本分析命名实体识别模型Github开源项目Flair序列标注自然语言处理Huggingface
HunFlair2-NER是一个面向生物医学领域的命名实体识别模型,基于Flair框架开发。模型可识别文本中的生物医学实体,包括基因、疾病和化合物等。基于PrefixedSequenceTagger架构,集成SciSpacy分词功能,适用于生物医学文献分析、临床报告处理等场景。支持Python环境快速部署集成。