#序列标注
Pytorch-NLU - 轻量级NLP工具包 支持文本分类和序列标注
Pytorch-NLU自然语言处理文本分类序列标注预训练模型Github开源项目
Pytorch-NLU是一个轻量级自然语言处理工具包,专注于文本分类、序列标注和文本摘要任务。该工具包支持BERT、ERNIE等多种预训练模型,提供多种损失函数,具有依赖少、代码简洁、注释详细、配置灵活等特点。Pytorch-NLU包含丰富的数据集,使用方式简单,可快速应用于实际NLP项目中。
ner-english-large - 基于FLERT技术的英语命名实体识别开源模型
Huggingface模型深度学习命名实体识别Github开源项目序列标注自然语言处理Flair
ner-english-large是基于Flair框架的英语命名实体识别模型,采用FLERT技术和XLM-R嵌入。该模型可识别人名、地点、组织和其他实体,F1分数为94.36。它易于集成,适用于多种NLP任务,为研究人员和开发者提供了实用的英语文本分析工具。
ner-english - Flair框架英语命名实体识别模型 准确率93%
模型Github序列标注Flair开源项目Huggingface命名实体识别自然语言处理深度学习
该模型是Flair框架的标准英语命名实体识别(NER)模型,能识别人名、地名、组织名和其他名称四类实体。采用Flair嵌入和LSTM-CRF架构,在CoNLL-03数据集上F1分数达93.06%。用户可通过Flair库轻松加载使用。模型提供了详细的训练脚本和引用信息,方便研究人员进一步探索和引用。
ner-english-ontonotes - Flair框架英语命名实体识别模型支持18类实体
模型命名实体识别GithubFlair开源项目Huggingface机器学习序列标注自然语言处理
这是一个基于Flair框架的英语命名实体识别模型,能够识别18种实体类型,包括人名、地点和组织等。模型采用Flair embeddings和LSTM-CRF架构,在Ontonotes数据集上的F1分数为89.27%。该模型可应用于多种自然语言处理任务,并且可以通过简单的Python代码实现NER预测。
upos-english - Flair框架英语词性标注模型 实现98.6% F1分数
模型Github序列标注Flair词性标注开源项目Huggingface自然语言处理深度学习
该项目提供了基于Flair框架的英语通用词性标注模型。模型采用Flair嵌入和LSTM-CRF架构,在Ontonotes数据集上实现98.6%的F1分数。它能够预测17种通用词性,覆盖形容词、名词和动词等。模型使用简单,只需几行Python代码即可完成词性标注任务。项目同时开放了训练脚本,便于研究者进行复现和优化。
chunk-english-fast - Flair框架驱动的高效英语短语切分模型
语言模型Huggingface模型Github开源项目序列标注自然语言处理Flair分词
chunk-english-fast是一款基于Flair框架的英语短语切分模型。该模型在CoNLL-2000数据集上实现了96.22%的F1分数,能够精确识别句子中的名词短语、动词短语等10种不同结构。模型采用Flair嵌入和LSTM-CRF架构,通过简洁的Python接口即可轻松实现短语切分,为各类自然语言处理任务提供有力支持。
pos-english - 基于Flair框架的高精度英语词性标注模型
模型词性标注FlairGithub开源项目Huggingface机器学习序列标注自然语言处理
这是一个基于Flair框架的英语词性标注模型,在Ontonotes数据集上实现了98.19%的F1分数。模型采用Flair嵌入和LSTM-CRF架构,支持45种细粒度词性标签的准确预测。该模型易于集成到Flair库中,可应用于多种自然语言处理任务。
ner-german - 德语命名实体识别模型 集成Flair嵌入和LSTM-CRF技术
模型命名实体识别德语GithubFlairHuggingface开源项目序列标注自然语言处理
这是一个德语命名实体识别(NER)模型,基于Flair框架开发。模型可识别文本中的人名、地名、组织名和其他专有名词,在CoNLL-03德语修订版数据集上F1分数达87.94%。采用Flair嵌入和LSTM-CRF技术,提供高精度的德语NER功能。该模型易于使用,只需几行Python代码即可集成到NLP项目中。
hunflair2-ner - 基于Flair的生物医学实体识别开源模型
文本分析命名实体识别模型Github开源项目Flair序列标注自然语言处理Huggingface
HunFlair2-NER是一个面向生物医学领域的命名实体识别模型,基于Flair框架开发。模型可识别文本中的生物医学实体,包括基因、疾病和化合物等。基于PrefixedSequenceTagger架构,集成SciSpacy分词功能,适用于生物医学文献分析、临床报告处理等场景。支持Python环境快速部署集成。