#关键短语提取
KeyphraseVectorizers - 基于词性标注的文本关键短语提取库
KeyphraseVectorizers文本向量化关键短语提取文档矩阵自然语言处理Github开源项目
KeyphraseVectorizers是一个Python库,用于从文本文档中提取关键短语。该工具基于词性标注模式提取语法准确的关键短语,无需指定n-gram范围。它可生成文档-关键短语矩阵,支持多语言,并允许自定义词性模式。KeyphraseVectorizers可与BERT和主题建模等技术结合,是一个实用的自然语言处理工具。
KBIR - 关键词边界填充模型,支持多样化自然语言处理任务
领域适应GithubKBIR文本表示开源项目关键短语提取自然语言处理Huggingface模型
KBIR模型采用新预训练方法进行关键词边界填充,提升关键任务表现。基于RoBERTa架构,使其广泛适用于命名实体识别、问答等自然语言处理任务,可利用预训练嵌入在多种AutoModel环境中灵活应用。