#文本表示
texthero - 全面的文本数据处理和可视化工具
Github开源项目自然语言处理Texthero文本预处理文本表示文本可视化
Texthero是一个专为现代程序员设计的Python工具包,致力于快速高效地处理和可视化文本数据。其功能包括文本预处理、自然语言处理、文本表示、向量空间分析和文本可视化。Texthero与Pandas具有相同的表达能力,并提供全面的文档支持,对语言学知识要求较低。该项目免费开源,鼓励社区贡献,共同提升多语言支持。
KBIR - 关键词边界填充模型,支持多样化自然语言处理任务
Github开源项目自然语言处理模型Huggingface文本表示领域适应关键短语提取KBIR
KBIR模型采用新预训练方法进行关键词边界填充,提升关键任务表现。基于RoBERTa架构,使其广泛适用于命名实体识别、问答等自然语言处理任务,可利用预训练嵌入在多种AutoModel环境中灵活应用。