#NLP库
catalyst - 高效跨平台C#自然语言处理库,支持预训练模型与灵活实体识别
实体识别净标记Github开源项目CatalystNLP库预训练模型
Catalyst 是一个C#自然语言处理库,提供预训练模型、实体识别和高效的二进制序列化支持。兼容.NET Standard 2.0 并跨平台运行,支持Windows、Linux和macOS。具备精准的标记化处理和语言检测功能。其特点包括命名实体识别、词性标注、语言检测、词形还原和FastText嵌入训练。通过简单的NuGet包安装和流式模型存储,支持多线程并行文本处理,适合大规模文本分析需求。
pynlpl - 多功能自然语言处理库,支持FoLiA等格式解析与频率列表、n-gram提取
PyNLPlPython自然语言处理NLP库FoLiA格式数据类型Github开源项目
PyNLPl是一个Python自然语言处理库,提供多种模块用于NLP任务,包括n-gram提取、语言模型构建和多种数据格式解析如FoLiA和Giza。支持Python 2.7和3.x版本,用户可以通过PyPI或源码安装。