#Sudachi
Sudachi - 高性能日语形态素分析器 支持多级分词和丰富词典
Sudachi日语分词形态素分析分词模式插件系统Github开源项目
Sudachi是一款开源的日语形态素分析器,支持多级分词、大型词典和插件系统。基于UniDic和NEologd,Sudachi提供强大的文本正规化功能,可同时进行形态素分析和命名实体识别。它具有命令行接口和Java API,便于集成应用。Sudachi在分词准确性和性能上表现优秀,是处理日语文本的有力工具。
sudachi.rs - Rust实现的高性能日语分词工具
Sudachi日语分词Rust实现形态分析器命令行工具Github开源项目
sudachi.rs项目是日语形态分析工具Sudachi的Rust版本。它能够进行多粒度分词、词形标准化和空格分词。此外,该工具支持用户自定义词典、处理未知词,并可通过命令行或API使用。sudachi.rs以高效性能和易用性为特点,适用于各种日语自然语言处理任务。