SudachiDict
日本分词器Sudachi的词典。
下载
点击这里获取预构建的词典。
Python包
你可以将WorksApplications/SudachiPy(Sudachi的Python版本)的词典安装为Python包。
在SudachiPy v0.5.2及以后版本中,你可以直接从命令行或程序中指定词典。
警告:sudachipy link
在SudachiPy v0.5.2及以后版本中不再可用。
请查看以下链接了解有关词典选项的更多详情。
- 英文
- 日文
安装
pip install sudachidict_core
pip install sudachidict_small
pip install sudachidict_full
词典类型
Sudachi有三种类型的词典。
- Small:仅包含UniDic的词汇
- Core:包含基本词汇(默认)
- Full:包含各种专有名词
从源代码构建
词典源文件曾经托管在git lfs上,但现在托管在S3上。 未来它们将再次移回到github上。
目前,你需要手动从AWS S3下载所需文件,并将它们解压到src/main/text
目录中。
Core词典需要small和core文件,Full需要全部三个文件。
许可证
SudachiDict由Works Applications Co., Ltd.开发,采用[Apache License, Version 2.0](http://www.apache.org/licenses/LICENSE-2.0.html)许可
Copyright (c) 2017-2023 Works Applications Co., Ltd.
根据Apache License 2.0版("许可证")获得许可;
除非遵守许可证,否则你不得使用此文件。
你可以在以下网址获取许可证副本:
http://www.apache.org/licenses/LICENSE-2.0
除非适用法律要求或书面同意,否则根据许可证分发的软件是基于
"按原样"分发的,没有任何明示或暗示的保证或条件。
有关许可证下的特定语言管理权限和限制,请参阅许可证。
本项目包含UniDic和NEologd的部分内容。