jieba-rs
🚀 通过在GitHub上赞助我来帮助我成为一名全职的开源开发者
Rust实现的Jieba中文分词
安装
添加到你的Cargo.toml
中:
[dependencies]
jieba-rs = "0.7"
然后你就可以开始使用了。如果你使用Rust 2015,还需要在crate根目录中加上extern crate jieba_rs
。
示例
use jieba_rs::Jieba;
fn main() {
let jieba = Jieba::new();
let words = jieba.cut("我们中出了一个叛徒", false);
assert_eq!(words, vec!["我们", "中", "出", "了", "一个", "叛徒"]);
}
启用额外功能
default-dict
功能启用内嵌词典,该功能默认启用tfidf
功能启用TF-IDF关键词提取器textrank
功能启用TextRank关键词提取器
[dependencies]
jieba-rs = { version = "0.7", features = ["tfidf", "textrank"] }
运行基准测试
cargo bench --all-features
基准测试: 与cppjieba比较
jieba-rs
绑定
@node-rs/jieba
NodeJS绑定jieba-php
PHP绑定rjieba-py
Python绑定cang-jie
tantivy的中文分词器tantivy-jieba
tantivy和jieba-rs的适配器jieba-wasm
WebAssembly绑定
许可
本项目已根据MIT许可发布。许可证副本在LICENSE文件中提供。