Spark NLP 工作坊
展示如何在 Python 和 Scala 中使用 Spark NLP 的笔记本和代码。
目录
Python 设置
$ java -version
# 应该是 Java 8(Oracle 或 OpenJDK)
$ python3 -m venv .sparknlp-env
$ source .sparknlp-env/bin/activate
# spark-nlp 默认基于 pyspark 3.x
$ pip install pyspark==3.1.2
$ pip install spark-nlp
Colab 设置
# 这仅用于在 Colab 上设置 PySpark 和 Spark NLP
!wget http://setup.johnsnowlabs.com/colab.sh -O - | bash
主要仓库
https://github.com/JohnSnowLabs/spark-nlp
项目网站
查看我们的官方 spark-nlp 页面:http://nlp.johnsnowlabs.com/ 获取用户文档和示例
Slack 社区频道
贡献
如果您发现任何不再工作的示例,请创建一个问题。
许可证
Apache 许可证 2.0