SQLFlow简介
SQLFlow是一个开源项目,它将SQL与人工智能技术结合在一起,允许开发人员使用扩展的SQL语法来开发机器学习应用。SQLFlow的主要特点包括:
- 将SQL程序编译为在Kubernetes上运行的工作流
- 支持包括训练、预测、模型评估、模型解释等AI任务
- 支持多种数据库系统,如MySQL、MariaDB、TiDB、Hive等
- 集成了TensorFlow、Keras、XGBoost等主流机器学习框架
通过SQLFlow,具有SQL技能的工程师就可以开发高级的机器学习应用,无需掌握复杂的AI编程语言。
快速上手
您可以在SQLFlow的在线playground中体验:
https://playground.sqlflow.tech/
下面是一个使用TensorFlow DNNClassifier模型进行训练的示例:
SELECT *
FROM iris.train
TO TRAIN DNNClassifier
WITH model.n_classes = 3, model.hidden_units = [10, 20]
COLUMN sepal_length, sepal_width, petal_length, petal_width
LABEL class
INTO sqlflow_models.my_dnn_model;
学习资源
项目链接
- GitHub仓库: https://github.com/sql-machine-learning/sqlflow
- 官方网站: https://sqlflow.org/
SQLFlow是一个正在快速发展的开源项目,欢迎感兴趣的开发者参与贡献。如果您在使用过程中有任何问题,可以在GitHub上提交issue反馈。
通过SQLFlow,我们可以更轻松地将AI能力引入到现有的数据处理流程中,释放数据的潜力。无论您是数据工程师、数据科学家还是业务分析师,都可以尝试使用SQLFlow来简化AI开发流程,提高生产效率。