项目介绍:TensorFlow 决策森林
简介
TensorFlow 决策森林(TF-DF)是一个用于在 TensorFlow 中训练、运行和解释决策森林模型的库。决策森林模型包括随机森林、梯度增强树等。TF-DF 支持分类、回归和排序任务。这意味着研究人员和开发人员可以用它来处理丰富多样的数据科学问题。
源动力
TF-DF 的强大功能依托于 Yggdrasil 决策森林(YDF),这是一种用于在 C++、JavaScript、CLI 和 Go 中训练和使用决策森林的库。值得注意的是,TF-DF 模型与 YDF 模型是兼容的,可以互相转换使用,这使得其具有更高的灵活性和可扩展性。
使用环境
目前,TensorFlow 决策森林支持在 Linux 和 Mac 系统上使用。对于 Windows 用户来说,也可以通过 WSL+Linux 来使用这一库。因此,不同操作系统的用户都可以方便地利用这个工具进行模型训练。
操作示例
使用 TF-DF 进行简易完整的模型训练流程,其步骤如下:
import tensorflow_decision_forests as tfdf
import pandas as pd
# 读取数据集
train_df = pd.read_csv("project/train.csv")
test_df = pd.read_csv("project/test.csv")
# 将数据集转换为 TensorFlow 数据集
train_ds = tfdf.keras.pd_dataframe_to_tf_dataset(train_df, label="my_label")
test_ds = tfdf.keras.pd_dataframe_to_tf_dataset(test_df, label="my_label")
# 训练模型
model = tfdf.keras.RandomForestModel()
model.fit(train_ds)
# 查看模型摘要
model.summary()
# 评估模型
model.evaluate(test_ds)
# 导出为 TensorFlow SavedModel
model.save("project/model")
安装与贡献
安装步骤
要安装 TensorFlow 决策森林,只需执行以下命令:
pip3 install tensorflow_decision_forests --upgrade
详情请参阅安装文档,以获得更多信息以及故障排除和其他安装方案。
贡献
TensorFlow 决策森林和 Yggdrasil 决策森林欢迎社区的贡献。因此,如果您有兴趣参与,可以查看开发者手册和贡献指南,详细了解如何协作和贡献代码。
引用
如果您在科学出版物中使用 TensorFlow 决策森林,请引用下述论文:
Yggdrasil Decision Forests: A Fast and Extensible Decision Forests Library,
Guillame-Bert et al., KDD 2023: 4068-4077. doi:10.1145/3580305.3599933
支持
如需联系核心开发团队,您可以通过以下邮箱进行联系:decision-forests-contact@google.com。
开发团队
TensorFlow 决策森林的开发团队包括:
- Mathieu Guillame-Bert
- Jan Pfeifer
- Richard Stotz
- Sebastian Bruch
- Arvind Srinivasan
版权许可
TensorFlow 决策森林遵循 Apache License 2.0 许可证进行发布。