skforecast: 强大的Python时间序列预测库
什么是skforecast?
skforecast是一个用于时间序列预测的Python库,它基于机器学习模型进行预测。skforecast的主要特点是可以与任何兼容scikit-learn API的回归器一起使用,包括流行的选项如LightGBM、XGBoost、CatBoost、Keras等。
为什么选择skforecast?
统计学和机器学习领域已经开发出许多出色的回归算法,这些算法可以用于预测,但将它们有效地应用于时间序列分析仍然具有挑战性。为了解决这个问题,skforecast库提供了一套全面的工具,用于在处理时间序列时常见的各种场景下进行训练、验证和预测。
该库使用广泛使用的scikit-learn API构建,使其易于集成到现有工作流程中。使用skforecast,用户可以访问广泛的功能,如特征工程、模型选择、超参数调优等。这使用户能够专注于项目的基本方面,将时间序列分析的复杂性交给skforecast处理。
此外,skforecast的开发遵循以下优先事项:
- 快速且稳健的原型设计 ⚡
- 验证和回测方法,对模型性能进行真实评估 🔍
- 模型必须能够部署到生产环境中 🔨
- 模型必须可解释 🔮
skforecast的主要特性
- 创建基于任何符合scikit-learn API的回归器的递归自回归预测器
- 创建基于任何符合scikit-learn API的回归器的直接自回归预测器
- 创建基于任何符合scikit-learn API的回归器的多序列自回归预测器
- 包含外生变量作为预测因子
- 包含自定义预测因子(滚动平均、滚动方差等)
- 多种用于模型验证的回测方法
- 网格搜索、随机搜索和贝叶斯搜索以找到最佳滞后(预测因子)和最佳超参数
- 包含自定义指标用于模型验证和网格搜索
- 通过自举和分位数回归估计预测区间
- 获取预测因子重要性
- 生产环境中的预测器
安装与依赖
要安装带有核心依赖项的基本版本skforecast,请运行:
pip install skforecast
如果想了解更多关于安装过程、依赖项和可选功能的信息,请参考安装指南。
skforecast 0.13的新特性
- 支持
python 3.12
,不再支持python 3.8
。 - 全局预测器
ForecasterAutoregMultiSeries
和ForecasterAutoregMultiSeriesCustom
能够预测训练期间未见过的序列。当用户想预测训练数据中未包含的新序列时,这很有用。 - 全局预测器
ForecasterAutoregMultiSeries
和ForecasterAutoregMultiSeriesCustom
中的encoding
可以设置为None
。此选项不会将编码的序列ID添加到回归器训练矩阵中。 - 所有递归和直接预测器中新增
create_predict_X
方法,允许用户检查传递给回归器预测方法的矩阵。 - 新增
metrics
模块,包含用于计算时间序列预测指标的函数,如mean_absolute_scaled_error
和root_mean_squared_scaled_error
。访问时间序列预测指标了解更多信息。 - 在
backtesting_forecaster_multiseries
中新增add_aggregated_metric
参数,除了每个级别的指标外,还包括使用平均值(算术平均)、加权平均值(由每个级别的预测值数量加权)或汇总(所有级别的值汇总后计算指标)的所有级别的聚合指标。 - 在
model_selection
和model_selection_multiseries
函数中新增skip_folds
参数。它允许用户在回测期间跳过某些折叠,这对加速回测过程和超参数搜索很有用。 - 错误修复和性能改进。
预测器类型
skforecast库提供了多种预测器类型,每种类型都针对特定需求量身定制,如单个或多个时间序列、直接或递归策略、或自定义预测因子。无论具体的预测器类型如何,所有实例都共享相同的API。
预测器 | 单序列 | 多序列 | 递归策略 | 直接策略 | 概率预测 | 时间序列差分 | 外生特征 | 自定义特征 |
---|---|---|---|---|---|---|---|---|
ForecasterAutoreg | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |||
ForecasterAutoregCustom | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ||
ForecasterAutoregDirect | ✔️ | ✔️ | ✔️ | ✔️ | ||||
ForecasterMultiSeries | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |||
ForecasterMultiSeriesCustom | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ||
ForecasterMultiVariate | ✔️ | ✔️ | ✔️ | ✔️ | ||||
ForecasterRNN | ✔️ | ✔️ | ||||||
ForecasterSarimax | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
示例和教程
skforecast提供了丰富的示例和教程,帮助用户快速上手并掌握库的使用。以下是一些英文和西班牙语的教程链接:
英文教程:
- Skforecast: 使用机器学习进行时间序列预测
- ARIMA和SARIMAX模型
- 使用梯度提升进行预测: XGBoost, LightGBM和CatBoost
- 使用XGBoost进行预测
- 全局预测模型: 多序列预测
- 概率预测
- 使用深度学习进行预测
西班牙语教程:
- Skforecast: 使用机器学习进行时间序列预测
- ARIMA和SARIMAX模型
- 使用梯度提升进行预测: XGBoost, LightGBM和CatBoost
- 使用XGBoost进行预测
- 全局预测模型: 多序列预测
- 概率预测
- 使用深度学习进行预测
如何贡献
skforecast的开发主要包括添加和创建新的预测器、新的验证策略或改进当前代码的性能。然而,还有许多其他方式可以贡献:
- 在GitHub Issues上提交错误报告或功能请求。
- 为我们的示例贡献Jupyter笔记本。
- 为我们的项目编写单元或集成测试。
- 回答我们的问题,无论是在GitHub Issues、Stack Overflow还是其他地方。
- 将我们的文档翻译成另一种语言。
- 写一篇博客文章、发推文或与他人分享我们的项目。
有关如何为skforecast做出贡献的更多信息,请参阅我们的贡献指南。
访问我们的作者部分以了解所有为skforecast做出贡献的人。
引用
如果您在科学出版物中使用skforecast,我们将感谢您引用已发布的软件。
Zenodo:
Amat Rodrigo, Joaquin, & Escobar Ortiz, Javier. (2024). skforecast (v0.13.0). Zenodo. https://doi.org/10.5281/zenodo.8382788
APA:
Amat Rodrigo, J., & Escobar Ortiz, J. (2024). skforecast (Version 0.13.0) [Computer software]. https://doi.org/10.5281/zenodo.8382788
BibTeX:
@software{skforecast,
author = {Amat Rodrigo, Joaquin and Escobar Ortiz, Javier},
title = {skforecast},
version = {0.13.0},
month = {8},
year = {2024},
license = {BSD-3-Clause},
url = {https://skforecast.org/},
doi = {10.5281/zenodo.8382788}
}
捐赠
如果您觉得skforecast有用,您可以通过捐赠来支持我们。您的贡献将帮助我们继续开发和改进这个项目。非常感谢!
许可证
skforecast采