HierarchicalForecast:分层时间序列预测的Python利器
在当今数据驱动的商业环境中,准确的预测对于决策制定至关重要。然而,许多企业和组织面临的是具有层次结构的复杂时间序列数据,如产品类别、品牌或地理分组等。这就需要一种能够在不同层次之间保持一致性的预测方法。HierarchicalForecast应运而生,为解决这一挑战提供了强大的工具。
HierarchicalForecast简介
HierarchicalForecast是一个开源的Python库,专门用于分层时间序列预测。它提供了一系列reconciliation(协调)方法,可以确保不同层次的预测结果之间保持一致性。这个库的核心目标是为机器学习和统计建模领域提供可靠的基准和工具,促进分层预测研究的发展。
主要特性
HierarchicalForecast提供了多种经典和创新的reconciliation方法:
-
经典方法:
- BottomUp: 从最底层向上聚合预测结果
- TopDown: 从顶层向下分配预测结果
-
替代方法:
- MiddleOut: 在中间层锚定预测,向上和向下分别使用BottomUp和TopDown方法
- MinTrace: 通过最小化一致预测空间的总预测方差来优化
- ERM: 通过最小化L1正则化目标函数来优化reconciliation矩阵
-
概率一致性方法:
- Normality: 在正态性假设下使用MinTrace方差-协方差闭式矩阵
- Bootstrap: 使用Gamakumara的bootstrap方法生成分层协调预测的分布
- PERMBU: 通过重新注入多变量依赖性和执行Bottom-Up聚合来协调独立样本预测
为什么选择HierarchicalForecast?
- 弥补统计建模和机器学习之间的鸿沟
HierarchicalForecast旨在将统计和计量经济学方法与机器学习技术结合起来。它为研究人员和实践者提供了一个平台,可以比较不同方法的性能,并开发新的算法。
- 公开可用的数据集和评估指标
该库集成了经过处理的公开数据集和各种评估指标,使得研究人员可以更容易地进行实验和比较不同方法的效果。
- 易于使用和扩展
HierarchicalForecast提供了简洁的API,使用户可以轻松地应用各种reconciliation方法。同时,它的设计也考虑到了可扩展性,允许用户添加自定义的方法。
- 社区支持和持续维护
作为一个开源项目,HierarchicalForecast得到了活跃社区的支持。开发团队承诺持续维护和更新库,以适应不断发展的需求。
使用示例
以下是一个简单的使用示例,展示了如何使用HierarchicalForecast进行预测和协调:
import numpy as np
import pandas as pd
from datasetsforecast.hierarchical import HierarchicalData
from statsforecast.core import StatsForecast
from statsforecast.models import AutoARIMA, Naive
from hierarchicalforecast.core import HierarchicalReconciliation
from hierarchicalforecast.methods import BottomUp, TopDown, MiddleOut
# 加载数据
Y_df, S, tags = HierarchicalData.load('./data', 'TourismSmall')
Y_df['ds'] = pd.to_datetime(Y_df['ds'])
# 分割训练集和测试集
Y_test_df = Y_df.groupby('unique_id').tail(4)
Y_train_df = Y_df.drop(Y_test_df.index)
# 使用AutoARIMA进行基础预测
fcst = StatsForecast(df=Y_train_df,
models=[AutoARIMA(season_length=4), Naive()],
freq='Q', n_jobs=-1)
Y_hat_df = fcst.forecast(h=4)
# 使用不同的reconciliation方法
reconcilers = [
BottomUp(),
TopDown(method='forecast_proportions'),
MiddleOut(middle_level='Country/Purpose/State',
top_down_method='forecast_proportions')
]
hrec = HierarchicalReconciliation(reconcilers=reconcilers)
Y_rec_df = hrec.reconcile(Y_hat_df=Y_hat_df, Y_df=Y_train_df,
S=S, tags=tags)
这个例子展示了如何加载数据、进行基础预测,然后使用不同的reconciliation方法来协调预测结果。
安装和文档
HierarchicalForecast可以通过pip或conda安装:
pip install hierarchicalforecast
或
conda install -c conda-forge hierarchicalforecast
详细的文档和更多示例可以在HierarchicalForecast官方文档中找到。
结论
HierarchicalForecast为分层时间序列预测提供了一个强大而灵活的解决方案。无论是研究人员还是实践者,都可以利用这个库来改进预测模型,确保不同层次的预测结果保持一致性。随着机器学习在时间序列预测领域的不断发展,HierarchicalForecast将继续发挥重要作用,推动这一领域的进步。
如果您正在处理复杂的分层时间序列数据,不妨尝试使用HierarchicalForecast。它可能会为您的预测任务带来新的洞察和改进。记得查看GitHub仓库以获取最新更新和贡献指南。让我们一起推动分层预测技术的发展,为更准确、更一致的决策提供支持。