NeuralProphet简介
NeuralProphet是一个基于PyTorch构建的开源时间序列预测框架,它结合了神经网络和传统时间序列算法的优点,为用户提供了一个易于使用且具有高度可解释性的预测工具。该项目受到Facebook Prophet和AR-Net的启发,旨在弥合传统时间序列模型和深度学习方法之间的差距。
NeuralProphet的核心理念是"以人为本的预测"。它设计用于迭代式的人机协作建模过程,让用户能够快速构建初始模型,解释结果,不断改进,直到得到满意的预测效果。NeuralProphet特别适合于高频(亚日级)和长期(至少两个完整周期/年)的时间序列数据。
NeuralProphet的主要特性
NeuralProphet提供了丰富的模型组件和框架特性,使其成为一个强大而灵活的预测工具:
模型组件
- 自回归:可以使用线性模型或神经网络(AR-Net)来建模自相关性。
- 趋势:分段线性趋势,可选自动变点检测。
- 季节性:支持不同周期(如年、日、周、小时)的傅里叶项。
- 滞后回归变量:可以使用线性模型或神经网络处理滞后观测值(如温度传感器数据)。
- 未来回归变量:可以使用线性模型或神经网络处理提前已知的特征(如温度预报)。
- 事件:支持国家假日和自定义重复事件。
- 全局建模:组件可以是局部的、全局的或"全局+局部"(全局+正则化局部)。
框架特性
- 多时间序列:可以拟合具有(部分)共享模型参数的全局/全局+局部模型。
- 不确定性估计:可以估计特定分位数的值(分位数回归)。
- 对建模组件进行正则化。
- 提供预测组件、模型系数等的可视化功能。
- 时间序列交叉验证工具。
- 模型检查点和验证功能。
使用NeuralProphet进行预测
使用NeuralProphet进行预测非常简单,只需几行代码即可完成:
from neuralprophet import NeuralProphet
# 创建NeuralProphet模型
m = NeuralProphet()
# 拟合模型
metrics = m.fit(df)
# 进行预测
forecast = m.predict(df)
# 可视化结果
fig_forecast = m.plot(forecast)
fig_components = m.plot_components(forecast)
fig_model = m.plot_parameters()
如果需要预测未知的未来,可以扩展数据框后再进行预测:
m = NeuralProphet().fit(df, freq="D")
df_future = m.make_future_dataframe(df, periods=30)
forecast = m.predict(df_future)
fig_forecast = m.plot(forecast)
NeuralProphet的优势
-
易于学习和使用:NeuralProphet提供了简洁的API,使用户能够快速上手并构建预测模型。
-
高度可解释性:NeuralProphet保留了Prophet的设计理念,提供了各种可视化工具来解释模型组件和预测结果。
-
灵活性:用户可以根据需要自定义和调整各种模型组件,如趋势、季节性、事件等。
-
结合深度学习:通过引入神经网络组件,NeuralProphet能够捕捉更复杂的模式和非线性关系。
-
多时间序列支持:NeuralProphet可以同时处理多个相关的时间序列,共享部分模型参数。
-
不确定性估计:通过分位数回归,NeuralProphet可以提供预测的不确定性区间。
-
自动化功能:如自动变点检测、自动超参数选择等,减少了手动调优的工作量。
实际应用案例
让我们通过一个实际的应用案例来深入了解NeuralProphet的使用。在这个案例中,我们将使用NeuralProphet来预测法国电力网络中风力发电的负荷因子。
背景
法国电力网络需要持续平衡供需关系。风力发电作为一种间歇性能源,其产量受天气条件影响较大。通过准确预测风力发电的负荷因子(实际发电量与装机容量之比),可以帮助优化电网管理,提高风能利用效率。
数据准备
我们收集了以下数据:
- 300多个业余气象站的温度和风速数据(每小时)
- 风力发电负荷因子数据(每小时,从RTE网站获取)
- 时间范围:2019年3月1日至2019年9月30日(约7个月)
数据预处理后,我们保留了57个气象站的数据,并将数据集分为训练集(前6个月)和测试集(最后1个月)。
模型构建
使用NeuralProphet构建预测模型:
from neuralprophet import NeuralProphet
# 创建NeuralProphet模型
m = NeuralProphet(
n_forecasts=24, # 预测未来24小时
n_lags=48, # 使用过去48小时的数据
yearly_seasonality=False,
weekly_seasonality=True,
daily_seasonality=True,
batch_size=64,
epochs=100,
)
# 添加天气数据作为滞后回归变量
for station in weather_stations:
m = m.add_lagged_regressor(name=f"temp_{station}")
m = m.add_lagged_regressor(name=f"wind_speed_{station}")
# 拟合模型
metrics = m.fit(df_train, freq="H")
# 进行预测
forecast = m.predict(df_test)
结果分析
通过NeuralProphet提供的可视化工具,我们可以深入分析预测结果:
- 趋势分析:
fig_trend = m.plot_components(forecast)
从趋势图中,我们可以观察到负荷因子的长期变化趋势,以及自动检测到的变点。
- 季节性分析:
fig_seasonality = m.plot_components(forecast)
季节性图展示了每日和每周的周期性模式,有助于理解负荷因子的规律性变化。
- 滞后回归变量影响:
fig_lagged = m.plot_components(forecast)
这个图表显示了不同气象站的温度和风速对负荷因子预测的影响程度。
- 预测结果:
fig_forecast = m.plot(forecast)
最终的预测图展示了模型对未来24小时负荷因子的预测,包括预测值和不确定性区间。
模型评估
我们使用均方根误差(RMSE)来评估模型性能:
from sklearn.metrics import mean_squared_error
import numpy as np
rmse = np.sqrt(mean_squared_error(df_test['y'], forecast['yhat1']))
print(f"RMSE: {rmse}")
通过比较不同模型配置的RMSE,我们可以不断优化模型,提高预测准确性。
结论
NeuralProphet作为一个结合了神经网络和传统时间序列算法的预测框架,为时间序列分析和预测提供了一个强大而灵活的工具。它的易用性、可解释性和高度可定制性使其成为数据科学家和分析师的理想选择。
通过本文的案例分析,我们展示了NeuralProphet在实际应用中的潜力。它不仅能够捕捉复杂的时间序列模式,还提供了丰富的可视化工具,帮助用户深入理解预测结果。
随着NeuralProphet的不断发展和社区的积极贡献,我们可以期待看到更多创新功能和应用案例。无论是在能源管理、金融预测、还是其他需要时间序列分析的领域,NeuralProphet都有望成为一个重要的工具。
如果您对时间序列预测感兴趣,不妨尝试使用NeuralProphet,探索其强大的功能,并为这个开源项目做出贡献。让我们共同推动时间序列预测技术的发展,为更多实际问题找到解决方案。