使用储层计算进行时间序列分类和聚类
图1: RC分类器概览。
这个库可以快速实现基于*储层计算(RC)*的不同时间序列数据架构,RC是由回声状态网络在机器学习中普及的一系列方法。 这个库主要用于对单变量和多变量时间序列进行分类和聚类。但它也可以用于时间序列预测。
安装
推荐使用pip安装:
pip install reservoir-computing
或者,您可以从源代码安装:
git clone https://github.com/FilippoMB/Time-series-classification-and-clustering-with-Reservoir-Computing.git
cd Time-series-classification-and-clustering-with-Reservoir-Computing
pip install -e .
快速开始
以下脚本提供了简单的示例,说明如何使用该库执行不同的任务。
要运行这些脚本,请下载项目并切换到根文件夹:
git clone https://github.com/FilippoMB/Time-series-classification-and-clustering-with-Reservoir-Computing.git
cd Time-series-classification-and-clustering-with-Reservoir-Computing
分类
python examples/classification_example.py
您也可以查看notebook或
聚类
python examples/clustering_example.py
您也可以查看notebook或
预测
python examples/forecasting_example.py
您也可以查看notebook或
框架概述
以下我们介绍该库的三个主要功能。
分类
参考图1,RC分类器包含四个不同的模块。
- 储层模块指定储层配置(例如,双向、漏电神经元、环形拓扑)。给定一个多变量时间序列$\mathbf{X}$,它生成一个与储层状态$\mathbf{H}$长度相同的序列。
- 降维模块(可选)对储层状态序列$\mathbf{H}$应用降维,生成新序列$\mathbf{\bar H}$。
- 表示从储层状态序列生成向量$\mathbf{r}_\mathbf{X}$,以向量形式表示原始时间序列$\mathbf{X}$。
- 读出模块是一个分类器,将表示$\mathbf{r}_\mathbf{X}$映射到与时间序列$\mathbf{X}$相关的类标签$\mathbf{y}$。
该库还实现了储层模型空间,这是一种非常强大的时间序列表示$\mathbf{r}_\mathbf{X}$。 方法详情可以在原始论文中找到。
modules.py中的RC_model
类允许指定、训练和测试RC模型。
通过为每个模块选择不同的配置,可以使用多种选项来自定义RC模型。
训练和测试函数需要输入训练和测试数据,这些数据必须以形状为*[N,T,V]*的多维numpy数组提供,其中:
- N = 样本数
- T = 每个样本中的时间步数
- V = 每个样本中的变量数
训练和测试标签(Ytr
和Yte
)必须以独热编码格式提供,即矩阵*[N,C],其中C*是类别数。
from reservoir_computing.modules import RC_model
clf = RC_model()
clf.fit(Xtr, Ytr) # 训练
Yhat = clf.predict(Xte) # 预测
聚类
从表示模块(步骤3)获得的表示$\mathbf{r}_\mathbf{X}$可用于执行时间序列聚类。
用于分类的相同RC_model
类可以配置为直接返回时间序列表示,这些表示可用于聚类和降维等无监督任务。
与分类一样,数据必须以形状为*[N,T,V]*的多维NumPy数组提供
from reservoir_computing.modules import RC_model
clst = RC_model(readout_type=None)
clst.fit(X)
rX = clst.input_repr # 输入数据的表示
表示形式rX
可用于使用传统的向量数据聚类算法进行聚类,例如这里中的算法。
预测
在步骤1和2中获得的序列$\mathbf{H}$和$\mathbf{\bar H}$可以直接用于预测时间序列的未来值。
modules.py中包含的RC_forecaster
类允许指定、训练和测试用于时间序列预测的RC模型。
from reservoir_computing.modules import RC_forecaster
fcst = RC_forecaster()
fcst.fit(Xtr, Ytr) # 训练
Yhat = fcst.predict(Xte) # 预测
这里,Xtr
和Ytr
分别是用于训练的当前值和未来值。
高级示例
以下笔记本展示了更高级的用例。
数据集
有几个可用于执行时间序列分类/聚类和预测的数据集。
分类和聚类
from reservoir_computing.datasets import ClfLoader
downloader = ClfLoader()
downloader.available_datasets(details=True) # 打印可用数据集
Xtr, Ytr, Xte, Yte = downloader.get_data('Libras') # 下载数据集并返回数据
预测
真实世界时间序列
from reservoir_computing.datasets import PredLoader
downloader = PredLoader()
downloader.available_datasets(details=False) # 打印可用数据集
X = downloader.get_data('CDR') # 下载数据集并返回数据
合成时间序列
from reservoir_computing.datasets import SynthLoader
synth = SynthLoader()
synth.available_datasets() # 打印可用数据集
Xs = synth.get_data('Lorenz') # 生成合成时间序列
引用
如果在您的研究中使用了这个库,请考虑引用原始论文
@article{bianchi2020reservoir,
title={Reservoir computing approaches for representation and classification of multivariate time series},
author={Bianchi, Filippo Maria and Scardapane, Simone and L{\o}kse, Sigurd and Jenssen, Robert},
journal={IEEE Transactions on Neural Networks and Learning Systems},
year={2020},
publisher={IEEE}
}
许可证
该代码基于MIT许可证发布。请参阅附带的LICENSE文件。