使用深度神经网络进行股票预测
股票价格预测是一个具有挑战性的任务,因为它往往不遵循任何特定的模式。然而,深度神经学习可以通过机器学习来识别模式。对于时间序列预测来说,最有效的技术之一是使用长短期记忆(LSTM)网络,这是一种能够长期记忆信息的循环神经网络(RNN)。这使得它们在预测股票价格方面非常有用。
股市数据
为了获取股票预测模型所需的市场数据,我们将使用Python中的yFinance库。该库专门用于从Yahoo Finance网页下载给定股票代码的相关信息。通过使用yFinance,我们可以轻松获取最新的市场数据并将其纳入我们的模型。
在本案例中,我们将使用"GOOG"这个众所周知的科技公司的股票代码。以下是在Yahoo Finance页面上该股票代码的示例截图:
深度学习模型
训练和验证数据
现在我们已经获得了想要使用的数据,我们需要定义训练和验证数据。由于股票可能会随日期而变化,我创建的函数需要3个基本参数:
- 股票代码:GOOG
- 开始日期:2004年8月1日(他们开始交易的日期)
- 验证日期:2017年1月1日(我们希望开始进行验证的日期)
在本练习中,我只关注收盘价,这是关于股票或证券的标准基准。
下图显示了我们将创建的训练数据和验证数据之间的划分:
数据标准化
为了标准化数据,我们需要将其缩放到0到1之间,以便在一个通用尺度上进行讨论。为此,我们可以使用MinMaxScaler预处理工具,如下所示:
min_max = MinMaxScaler(feature_range=(0, 1))
train_scaled = min_max.fit_transform(training_data)
添加时间步长
为了实现用于时间序列预测的LSTM网络,我们使用了3天的时间步长。这种技术允许网络回顾前3天的数据来预测随后的一天。下图说明了我们如何使用这个概念,其中前3个收盘价样本生成第4个样本,依此类推。这生成了一个形状为(3,1)的矩阵,其中3代表时间步长,1代表特征数量(收盘价)。
创建LSTM深度学习模型
要创建此模型,您需要安装TensorFlow、TensorFlow-GPU和Keras才能运行。该模型的代码如下所示,每一层的解释也定义如下:
def create_long_short_term_memory_model(x_train):
model = Sequential()
# 第1层,带有Dropout正则化
model.add(LSTM(units=100, return_sequences=True, input_shape=(x_train.shape[1], 1)))
model.add(Dropout(0.2))
# 第2层LSTM
model.add(LSTM(units=50, return_sequences=True))
model.add(Dropout(0.2))
# 第3层LSTM
model.add(LSTM(units=50, return_sequences=True))
model.add(Dropout(0.5))
# 第4层LSTM
model.add(LSTM(units=50))
model.add(Dropout(0.5))
# 指定一个输出单元的Dense层
model.add(Dense(units=1))
model.summary()
return model
渲染后的模型可以在下图中看到,生成了一个具有超过10万个可训练参数的模型。
通过使用这种LSTM模型,我们可以对股票价格进行预测,为投资决策提供有价值的参考。当然,股市受多种因素影响,预测结果仅供参考,投资者还需结合其他分析方法和自身判断来做出投资决策。