论文部分内容阅读
2019年A股发生了许多大事,科创板开板、沪伦通开通、还有重组新规的落地等,我国股票市场正走在变革的道路上并且日渐完善。随着科技的进步,大量的金融数据得以保留,为股票市场的分析提供了坚实的数据基础。伴随深度学习研究的不断深入,人们正在不断的探索其在股票市场的上的应用。循环神经网络(RNN)是一种引入时序概念的神经网络,它的提出为分析时间序列数据提供了新的方法。长短时神经网络(LSTM)是一种优化了的循环神经网络,因其引入了门控的概念,克服了 RNN容易出现梯度消失和爆炸的问题;同时,LSTM神经元内部的多种门控各司其职,形成了对记忆数据的独立存储,进而可以解决数据的长序依赖问题。与传统的时间序列模型相比,LSTM得益于内部非线性激活函数的构建,在非线性相关数据的分析上具有一定的优势。本文尝试通过LSTM在股价预测和股价涨跌预测两个方面的实证分析,来验证LSTM对股票数据分析的适用性。同时本文对LSTM进行股票数据建模时容易出现的问题进行了总结,并对如何解决这些问题提出了自己的见解。希望从实证的角度为构建LSTM股票预测模型,提供一些具有参考价值的信息。本文选取了沪深300指数近5年的日交易数据、技术指标和估值指标三方面的数据作为样本数据。首先,在股价预测的实验中,本文分别从单特征输入和多特征输入的角度,采用LSTM模型对未来一天的收盘指数进行建模预测,再以ARIMA模型作为对比模型,进而分析LSTM在股价预测上的适用性。其次,在股价涨跌预测的实验中,也从单特征输入和多特征输入的角度,以未来一天的收盘指数的涨跌为预测对象进行LSTM建模分析。经过实证研究,两组实验都能说明LSTM多特征输入模型效果相对较好,证明了 LSTM多特征输入模型在股票预测方面的适用性。就收盘指数预测结果来看,LSTM多特征输入模型比ARIMA模型的MSE约低100个点,比LSTM单特征输入模型的MSE约低150个点。就收盘指数的涨跌预测结果来看,LSTM多特征输入模型比LSTM单特征输入模型的预测正确率提高23%,预测准确的天数增加了 10天,同时在模型训练时LSTM多特征输入模型预测正确率的走势比单特征输入模型要稳定很多。最后,本文针对LSTM在股票预测建模中出现的过拟合和不稳定的问题,采取了特征选择、初始化参数设定、单次训练样本量的选择、训练次数的选择、插入L2正则项、设置学习率衰减系数这六个方面措施,来防止过拟合和抑制不稳定的发生。