论文部分内容阅读
人工智能技术在近些年以来取得了一系列令人瞩目的成就,给人们带来了极大的震撼和丰富的想象。当前人工智能尤其是深度学习的技术已经对人们生活的方方面面产生了广泛的影响。随着人工智能、大数据以及区块链技术在金融领域的应用不断深化,金融与科技的融合在许多金融场景带来了颠覆性的变革与创新。对金融领域而言,智能化是金融行业发展的重要方向,智能投顾、智能投研与智能投资都将是智能金融的表现形式,而这些形式实现的关键在于如何实现“智能”。深度学习在其他领域的成功应用为智能金融的发展提供了良好的借鉴。因此,随着人工智能时代的来临以及金融数据分析需求的提升,深度学习成为了金融领域中的应用前沿,其中一个受到广泛关注的应用前沿就是股票价格及波动率的预测问题。股票市场是一个复杂的非线性动力系统,股票价格及波动率的预测一直是金融领域研究中的焦点问题。股票市场受到经济形势、政治环境、国家政策、投资者心理、其他外围市场等诸多因素的影响,其内部的变化规律极其复杂,传统的时间序列模型难以有效的解决这样的复杂非线性问题。现有的分析方法对于预测这样高维度、低信噪比、非线性而且非平稳的问题尚不能取得令人满意的效果。传统计量方法多数需要参数化建模,对于极为复杂的动力学系统不能有效的刻画,且依赖于一些实际证券市场中并不满足的假设条件;而传统机器学习方法比如支持向量机、决策树以及随机森林等,其非线性特点尚不具备对如此复杂的数据进行准确建模的能力,而且其预测表现与人工特征设计的处理方式高度相关,影响了模型的稳健性以及实际应用效果。随着神经网络技术的逐步发展以及金融市场数据数量和可得性的提升,深度学习已经成为股票价格预测的应用前沿。深度学习通过分层结构提取深层特征,强化重要因素、过滤噪音,对提升预测准确率具有重要意义。基于此,本文通过应用循环神经网络、卷积神经网络以及复合神经网络等深度学习方法对股票价格及波动率进行预测。按照传统的有效市场假说,对于满足弱式有效的股票市场,仅仅根据股票的价格数据和技术指标对股票价格涨跌进行预测是较为困难的。然而本文经过研究发现,通过应用深度学习方法能够在一定程度上对股票价格的涨跌进行有效的预测。一方面,行为金融学理论为本文的工作提供了可靠的理论依据,中国股票市场就目前而言依然存在着大量的市场异象和非理性行为,我国股票市场的有效性依然值得怀疑,在一些短期时间区间内尚未达到弱式有效市场;另一方面,适应性市场假说认为不断变化的市场环境下,可预测性来源于投资者要求的风险溢价的时变性。金融市场一定程度的可预测性,并不代表市场无效率,而是市场维持有效性必要的动力。在这样的情况下应用深度学习技术对股票价格涨跌进行预测就称为了一件有可能而且有意义的工作。本文主要分为三部分,第一部分主要利用循环神经网络的改进模型,即长短期记忆模型(LSTM)与门控循环单元模型(GRU)对沪深300指数涨跌进行预测。传统的循环神经网络由于梯度消失问题而不能有效解决时间序列的长期记忆问题,因此本文使用在其基础上发展出的LSTM与GRU模型进行预测。这一部分分析比较了不同神经网络结构和时间步对预测结果的影响。实验发现,GRU模型在日K线以及5分钟K线的预测上相比LSTM模型均有一定提升。接下来利用多时间尺度融合预测模型通过同时提取两个时间尺度上的价格特征,从而能够同时捕捉股票价格的中长期趋势与短期趋势,以实现更高的预测准确率。此外,这一部分还应用了最新的注意力机制方法进行预测,发现注意力机制能够有效提升LSTM模型对金融时间序列的处理能力。第二部分主要利用多种卷积神经网络以及卷积神经网络和循环神经网络结合组成的复合模型对沪深300指数涨跌进行预测。这一部分首先应用卷积神经网络中使用最广泛的二维卷积神经网络对沪深300指数的涨跌进行预测,并分别使用单通道和多通道网络结构,实验发现相比于非图像识别任务常用的单通道卷积网络结构,应用多通道卷积网络结构的预测效果更好。接下来应用一维卷积神经网络进行预测,发现预测准确率高于二维卷积神经网络,本文的实验表明一维卷积神经网络更加适用于金融时间序列的特点。进一步,通过使用卷积循环神经网络和循环卷积神经网络等复合模型,并结合本文之前提出的多时间尺度融合模型进行预测,最终发现预测效果得到明显改善。第三部分主要利用LSTM模型和CNN模型对沪深300指数与50ETF指数的未来一日、一周、一月已实现波动率进行预测,并将结果与目前主流的HAR族波动率预测模型进行比较。通过SPA检验发现,深度学习模型的预测性能总体上好于其他模型,其中LSTM模型的预测性能高于CNN模型,且预测的未来期限越长,深度学习模型的预测性能优势越明显。在未来一周、一月波动率的预测任务中,LSTM模型在全部四种损失函数下均显著优于其它所有模型。这一结果表明深度学习方法能够有效提取波动率的动力学特征从而具备较好的预测能力,相较于目前主流的HAR族高频数据模型可以达到更好的预测效果。本文得到的主要研究结论如下:第一,BP神经网络难以有效对股票价格数据进行预测。本文分别尝试了不同网络深度、神经元个数、输入数据周期以及输入数据种类的多种结构组合,预测准确率均不理想。本文的实验表明传统的BP神经网络对于金融时间序列数据的拟合能力有限。第二,循环神经网络能够显著提高预测准确率,GRU模型相比于LSTM模型在本文的金融时间序列预测任务中效果更好,可以达到58.45%的预测准确率。并且GRU模型能够有效训练的时间步比LSTM模型更长,训练速度更快。第三,近两年新出现的注意力机制技术可以改善神经网络对金融时间序列预测效果,可以将预测准确率提高到59.52%。第四,股票在日K线频率上与5分钟K线频率上的可预测性没有明显差异,但是5分钟K线预测对预测方法和模型结构的敏感性要更低,相对更容易训练,可能是由于5分钟样本的数据量更大。不同时间频率下的预测任务适用不同的深度学习模型和网络结构。第五,虽然大多数非图像识别任务在应用卷积神经网络时会使用单颜色通道的模型结构,但本文发现,对于股票价格预测而言使用多颜色通道,即将不同指标数据分别占用不同颜色通道的预测效果会更好。此外,一维卷积神经网络对于金融时间序列的适用性要高于普通二维卷积神经网络,预测准确率可以得到显著提升。第六,将循环神经网络和卷积神经网络结合在一起的循环卷积神经网络和卷积循环神经网络能够结合各自的优势,取得相比于单独使用一种深度学习方法更好的预测准确率。第七,本文提出的跨时间尺度预测模型能够进行有效的股票价格涨跌预测,尤其是本文提出的多时间尺度融合预测模型能够显著的提升预测准确率,且训练速度更快,预测准确率可以达到60.86%。第八,利用LSTM模型、CNN模型等深度学习方法相比于目前主流的HAR族波动率模型能够更有效的股票市场未来波动率进行预测。