论文部分内容阅读
伴随着金融市场快速发展,金融时间序列的结构及变量间的相关模式愈加复杂,增加了相关性分析的难度和重要性。传统的时间序列及其相关性研究方法包括ARMA模型、协整模型、向量自回归模型、GARCH模型、Copula模型等,每种方法都有其适用性与局限性。本文将生物信息学中的序列比对方法引入金融时间序列相关性分析中,不仅推广了序列比对方法在生物以外领域的应用,而且对于拓展金融时序数据相关性分析方法做了有利尝试。该方法将连续数值型变量按照区间划分为离散的符号型变量,增加了对异常点的容忍度,抑制了噪声,捕获了变量的大尺度特征;通过对符号化序列进行比对,可以从关键特征、趋势等角度挖掘系统的隐含模式,且无需过度的前提假设。 首先,本文在已有简单打分矩阵的基础上,提出了两种用于金融序列比对的打分矩阵,即相似度导向型矩阵和目的导向型矩阵,前者侧重于反映历史数据信息,可用于发现序列的对应模式,后者考虑对序列进行比对的目的,可用于提取序列的特征片段。为论证用两种打分矩阵进行序列比对的适用性,本文构造了不同特征的实验数集进行数值模拟,结果表明序列比对方法可用于搜索序列中的插入、删除、替换点,或用于发现两条时间序列的领先滞后关系或相对稳定的匹配模式等。 接着,本文对上证综指和深证成指的涨跌特征及相关性进行了实证研究,并检验了模型对符号定义阈值的敏感性。相似度导向型矩阵表明两指数同时下跌比同时上涨的概率大;同时暴跌(涨)的概率比同时小幅下跌(上涨)的概率大。用目的导向型矩阵进行序列比对的结果表明:对于单个指数,暴跌时的集聚效应比暴涨时更强,暴跌比暴涨更容易持续,说明利空消息对市场的影响时间较长,而利好消息对市场的影响时间较短;对于两个指数,暴跌时段的重合率比暴涨时段的高,沪深股市之间存在非对称的尾部相关,暴跌时的相关性较暴涨时大。当研究的是指数的暴涨暴跌(或大涨大跌)这种极端情况下的特征及相关性时,对模型做敏感性分析,结果是稳健的。 最后,本文构建了基于序列比对方法识别股市收益率序列相关模式的模型,并用其进行预测及检验。实证分析中将模型用于识别沪深300指数5分钟收益率序列中的特殊模式,即收益率序列中特殊片段后下一时刻发生大涨或大跌的情况;根据识别出的特殊模式做预测和检验,结果表明基于序列比对方法进行相关模式识别和预测时,需要在预测的正确率和能识别出的片段的数量之间进行权衡,且模型对样本量有一定的要求;但整体来看,模型是可行的。在现实投资中,如果符号化收益率的序列片段和识别出的特殊片段相同,则可以预测下一时刻股票价格将发生大幅波动,从而起到预警作用,因此,该模型具有一定的实践意义。 数值模拟和实证分析得到了良好的研究效果,印证了应用序列比对方法分析金融领域相关性问题的可行性和有效性。