论文部分内容阅读
多输出混频预测模型是本文提出的新模型,指自变量和因变量间时间统计频率不一致的模型,其中,自变量之间既可以是同频,也可以是混频,因变量是同一目标值在连续时间序列点上的输出值,它们之间为同频。多输出混频预测模型是本文所构建一系列模型的总称,分为一元、同频多元和混频多元多输出混频预测模型。该系列模型目的在于解决经济领域中客观存在混频数据和多输出的问题。在二十一世纪“信息化、网络化、智能化”程度不断加深的背景下,可获得各个领域数据的途径迅速增加,获得成本也不断降低,我们获取多项数据的条件变得更加现实,充分利用多项数据对经济进行预测成为必然。在需要用于预测的自变量数据中往往统计时间频率不一致,或者和因变量数据之间存在频率差异,即出现混频数据。其中,当自变量为时间频率统计较低的变量,而因变量为时间频率统计较高的变量时,出现多输出问题。但目前针对混频数据预测模型的研究成果中,一般都为自变量数据和因变量数据之间频率不一致,极少涉及自变量间频率不一致的情况;低频变量预测高频变量时,并未涉及多输出问题;混频数据研究和多输出研究是两个相对独立的研究领域,多输出方法中也未涉及混频数据的使用。研究多输出混频预测模型,研究过程综合以传统计量为基础的混频数据模型、先进的机器学习方法中的多输出支持向量机模型、先进的搜索最优参数的遗传算法等方法和应用,解决经济领域中同时存在变量数据频率不一致和多输出的问题。本研究主要内容包括: ⑴建立多输出混频预测模型。时间频率统计不一致的数据大量存在,当人们已获得某项频率数据的结果后,倾向于得到更高频率的预测结果,同时在经济领域,面临不少自变量为低频数据而因变量为高频数据的客观事实,当低频变量预测高频变量时,出现多输出问题。为解决以上问题,本文先从建立一元模型入手,首次将混频数据模型和多输出问题融合,构建一元多输出混频预测模型。该模型中,自变量与因变量间频率不同,但输出的多个因变量频率相同。一方面,人们在对某项事物进行预测时,会着重考虑某单一重要因素对它的影响或它们之间的相互关系,另一方面,在此前的文献中,并未见到混频数据方法中同时考虑多输出问题的研究,也未在多输出方法领域见到包含混频数据的研究。基于以上两方面原因,借鉴混频数据模型中最为经典的MIDAS系列模型之一U-MIDAS模型和研究多输出模型中先进的多输出支持向量机模型,将两者有机结合,首先建立一元多输出混频预测模型,同时给出模型参数优化方法和系数估计方法。该模型吸收两者优点的情况下,还克服了U-MIDAS模型仅在频率差异较小时适用的缺点。最后将该模型用于中国和美国的股票市场和房地产市场,预测股票指数和房地产指数,通过实证,与单输出混频模型对比,说明本文提出的模型更具优势。 ⑵构建同频多元多输出混频预测模型。大量研究文献已证明,多元模型比一元模型具备更优的预测能力。影响事物的因素众多,且各种因素之间存在错综复杂的联系,它们的变化产生的结果又具有不确定性,需要运用一定的方法对结果作出科学的预测。采用U-MIDAS模型,融合多输出支持向量机,构建同频多元多输出混频预测模型,同时给出相应的参数优化和系数估计方法。在该模型中,多个自变量之间的频率是一致的,输出的多个因变量之间频率也是一致的,但自变量和因变量之间频率不同。最后对不同市场的股票指数和不同国家与地区的房地产指数进行预测,同多元单输出混频模型对比,证明该模型的可行性和优越性。 ⑶构建混频多元多输出混频预测模型。这也是本文最大的创新点。任何事物的发展趋势都同时由多方面因素决定,且各方面的因素可能存在数据统计时间频率不一致的情况,即自变量间存在混频数据。此前的文献大多针对同频自变量进行研究,其中的原因之一是无法解决自变量之间频率不一致的问题。即便是混频数据模型中,也极少见到关于自变量之间频率不一致的问题。有学者先构建多个基本一元MIDAS模型,每个一元模型的自变量频率不同,但都针对同一个因变量,之后再进行模型组合。尽管这样做解决了自变量间不同频率的问题,但显然组合模型的方法忽略了自变量之间的关系以及对因变量的综合影响。构建一个混频多元多输出混频预测模型具有很强的现实意义和学术价值。本文最终将构建一个混频多元多输出混频预测模型。该模型融合U-MIDAS模型和MSVM模型,但解除了U-MIDAS模型只适用于变量间频率差异较小的限制,还解决了由于频率增加带来的参数估计效率低等问题。实证表明,该模型具有更强的预测能力。该模型极大的扩展了混频数据模型和多输出模型的理论和应用范围。