论文部分内容阅读
在中国,研究股票收益率的方向对于股市投资者具有重要的参考意义,尤其对于散户投资者而言。方向预测实际上是一个二元选择问题,通常采用Logistic二元选择模型进行预测,但是传统的参数模型在预测时需要对模型做出预先假设,而非参数模型则很好地解决了这一问题,而且能够较好地捕捉金融市场这种复杂系统的特性。因此本文基于非参数方法对股票收益率方向的预测进行研究。在经济发展的同时,互联网也在快速成长,对于信息的挖掘不再局限于原有的结构化数据,利用网络异构数据进行大数据分析被广泛应用于各个领域。近年来,“金融大数据”、“互联网金融”等词汇层出不穷,网络平台成了一个信息交换、表达情感之所,然而互联网信息大多以文本形式存在。在金融领域,文本化的财经新闻涵盖了许多股票市场的重要信息,因此从财经新闻角度出发研究股票收益方向,具有重要意义。Harvey&Oryshchenko(2012)提出了时变密度函数估计理论,并将此理论应用于NASDAQ指数密度的估计,结果发现该方法可以充分地反映出金融资产的特性。Gu等(2018)基于此提出了一个时变因子加权非参数密度函数模型(F-TVF)。本文将财经新闻作为研究对象,首先构建财经新闻词典,并基于此来构建情感指数,将其加入到F-TVF模型当中。由于准确率作为评价标准的不确定性,本文引入评分规则同作为评价标准,为使预测结果具有较高的准确性以及评分,本文基于两种分数规则构建了一个新的预测模型——分数加权模型。本文以上证综指每日收盘价为研究样本,分别采用Logistic模型、基于时变密度函数估计理论的时变非参数密度函数模型(TVF)、加入影响因子的时变因子加权非参数密度函数模型(F-TVF)、以及基于分数规则的分数加权模型对股票收益率方向进行了预测,并模拟了交易策略。结果显示财经新闻情感指数与收益率具有相关性,并且基于情感指数的F-TVF模型预测效果相对于传统的Logistic模型以及TVF模型都有了显著的提升,而分数加权模型预测效果最优。