机器学习方法在股指涨跌预测中的应用研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:zhongnanhai10mg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股票市场作为金融市场最重要、最复杂的组成部分,兼具着反映整体市场的变化趋势和反映国民经济总体发展水平的功能,同时为投资者投资决策提供重要的参考价值,是灵敏反映市场社会、政治、经济变化情况的晴雨表。然而,股票市场在多重因素的影响下,市场指数价格序列时常出现异常波动,使得传统的分析方法很难预测股价的走势。随着机器学习方法在分类和预测问题上凸显越来越大的优势,本文尝试将机器学习应用于股指预测问题上。
  首先,本文简单介绍了三种机器学习方法——支持向量机(SVM)、随机森林(RF)和极端梯度提升树(XGBoost)算法的理论知识。接着,利用这三个机器学习模型构建了用以预测股票指数价格涨跌的模型。考虑到机器学习在处理大数据上的优势,本文选取了沪深300指数5分钟高频交易的行情数据作为研究对象,以其开盘价、收盘价、最高价、最低价、成交量和成交额6个变量作为SVM、RF、XGBoost三个机器学习模型的特征输入,下一五分钟收盘价的变动方向作为输出特征,建立了股指涨跌预测模型。并采用常见的准确率指标、ROC曲线和AUC统计量作为各机器学习预测模型的性能度量指标。
  其次,考虑中国股市各方面条件尚未成熟,股价受到的干扰因素较多,股价波动大,噪声较多,本文提出了基于高斯降噪的机器学习预测模型,在机器学习预测前先对原始数据进行了高斯降噪处理,将股票价格时间序列中的一些异常信号去除,减少了干扰项,然后将经降噪处理的样本数据作为机器学习模型的特征输入,输出特征保持不变,建立了更具较强分类性能的预测模型。
  通过对比分析降噪前后三种机器学习算法的预测性能发现,降噪后各机器学习方法的分类性能有了显著的提升。具体来看,降噪后支持向量机的预测准确率、AUC值分别为62.80%、0.620,比降噪前分别提高了22.92%、21.33%;极端梯度提升树的准确率、AUC值分别为70.85%、0.705,比降噪前分别提高了35.67%、35.06%;随机森林的预测准确率近75%,AUC值为0.745,比降噪前分别提高了约46%、45.22%。各模型的预测准确率相比降噪前均更高,即预测效果更好,分类性能更优,充分验证了降噪后的三种机器学习模型在股指涨跌预测问题上的有效性。不仅如此,降噪后随机森林预测的准确率相对支持向量机提高了19.31%,相对极端梯度提升树提高了5.76%,降噪后的随机森林预测模型在股指涨跌预测中表现出了十分显著的分类性能优势。
  最后,本文基于自身研究的不足之处提出了今后的研究方向:将更多影响股票价格的因素纳入机器学习的输入特征中,继续深入研究;更加深入机器学习的理论知识,使模型发挥其最大的优势。
其他文献
在制造业方面,中国已经是世界大国,但距离实现“制造强国”还有很长一段路要走,价值链分工地位偏低是我国制造业发展面临的主要局限。产业集聚是生产活动最为突出的空间特征,产业集聚可以显著地推动经济增长,代表一国竞争优势,产业集聚区在经济一体化发展过程中通过多条路径参与全球价值活动分工。2017年,中共十九大明确表明要发展众多优秀制造业集群来提升我国产业全球价值链分工地位,这表明两者存在一定程度的内在关联
学位
随着我国资本市场的飞速发展,居民储蓄率逐渐提高,证券投资基金逐渐发展成为我国居民理财工具的重要组成部分,大量的资金涌入基金行业,良好的运行机制是基金行业优化资源配置的重要保证。而现实中,基金经理跳槽率高居不下,基金管理公司也爆出频频丑闻,问题的背后是对基金经理监督的缺失,基金管理公司的治理结构不合理,整个基金行业激励机制的缺失,而基金行业的特殊的双重委托代理冲突是缺乏有效激励机制的根本原因。在这种
零工经济并不是一个新出现的名词,传统意义上的零工经济存在已久,本文提出的零工经济是伴随着移动互联网技术产生的,在当前“互联网+”的时代背景下,企业的组织管理向平台化的方向转变,越来越多的劳动者能够以更加灵活的就业方式获取工作报酬,零工经济不仅将资源的供给方和需求方高效匹配,还促进了传统产业的变革,推动了新兴产业的发展,创造了大量的就业机会,增加劳动者的收入。  在此次疫情期间,各类平台企业不仅以“
线性模型可以近似描述生物、医药、经济、管理、地质、气象、农业、工业、工程技术等领域的现象。它在现代统计学中得到了最为广泛的应用。在假定误差协方差阵为σ2In的情形下,通常使用最小二乘估计法来估计线性模型的回归参数。但是在许多情况下,线性模型的误差协方差阵具有形式σ2Σ,并且Σ往往包含未知参数。由Gauss–Markov定理可知,广义最小二乘估计是最佳线性无偏估计,并且广义最小二乘估计要优于最小二乘
我国要从制造大国转变为制造强国,迫切需要提升制造业技术创新能力。2018年近一半的外商直接投资(FDI)流向制造业,极大的促进了我国制造业技术创新。然而,外资企业通过设置高额专利转让费用、高薪吸引我国技术人才的方式抑制我国制造业技术创新,采取独资化手段抵消FDI带来的技术溢出效应。如何有效利用FDI促进我国制造业技术创新成为企业界和理论界思考的重要问题。  国内外学者主要从FDI对技术创新的总体效
自全球金融危机之后,世界多个发达经济体实施了宽松的货币政策以挽救经济,日本也在其列。在政策未取得良好的效果后,日本央行开始了负利率政策的大胆尝试,成为亚洲第一家推出负利率的中央银行。而中日经贸合作关系密切,日本国内货币政策的变动可能会给我国产出带来溢出效应。  作为最早提出量化宽松货币政策的国家,日本的货币政策在长期以来都受到国内外学者的关注。但各国学者多注重对日本货币政策的实施效果、国内的传导机
学位
随着我国经济社会的发展和城市化进程的加快,以北京市为代表的我国大中型城市,普遍存在通勤高峰时段的城市道路拥堵现象。道路拥堵问题已经成为城市交通可持续发展亟待解决的问题。拥堵收费作为解决拥堵问题最直接、最有效的手段之一,难以实行和推广。多数大城市尚处于该项政策的观望、学习、研究阶段。究其原因,一方面,公众对拥堵收费的支持程度往往影响着政府的政策取向,拥堵收费容易遭到公众的反对而被搁置。另一方面,拥堵
学位
北京市近年来积极进行产业疏解与人口疏解,有效降低了人口增速,缓解环境问题与资源紧张问题。同时北京市也在加大高精尖人才的引进力度,此举明显地促进了北京市产业结构的高端化与人才素质的高端化。但是,低技术的劳动密集型劳动力供给由于人口疏解政策的波及正在变少,而此类服务的生活需求却并未明显减少,所以其服务价格快速增加,增加了城市成本,也不利于高技术人才更有效率地发挥其应有的劳动生产率。  其实特大城市中的
学位
随着2013年中国铁路实行政企分开的改革,如何认定铁路运输服务和项目的公益性以及如何使公益性变得更有效是深化中国铁路改革亟待解决的问题,但已有的学术和政策研究中,对于中国铁路公益性运输的定义、认定和补贴机制等多为较为抽象和模糊的定性研究,更缺少应用实际数据进行的落地性定量研究,影响了研究结果的科学性、可靠性和可操作性。因此,研究中国铁路公益性运输的认定机制以及补贴方式具有理论和现实意义。  本文基
学位
近十年来中国经济高速增长,金融机构越来越多,信贷规模在投资驱动的新经济增长模式下迅速扩张,加上经济下行趋势和利率市场化因素二者的叠加影响,企业信用风险日益增加。中国银监会最近公布了2019年商业银行不良贷款率高达1.81%,是最近7年最高的不良贷款率,比2018年的高出0.14%。因此应当建立企业信用风险评估体系和评估模型,帮助银行降低信用风险,科学的指导银行对贷款的发放和预防,也可以促进中国经济
学位