基于数据挖掘技术的A股股价涨跌预测模型研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:kuanhezyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中国经济的发展与进步,中国证券市场受到越来越多人的关注,股票已经成为广大投资者进行投资的重要途径。影响股票涨跌的因素很多,其收益若能成功预测,可以有效规避股票投资风险以及消除盲目投资的弊端。本文从构建选股因子指标池出发,接着运用随机森林算法和递归特征消除算法从因子指标池中筛选出合适的因子指标构成指标体系;再根据相应公式计算出股票收益,并将其分为两种状态(涨、跌),将选股研究简化为二分类问题;接着使用样本数据对SVM模型以及BP神经网络模型进行调参处理,挑选出最合适的弱分器,最后分别将SVM模型和BP神经网络模型与AdaBoost模型结合,构造出SVM_AdaBoost模型和BP_AdaBoost模型对股票盈亏进行预测,帮助解决股票投资选择问题。本文首先介绍了A股市场的背景知识,概述了国内外已有的部分研究方法,分析了现有的几种股票预测模型;接着介绍了随机森林算法、递归特征消除算法、SVM模型、AdaBoost模型以及BP神经网络的相关知识;随后对因子池中的五个方面的因子进行了相关阐述。实证环节中选取了A股作为实证研究对象,首先验证了随机森林算法和递归特征消除算法在特征挑选上的可行性,接着分别验证了RBFSVM在不同核函数下的预测表现以及BP神经网络的表现情况,实证表明除了sigmoid-SVM算法表现较差之外,其他分类器均具有不错的性能。然而单一的SVM和BP神经网络模型表现不稳定,为改善这种情况,本文引入AdaBoost算法,构造了SVM_AdaBoost模型和BP_AdaBoost模型。混合模型具备了两方面模型的优势:混合模型可以减少SVM选择核参数的复杂度以及BP神经网络学习率和隐藏层节点选择的问题,而SVM核参数的多样性和BP神经网络的结构特性、学习率以及初始权值导致的多种解使得SVM模型和BP神经网络模型能够训练出多种弱分类器;最后通过AdaBoost能够结合多个分类器和关注错分类样本的特性构造出强分类器,用于对股票收益进行预测。实证结果表明,SVM_AdaBoost模型和BP_AdaBoost模型均比原有的SVM模型以及BP神经网络模型在预测精度上有了一定程度的提升,其中SVM_AdaBoost模型表现最优秀。但是上述模型均存在不稳定的现象,所以还需要针对这一问题进行进一步研究,使得SVM_Ada Boost模型和BP_AdaBoost模型在进行股票涨跌预测时获得更好的效果。
其他文献
小微企业在增加税收收入、创造就业岗位、稳定社会秩序、促进科技进步和推动经济发展等方面起着不可忽视的作用。国家十分重视并积极扶持小微企业的发展。为提升小微企业的创新创业能力,国家在税收等方面给予小微企业众多优惠政策,支持各类群体创办小型微型企业,帮助企业开拓市场。在经济新常态的大背景下,国内金融体制改革的不断推进,利率逐渐市场化,国内银行整体面临着前所未有的巨大压力,且行业竞争的趋势日益严重,目前农
目的评价心先安治疗病窦综合征的疗效及治疗价值.方法将80例病窦综合征患者分成治疗组和对照组,两组分别静脉滴注心先安、阿托品,比较两组临床症状、动态心电图和食道电生理
股利政策是上市公司的重要财务决策之一,直接影响投资者权益,对公司未来发展有着长远意义,对建造井然有序的资本市场也能添砖加瓦。上市公司的成长离不开股利政策的实施,资本市场的健康发展也不能缺少规范合理的股利分配。留存收益和股利分配如何合理安排,是上市公司管理者十分重视的一个问题。近年来,我国上市公司“滥送转”情况屡见不鲜,“高送转”不再像实施之初,只是经营状况良好的公司选择的股利政策。中电电机是一家上
在计算机视觉领域,商标检测是一个备受关注的问题,在版权监控、广告投放、精准营销等领域有广泛应用。如果能精准高效的识别商标,则能开发出许多有商业价值的相关应用。但是目前的商标检测需要大量的标注数据,而人工标注数据成本高昂、标注难度大;而且自然场景图片背景复杂,商标通常只占图片的一小部分且形状多变,检测难度高。本文针对图书图像,识别图书中的商标,为图书的版权监控提供依据,并围绕以下两方面提升商标检测的
介绍了对金溪航电枢纽工程枢纽建筑物的布置型式、结构体型及导流方式等进行的合理优化,节约了投资、加快了施工进度,为类似工程积累了经验。阐述了该工程的主要技术特点。