论文部分内容阅读
随着中国经济的发展与进步,中国证券市场受到越来越多人的关注,股票已经成为广大投资者进行投资的重要途径。影响股票涨跌的因素很多,其收益若能成功预测,可以有效规避股票投资风险以及消除盲目投资的弊端。本文从构建选股因子指标池出发,接着运用随机森林算法和递归特征消除算法从因子指标池中筛选出合适的因子指标构成指标体系;再根据相应公式计算出股票收益,并将其分为两种状态(涨、跌),将选股研究简化为二分类问题;接着使用样本数据对SVM模型以及BP神经网络模型进行调参处理,挑选出最合适的弱分器,最后分别将SVM模型和BP神经网络模型与AdaBoost模型结合,构造出SVM_AdaBoost模型和BP_AdaBoost模型对股票盈亏进行预测,帮助解决股票投资选择问题。本文首先介绍了A股市场的背景知识,概述了国内外已有的部分研究方法,分析了现有的几种股票预测模型;接着介绍了随机森林算法、递归特征消除算法、SVM模型、AdaBoost模型以及BP神经网络的相关知识;随后对因子池中的五个方面的因子进行了相关阐述。实证环节中选取了A股作为实证研究对象,首先验证了随机森林算法和递归特征消除算法在特征挑选上的可行性,接着分别验证了RBFSVM在不同核函数下的预测表现以及BP神经网络的表现情况,实证表明除了sigmoid-SVM算法表现较差之外,其他分类器均具有不错的性能。然而单一的SVM和BP神经网络模型表现不稳定,为改善这种情况,本文引入AdaBoost算法,构造了SVM_AdaBoost模型和BP_AdaBoost模型。混合模型具备了两方面模型的优势:混合模型可以减少SVM选择核参数的复杂度以及BP神经网络学习率和隐藏层节点选择的问题,而SVM核参数的多样性和BP神经网络的结构特性、学习率以及初始权值导致的多种解使得SVM模型和BP神经网络模型能够训练出多种弱分类器;最后通过AdaBoost能够结合多个分类器和关注错分类样本的特性构造出强分类器,用于对股票收益进行预测。实证结果表明,SVM_AdaBoost模型和BP_AdaBoost模型均比原有的SVM模型以及BP神经网络模型在预测精度上有了一定程度的提升,其中SVM_AdaBoost模型表现最优秀。但是上述模型均存在不稳定的现象,所以还需要针对这一问题进行进一步研究,使得SVM_Ada Boost模型和BP_AdaBoost模型在进行股票涨跌预测时获得更好的效果。