论文部分内容阅读
目前中国股票市场上有两千多只股票,每天产生海量的金融数据,股票投资者渴望得到有效的投资信息,从中筛选出有获利潜力的股票来构建有效的投资组合。为了解决如何从大量的股票中筛选出有获利潜力的股票这个问题,量化选股已经成为投资决策研究领域的热点问题。由于股票市场是一个高维、非线性、多噪音的复杂系统,传统的线性模型已经不能很好地解决这类问题。本文针对这些问题在量化选股领域,构建相应的以价值投资为导向的财务指标体系和引入先进的数据挖掘方法,进行如下研究工作:以股票选取作为研究对象,基于价值投资的视角。首先,根据对早期文献的研究,分别选取上市公司6大类16项财务指标作为输入特征变量,分别为每股价格合理性、盈利能力、财务杠杆水平、资产流动性、资金使用效率以及公司的成长能力。其次,由于这些财务特征变量中存在着冗余的信息,为了让投资者能真切地看到每个财务指标对股票收益的影响,本文选取组合算法中的随机森林算法(RF),对财务指标进行评价,筛选出重要的财务指标。第三,结合股票市场的高维复杂性,由于支持向量回归机(SVR)在处理高维非线性的优越性能,并作为基本的方法框架,并利用全局搜索算法中优越的量子遗传算法(QGA)对支持向量回归机进行动态的参数寻优,分别对支持向量回归机的惩罚因子c、核参数g以及松弛变量p进行深度优化,为了验证研究量子遗传算法(QGA)对参数的优化程度,与遗传算法进行比较,保证支持向量回归机(SVR)的精确效果。第四,将支持向量回归机(SVR)与随机森林(RF)和量子遗传算法(QGA)结合起来,构建综合选股模型流程RF-QGA-SVR。第五,本文以A股市场市值最大的前200只股票2003到2014年的数据作为实证对象,利用建立的RF-QGA-SVR模型对股票收益进行预测,根据预测的结果进行排序,构建投资组合,分别筛选出前10、20和30只股票组合,与市场基准的组合收益进行比较,从而得出构建的综合模型RF-QGA-SVR的有效性,在股票选择的过程中,对上市企业的财务指标进行总结归纳,对财务指标重要性进行度量,并期待得到的财务指标考量顺序和RF-QGA-SVR综合选股模型在实际的投资环境中能够为价值投资者提供科学选股的思路。