论文部分内容阅读
经济基础决定社会的上层建筑。一个社会的持续发展离不开经济的繁荣昌盛,而投资作为拉动社会经济的“三驾马车”之一更是有着不可替代的作用。自2008年金融危机以来,全球经济形势在不断变化,我国经济发展结构也面临着转型,各种因素综合致使我国资本市场的投资环境日益复杂。相比于国外,我国资本市场起步较晚,至今仅有30多年的发展历史,但其发展速度不容小觑。不管从投资金额,投资者数量还是上市公司的总量来看,我国资本市场都已经具有相当规模,资本市场的发展有力促进了我国大中小各类企业的融资及广大居民和机构的投资。而金融环境的复杂多变和计算机技术的飞速发展使得现代投资理论不断创新,传统的基本面分析和技术分析的弊端日益显现:一方面由于资本市场规模的不断扩大,基于小规模样本的传统统计模型已经无法高效处理资本市场里每日产生的海量数据;另一方面大量的投资实践表明单一基于基本面分析和技术面分析的投资策略易受投资者主观经验和各种贪婪恐惧心理的支配,增加了投资策略不必要的失败。在各种因素的综合推动下,量化投资理论开始兴起,由于其严格的纪律性,系统性,概率性及分散化特征使得量化投资策略在国内外投资市场都得到了迅速的传播。本文的研究目的是借助机器学习方法研究量化选股策略在我国证券市场的适用性。通过研究量化选股的研究现状及主流的研究方法,结合我国资本市场的发展现状,选取合适的机器学习算法对我国沪深A股市场的上市公司股票收益率进行预测。本文选用的机器学习算法是支持向量机和随机森林算法,利用2013年至2017年我国沪深两市所有A股(剔除ST股票)的年度财务数据以及对应期间股票的年度收益率,分别建立支持向量机和随机森林分类模型,采用回测的方式,分别对2015年,2016年以及2017年的股票收益率进行预测分类。根据分类结果,每年选取上涨概率最大的前10支,20支,30支股票分别建立投资组合一,组合二以及组合三,通过计算各个组合的平均累积收益率,将其与同期沪深300指数的基准收益率进行比较。结果表明,通过支持向量和随机森林算法建立的量化投资组合均跑赢了市场,每年的收益率都大大超过了同期沪深300指数的基准收益率。且比较发现,通过随机森林算法构建的投资组合市场表现要优于基于支持向量机构建的投资组合。由此可以看出,本文的研究对实际投资有很好的指导意义。