论文部分内容阅读
本篇论文中的量化策略是基于动量效应,即指在一段时间内股票价格的变化会保持原由走势持续一段时间。随着学者们对动量效应的深入探究,在实证中发现不仅在成熟的欧美市场中存在,较多新兴市场也存在着显著的动量效应。本文主要是研究如何将动量效应与机器学习算法相结合,构建基于机器学习的模型从而预测股指。通过该模型,从沪深300指数信息中得到有效的买入信号,根据有效信号,买卖沪深300成分股中根据动量效应所筛选出的前十只股票,最终获得超过市场的超额收益。将传统金融理论与机器学习相结合,这充实和加深了现有的量化投资策略,同时也给其它金融理论的引进提供了良好的思路和借鉴。本文选取沪深300股指2008年1月至2018年12月中每个交易日数据作为数据样本,并将其中75%的数据样本作为训练集,即其中2008年至2016年3月的数据作为模型参数训练样本,将剩下25%的数据样本作为测试集,即2016年4月至2018年末的数据作为训练集样本外的测试集数据。当中模型构建流程主要分为数据分类、缺失数据处理、模型构建、模型参数优化与结果分析五个部分。回测结果表明,在不同效应形成期下,测试集数据中持有期(一天)内的累计收益率出现明显差异。当效应形成期为日内时,该策略无法获得正向收益;当效应形成期为一个礼拜时,该策略可获得218.52%的三年累计收益率;当效应形成期为半个月时,该策略可获得187.32%的三年累计收益率;当效应形成期为一个月时,该策略可获得163.07%的三年累计收益率。本文的研究结论充实了国内研究市场动量效应领域,具有较为深刻的借鉴意义,并为相关市场监督者与投资者提供一定的参考。