论文部分内容阅读
如今,基于数理统计模型的量化投资技术得到了充分的发展和应用,投资者基于此类方法可获得较大回报。机器学习、深度学习算法随着AI时代的到来被应用到各个领域。这些前沿算法可以实时处理海量的数据,模型也能取得不错的拟合效果,同时泛化能力也得到大幅提升。在本论文中,尝试将这些前沿算法应用到股票市场中,分别采用机器学习中的XGBoost方法与深度学习中的LSTM方法对股票调整收盘价预测,并对拟合效果进行对比。首先,本文介绍了机器学习和深度学习的概念、应用、模型的优化方法,接下来介绍了数据的来源与特征工程的概念。实证目标是利用前N天的数据(即预测范围大于等于1)对Vanguard Total Stock Market ETF(VTI)每天的调整收盘价进行预测。文章中用到的的数据是基于VTI的历史价格:自2015.11.25至2018.11.23。其次,基于金融时间序列预测具有不确定性、复杂性与时间记忆性的特点,本文提出了使用机器学习算法的构建的XGBoost模型与使用深度学习算法的构建的长短期记忆神经网络模型,在股票数据中提取特征作为模型的输入,同时将上面两种模型与lastvalue、移动平均法、线性回归方法对比,所选取的对比指标为均方根误差(RMSE)与平均绝对百分比误差(MAPE)。最后,在阐述特征缩放对模型预测结果具有重要性的基础上,把缩放后的序列集合用于模型训练。随后,选用五种算法对验证集进行预测并对比预测成效,结果显示XGBoost具有最好的特征选择与预测成效。