论文部分内容阅读
近几年,随着计算机技术的迅速发展,计算机金融领域逐渐受到了广泛的关注与研究,包括量化投资、股票预测、股票聚类分析等方面。由于潜在的经济收益,股票金融市场的研究在经济、数学、工程等学科一直是个热点问题。但同时,计算机金融的研究也充满了挑战,金融数据具有非线性、高噪声、随机漂移等特点,使股票预测和投资决策等问题充满了不确定性。量化投资作为计算机金融的代表,其最核心的问题在于股价预测和投资决策。目前已经有不少机器学习方法被应用在股票的预测和投资决策任务中,例如深度学习和强化学习等等。在股票预测任务中,数据的筛选和处理尤为重要,采用不同的特征以及不同的数据处理方法将会对预测结果造成较大影响,导致交易结果不尽人意,但前期的数据工程常常受到研究者忽略。另外,投资决策通常由投资者主观决定,缺乏对金融市场的适应能力。考虑上述问题,本文中我们提出了两种量化投资框架,分别从股价预测和投资决策两方面进行研究和分析。本文所完成的研究工作主要包括:(1)股票预测任务中,通常将市场数据以及若干技术指标共同作为预测模型的输入特征。但是技术指标种类繁多,学者和投资者对技术指标的选取常常根据个人喜好与投资经验。本文通过最大信息系数特征选择方法,实现对不同候选技术指标进行衡量与评估,选择出对预测结果最有利的特征作为模型输入。同时采用卷积神经网络对每个技术指标分别进行了特征提取,防止不同技术指标信息相互干扰。(2)在采用机器学习方法预测股价时,通常采用全局归一化方式对股票数据进行归一化处理,但是当测试集中股价突破最大值或者跌破最小值时,模型将无法有效拟合股价。本文通过滑动时间窗口内局部归一化方式处理历史数据,并且预测未来时间范围内涨跌幅,有效解决股票数据越界问题。本文还证实了局部归一化方法更有利于LSTM对股票时间序列数据的预测。(3)改进了传统箱体投资策略。传统箱体投资策略基于箱体上下界的预测结果,人工制定投资策略。本文基于上述预测方法,在有效预测涨跌幅的前提下,采用强化学习方法,事先定义市场状态与行为,以试错、奖励的方式使模型在市场中自主学习投资策略,使最终学习到的投资策略更加适应股票市场,并且减少人工制定策略的工作量。