论文部分内容阅读
由于股票价格时间序列本身的复杂性、多样性和善变性,影响其变化的因素众多,有些因素是可以度量的,而有些因素却难以量化,很难科学的计算和评价,因而研究难度较大。为此我们引入了通信理论数据分析方法,尝试利用通信理论相关知识对量化交易市场进行解释和建模。这为金融时间序列分析开阔了新的思路。本文以通信理论为基础,结合当前通信理论与机器学习数据挖掘方向的发展成果进行进一步的研究。本文将量化交易过程分解为两个部分进行研究。其一是对金融价格时间序列的特征选择研究,其二是对金融价格时间序列的趋势预测的研究。首先,特征选择作为数据挖掘、机器学习相关的关键技术,它可以有效地提高机器学习的准确性和算法的效率。然而,随着数据维度的不断增加,对现有的特征选择方法在有效性和效率方面都提出了严峻的挑战。最大相关性是变量之间相关性的有效度量。针对特征选择的研究,我们提出了一个改进的网络最大相关(NMC)模型。它可以快速有效地计算出特征集与标签变量之间的统计依赖关系。此外,我们基于递归特征消除(RFE)算法,进一步提出了一种新的NMC-RFE特征选择方法。其次,基于观察数据的预测是数据分析的主要目的之一,这在量化交易市场中显示出巨大的影响。机器学习数据挖掘被广泛采用来处理这个问题。在本文中,我们将基于贝叶斯网络模型来对此问题进行建模和解释。同时,基于通信理论数据分析,我们将数据变量之间的关系模拟为一种广义社会网络,从一个数据变量到另一个数据变量的直接因果关系等同于通过通信信道的信息传递。因此,基于数据变量的预测可以最大限度地利用通过通信信道传送的信息。我们用金融市场数据说明,使用这种简单的方法有着良好的表现。