论文部分内容阅读
数据库技术发展迅速且得到了广泛应用,但在20世纪末,一种新的应用模型却对它提出了有力的挑战。这种名为流数据的应用模型广泛出现在众多领域,例如金融应用、网络监视、通信数据管理、Web应用、传感器网络数据处理等,它是以连续的、有序的“流”的形式输入数据。股票报价数据就是这种典型的流数据,所以对它的分析处理就要利用流数据的一些分析处理方法,如滑动窗口、一次性扫描算法等。纵观当今对股票的分析与预测,基本上都是基于单个股票的分析与预测,常用的预测方法有神经网络、混沌理论、基于范例的推理等。但是股票之间必然或多或少的存在某种相关性,如果孤立的去分析一支股票,那么肯定是不全面的,本文提出的相关性理论将能较好的解决这一不足。如何挖掘出流数据蕴涵的丰富知识,成了流数据研究中的重要内容;如何挖掘出两股票间模式依赖关系;如何利用已有的模式依赖规律来预测未来的走势,这些都是本文所要研究的内容。
根据上面的分析,本文研究的内容集中在以下几点:(1)提出一种流数据相关性的计算方法,定量的计算出股票间相关性的大小,利用了流数据计算的一些方法,在有限的空间里计算出源源不断到来的股票报价数据的相关性。
(2)在相关性的基础上进行模式依赖挖掘。如果发现两股票间的相关性大,就对它进行模式依赖挖掘。由于两相关性大的股票间的某些模式依赖有时并不是同步出现的,往往会呈现出一定的时间延迟,所以在进行模式依赖挖掘的过程中,除了要挖掘出同步的模式依赖,还要挖掘出具有一定时间延迟的模式依赖,并将挖掘出来的规则存入到知识库中,以便需要时利用。
(3)利用已挖掘出的模式依赖进行股票模式的即日监测,用户可以在PDA(我们是用SmartPhone来模拟的)上实时了解股票间模式的最新变化。
(4)利用已挖掘出的模式依赖进行股票的短期预测,就是去发现在两股票相关性大的情况下,一种股票出现一种特定模式时,另一股票将会出一种什么样的模式。
本文提出的在相关性的基础上挖掘股票间的模式依赖,并利用移动设备进行即时的观察和监测,是一种典型的移动数据挖掘,它的提出是对股票研究的有益探讨,实验证明,相关性大的股票间挖掘出的模式依赖规则对短期股票的预测准确率较高。