流数据挖掘研究及其在股票中的应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lkm6839257
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库技术发展迅速且得到了广泛应用,但在20世纪末,一种新的应用模型却对它提出了有力的挑战。这种名为流数据的应用模型广泛出现在众多领域,例如金融应用、网络监视、通信数据管理、Web应用、传感器网络数据处理等,它是以连续的、有序的“流”的形式输入数据。股票报价数据就是这种典型的流数据,所以对它的分析处理就要利用流数据的一些分析处理方法,如滑动窗口、一次性扫描算法等。纵观当今对股票的分析与预测,基本上都是基于单个股票的分析与预测,常用的预测方法有神经网络、混沌理论、基于范例的推理等。但是股票之间必然或多或少的存在某种相关性,如果孤立的去分析一支股票,那么肯定是不全面的,本文提出的相关性理论将能较好的解决这一不足。如何挖掘出流数据蕴涵的丰富知识,成了流数据研究中的重要内容;如何挖掘出两股票间模式依赖关系;如何利用已有的模式依赖规律来预测未来的走势,这些都是本文所要研究的内容。 根据上面的分析,本文研究的内容集中在以下几点:(1)提出一种流数据相关性的计算方法,定量的计算出股票间相关性的大小,利用了流数据计算的一些方法,在有限的空间里计算出源源不断到来的股票报价数据的相关性。 (2)在相关性的基础上进行模式依赖挖掘。如果发现两股票间的相关性大,就对它进行模式依赖挖掘。由于两相关性大的股票间的某些模式依赖有时并不是同步出现的,往往会呈现出一定的时间延迟,所以在进行模式依赖挖掘的过程中,除了要挖掘出同步的模式依赖,还要挖掘出具有一定时间延迟的模式依赖,并将挖掘出来的规则存入到知识库中,以便需要时利用。 (3)利用已挖掘出的模式依赖进行股票模式的即日监测,用户可以在PDA(我们是用SmartPhone来模拟的)上实时了解股票间模式的最新变化。 (4)利用已挖掘出的模式依赖进行股票的短期预测,就是去发现在两股票相关性大的情况下,一种股票出现一种特定模式时,另一股票将会出一种什么样的模式。 本文提出的在相关性的基础上挖掘股票间的模式依赖,并利用移动设备进行即时的观察和监测,是一种典型的移动数据挖掘,它的提出是对股票研究的有益探讨,实验证明,相关性大的股票间挖掘出的模式依赖规则对短期股票的预测准确率较高。
其他文献
随着群体动画仿真技术的迅速发展,使其在各个领域中得到了广泛应用,如安保救灾训练系统、计算机游戏与动画、数字城市展示等。但是人们也对群体动画仿真提出了更多更高的要求:更
垃圾邮件已成为互联网的一大公害,必须治理垃圾邮件。传统的反垃圾邮件技术、邮件身份认证技术以及电子邮资技术均存在不足,它们不能有效治理垃圾邮件。治理垃圾邮件的关键问题
工作流管理系统被称为信息管理系统的第四次分离变革,它提供了一个快速的开发、部署和运行平台,能够把企业的内、外部业务无缝地整合在一起,并被广泛应用于电子商务、协同办
随着软件的复杂度和规模不断增长和扩大,业界对于软件的可复用性和可维护性的要求也越来越高。基于组件的软件工程因其具有较高层次的可重用性和可维护性,因而成为了近年来软
网格技术的应用是目前研究的一个热点,随着基于网格架构的应用系统和技术的不断出现,人们将网格应用到了更加广泛的领域中。在分布式应用系统中应用消息交互服务机制可以实现
揭示人类的行为规律一直以来都是社会各界备受关注的话题。科学家更在意惊艳世人的发现,商人则将之用于提高商品推荐的效果,而且它对于公共安全管理也有着非常积极的作用。近年
今天,人脸检测的应用背景已经远远超出了人脸识别系统的范畴,在基于内容的检索、数字视频处理、视觉监测等方面有着重要的应用价值。人脸检测是自动人脸识别系统中的一个关键环
在时间规划中,时间模型是一个重要的概念。时间规划的算法均要建立在一定的模型之上。时间模型多种多样,各有特色,本文中的时间规划运算使用了时间矩阵模型,时间规划可以用矩
随着增值业务的复杂化和用户需求的多样化,人们需要快速的业务定义生成工具方便灵活地增加新业务,提供丰富多样的电信增值业务。本课题的工作是针对增值业务图形化业务流程定义
可缩放矢量图形ScalableVectorGraphics(SVG)是一种使用XML描述二维图形的语言。由于其各方面的优点,SVG文件格式成为网络传播图形信息的一种理想的文件格式。SVG文件记录了实