论文部分内容阅读
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们利用信息技术生产和搜集数据的能力大幅度提高,而这些数据的价值往往无法充分被利用。为了解决“数据丰富但知识贫乏”的问题,数据库中的知识发现(KDD)成为了备受关注的研究领域,其中数据挖掘技术便是KDD中的一个最为关键的环节。数据挖掘是20世纪80年代末开始逐步发展起来的一个新的研究领域,它是多个学科和技术相结合的产物。数据挖掘是一门汇屎了数据库、人工智能、统计学、可视化、并行计算等不同学科和领域的交叉学科,是从海量的、不完全的、有噪声的、模糊的实际应用数据中,提取隐含在其中的,但又潜在有用的信息和知识的过程。
而在我国,股票市场数据日益膨胀,但是信息量却未能同步增长,如何运用现代先进的科学技术对股票市场的海量数据进行挖掘,寻找证券市场自身的运动规律,成为目前非常重要的研究课题。关联规则作为数据挖掘的一种重要方法,可以发现大量数据之间有趣的相关关系,抽取出对象间有价值的规则,进而揭示数据项之间的依赖关系,从而协助决策者做出相应决策。本文对相关文献进行研究综述,并在前人研究的基础上,对运用关联规则来挖掘股票市场规律的问题做了进一步的探索。
本文旨在通过关联规则来挖掘出股票市场中存在的股票上涨或下跌的规则,进而为投资者或机构提供观察市场的崭新视角。本文首先阐述了数据挖掘的发展趋势及应用现状,然后对数据挖掘中经典的关联规则方法进行了详细的说明,并研究了关联规则在股票市场的应用现状。本文核心部分,通过经典关联规则Apriori算法,对股票市场大量数据进行挖掘,共产生出120条股票间有兴趣的关联规则,并对其中具有代表性的规则进行了详细的分析、验证。验证结果表明,通过关联规则挖掘出的股票之间走势很相近,能够为投资者提供一定的投资参考。考虑到投资者更加关注买与卖时机的选择,因此本文又加入了时间参数的约束,并使用改进算法AprioriTid进行挖掘,得到了具有时间参数的关联规则,能够为投资者提供较好的投资参考。
本文的在数据处理方面进行改进,对权重股与非权重股分别设置为不同的涨跌幅阈值,并考虑了一段时间内的上涨幅度,使其更加符合客观的事实,避免了将持续小幅上涨的股票忽略掉的情况出现,更加符合市场变化。