论文部分内容阅读
关联规则作为数据挖掘的一种重要模式,已成为数据挖掘领域的一个非常重要的研究课题,侧重于确定数据集中不同属性之间的联系,找出满足给定支持度和置信度阈值的多属性之间的依赖关系。 由于现实世界是不断演变进化的,时间是那些反映现实世界信息的基本部分,因而大多数数据库应用程序都有时态的特性。时态数据挖掘作为数据挖掘的一个新的课题,引起了人们极大的兴趣,其中时态关联规则的挖掘,已经成为众多学者研究的热点之一。 本论文首先介绍了数据挖掘有关的概念、技术和研究现状,论述了时态数据挖掘及时态关联规则挖掘的研究背景和进展,给出了本文研究的内容。 时间是时态数据的重要属性,对时间进行科学的定义,有助于时态数据库中时间的表示及时态数据挖掘中时态模型的建立,所以我们引入时态型、时态因子和时间粒度等基本概念及性质。在此基础上给出一个时态关联规则的数学模型,列举几个具有实际意义的时态关联规则,最后给出事务数据库中时态关联规则的一种挖掘方法。 最后对不确定时间进行了研究,引入了不确定时间的一种表示方法,给出一种新的不确定时间的“同时”时态关系以及不确定时间的交。在此基础上,提出一种全新的适合有效时间中含有不确定时间的关联规则挖掘方法,并以病历时态数据为例,给出相应算法,最终挖掘出一些疾病间的关联关系。