一种扩展的否定关联规则形式及其挖掘算法

来源 :贵州大学 | 被引量 : 0次 | 上传用户:wwtrust
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘,又称为数据库中的知识发现(KDD),出现于“信息丰富而知识贫乏”的二十世纪八十年代后期。之后,倍受关注,并得到广泛研究。   关联规则作为数据挖掘中的一种重要模式,在1997年由R.Agrawal等人首次提出[1],其对应的挖掘算法Apriori[2]也被提出。最初提出的关联规则是不带联结词“”的正关联规则,而且目前大部分工作都集中在正关联规则的研究上。近来,否定关联规则挖掘引起人们的注意,并证明是有用的。   1997年,S.Brin等人在[5]中首次提及否定关联。据我们所知,自那以后人们提出了三种有代表性的否定关联规则形式,并提出了三种对应的挖掘方法。但这三种形式都不够一般化,比如它们都不能表达形如“α∧b∧()(c∧d)→e∧()f∧()(g∧h∧i)”的规则形式。而且,三种挖掘方法在挖掘能力、精确性和效率上存在一些缺陷。   本文提出了一种扩展的否定关联规则形式,并提出了一种相应的挖掘算法AMENAR以挖掘扩展的否定关联规则.这种扩展形式比以往提出的形式更一般化并具有更强的表达能力,因为以往的形式都是扩展形式的特例。AMENAR是一种基于内存的算法。我们选取一种高度压缩的数据结构Patriciatire将原始数据库存放在内存中。整个挖掘过程在内存中的Patriciatrie上执行,而且只需扫描两遍数据库。另外,AMENAR算法删除了有冲突的规则和两类冗余规则.我们将AMENAR算法和以往的两种算法运行在两个数据集上。实验结果表明:AMENAR算法在挖掘能力、精确性、空间效率上都优于以前的挖掘方法。而且,当用在稀疏、简单数据库上,当minsup值高到一定程度时,AMENAR算法具有更高的时间效率。我们的工作将把否定关联规则的相关应用推广到更宽的领域。   
其他文献
随着云计算技术的发展和云存储应用的逐渐普及,越来越多的个体用户和企业用户都选择将数据存储在云端,以获取存储和管理的便利。但是云服务给人们带来经济巨大效益的同时,在
当今时代,人们对多媒体数据的需求正在不断增长,同时多媒体数据本身的内容也不断增大,如何压缩视频数据量成为多媒体技术发展的关键问题。因此,视频压缩技术成为一个重要的课题,而
随着经济和企业信息化的快速发展,国内企业对供应链管理系统需求日趋增大,供应链管理已成为企业战略性管理体系的一部分。实施供应链管理是跨越多个企业边界的复杂的任务求解过
业务驱动和网络融合的趋势下,诞生了全IP的下一代网络(NGN)模型,以实现在分组网络中采用分布式网络结构,有效承载话音、数据和多媒体业务。 基于SIP的软交换系统有分布式的系
近年来,随着多媒体视频技术和计算机网络的迅速发展,越来越多的数字信息产品通过网络这一廉价而迅速的传输手段得以广泛传播,但由此而引发的非法拷贝和恶意篡改等侵权行为引起了
数据仓库的安全性是一个非常重要的问题。不同的安全技术被用来解决这个问题。本文首先对数据仓库的安全研究进行了回顾。针对WEB环境下的数据仓库中存在的安全隐患,从数据仓
本文分为三个部分,第一部分介绍了真实感图形技术的发展概况,重点阐述了真实感图形在光照模型、光线跟踪算法等研究领域的研究成果。在第二部分,依据夫琅和费衍射理论,在几何
一直以来,宾馆、酒店的行业竞争非常激烈。在各种盛大商业活动频繁的国际化大都市,各类酒店总是希望能够有一批稳定的用户,尤其是商务用户。酒店如果能为客人提供方便的上网服务
  本文在对现有的几种典型数据库系统多级安全模型分析和比较的基础上,提出了一个新的多级安全数据模型CMLR。该数据模型继承了多个现有数据模型的优点,并重定义了完整性规则
群签名方案允许群成员以整个群的名义匿名地签名。但是,为了防止匿名的滥用,群管理者可以追踪一个群签名并将签名者的身份揭露。最近,无后门的群签名方案被提出。和基于Strong-R