关系数据挖掘的正负关联规则挖掘算法

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:xiaokun787
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库技术的逐渐成熟、网络技术的迅速普及和计算机硬件的不断出新,使人们采集数据的能力得到了极大的提高,从而导致了全球范围内数据存储量的急剧增大。为增强人们对这些海量数据的理解能力,数据挖掘技术近年来得到了快速发展。关联规则挖掘是数据挖掘的重要内容之一,1993年由Agrawal等人提出,它最初是以分析事务数据库中项与项之间联系为目标,后来的研究者们对问题原型进行多方面的改进和扩充。目前,关联规则挖掘技术已经被应用到商业、电讯、金融、农业、医疗等领域,取得了良好的效果。关系数据库是众多行业和部门用于存储其生产、管理和科研等大量信息的重要形式,数据量的增长极为迅速,积极研究在关系数据库中挖掘关联规则的有效技术具有极为广阔的发展前景。本文详细地阐述了经典关联规则挖掘Apriori算法,并通过案例进一步说明了算法思想,随后针对Apriori算法的不足,简要提出了几种相应的改进技术。随后提出了基于频繁模式树的FP-growth算法,具体分析了频繁模式树结构,及基于FP-tree的频繁模式挖掘,同时结合具体的案例对FP-growth算法思想进行了补充说明。论文提出的算法采用多级支持度并运用相关度从频繁项集中产生正关联规则,从频繁项集和非频繁项集中产生负关联规则,利用相关度α剪除较小价值的规则,通过设置合理的最小兴趣度并计算相关性和置信度,经过比较判断得到有效规则,并且提出了四种多级置信度和卡方检验测试关联规则的相关性和独立性。论文研究了关系数据库中关联规则挖掘工具原型的设计思路、主要功能及实现方法。一方面可以使其在成熟的关系数据库理论与技术的支持下保证较高的执行效率,另一方面也便于挖掘工具与关系数据库操作系统的无缝衔接,使其更具实用性和便利性。
其他文献
随着数据库技术的快速发展,全球范围内的数据存储量急骤上升,面对这一挑战,数据挖掘技术应运而生,关联规则挖掘,尤其是关系数据库关联规则挖掘作为其中的一个重要研究内容,其
随着云计算的发展,越来越多的企业开始采用云计算。然而,云计算的发展仍然面临着很多挑战,其中云安全已成为其发展的最大障碍。将可信计算技术与云计算相结合是解决云安全问
在三维场景的建模中,必不可少的当然是树木。然而树木由于自身的复杂性,并不像汽车、房屋一样便于绘制。如何使用计算机语言快速、简便、逼真地绘制出一颗树木,一直是计算机
随着Internet及其相关技术的飞速发展,互联网已成为最大的信息源。无论对于企业还是个人,Web逐渐成为最主要的信息来源。目前,90%的全球500强企业已建立了完善的市场情报分析
随着汽车行业的高速发展,汽车市场的激烈竞争,围绕汽车制造的零部件供应、汽车的销售以及汽车售后服务等协作服务形成的一整条汽车产业链,从而使得汽车行业上下游的制造厂、
当前在Internet网络中广泛应用的网络应用模型大都基于传统的集中式处理结构,在处理大规模业务时会存在中心节点压力大,效率低,单点失败风险难以避免等问题。Internet网络本
随着信息技术的发展和互联网络的普及,计算机已成为人们在日常生活和公务处理中采集、提取和处理文件信息必不可少的工具。中国是一个统一的多民族国家。在这块约1000万平方
研究表明,当前P2P数据流占了Internet上全部数据流的60%。在所有的P2P软件中,最流行的是BitTorrent软件,它的数据流占了全部P2P数据流中的50%。从ISP的角度来看,绝大多数的P2
理论上,车间调度问题(Job Shop Scheduling Problem,JSSP)是最难解决的组合优化问题之一,要求在满足约束条件的情况下尽可能保证目标函数结果最优。实际中,大规模资源的调度优化成