关联规则中Apriori算法的研究与改进

被引量 : 14次 | 上传用户:hua50776007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,人们能够用更便捷的方式来收集数据。数据库的快速增长使人们急迫地需要一种技术来处理这些数据。而数据挖掘就是在这样的背景下产生的。数据挖掘的定义如下:从数据库中找出以前人们不知道的知识,这些知识对于人们是很有价值的,可以用到人们的日常生产生活中,很大程度上增加生产效率。数据挖掘是知识发现(Knowledge Discovery in Databases,即KDD)中的个基本步骤。数据挖掘有许多常见的功能,比如聚类、分类、以及关联规则等。本文主要介绍了其中的关联规则。在文章中,简单介绍了关联规则的一些基本概念,以及挖掘关联规则的一些基本方法。本文对数据挖掘技术中的关联规则挖掘进行了系统的分析和研究,并在经典的Apriori算法的基础上改进了一个算法。本文的工作主要在以下几个方面:(1)对数据挖掘的基本理论知识和分类进行概述,对关联规则的基本思想进行深入研究,并对关联规则的相关算法进行了详细介绍。(2)介绍了现在已经存在的几种改进的相对高效率的算法,分析了其算法的性能,对这几种算法的优缺点进行了比较。(3)在分析关联规则基本理论的基础上,改进了一种基于矩阵的关联规则挖掘算法,通过扫描将数据库映射为0-1矩阵,直接在矩阵上进行运算,避免了反复扫描的过程,还对Apriori性质进行了引申和利用,对矩阵进行彻底的压缩。理论分析和实验证明了改进算法在效率上的提高。
其他文献
当代中国画创作面临前所未有的发展机遇,尤其是工笔人物画,需要创作者以全新的艺术视角来对待这一画种,这对从事工笔人物画创作的当代画家来说无疑是个重大挑战。那么,在中国画迅
石油在国民经济和人民生活中具有重要的地位。石油行业是技术密集型行业,其技术水平高低直接影响其开发效率和效益。因此不断开展技术创新并将创新成果应用于生产中,是实现石
"诗味说"是杨万里诗学思想的核心所在,其独特处在于:以"味"论诗歌群体风格特质——追求神似,"舍形逐味";以"味"来规范传统诗教的怨刺内容——要求诗歌精光内敛。杨万里"诗味
为了给某坝址比选提供滑坡体的岩土参数概率分布类型,解决小样本条件下岩土参数概率分布难以确定的问题,通过勘察试验数据分析,工程类比分析等方法确定了滑坡体可靠性计算参
在辽河盆地各构造单元中以西部凹陷湖泊沉积持续时间最长,是研究辽河盆地沙河街组页岩气成藏的良好地区.本次在大量的资料收集、整理和分析的基础上,对辽河盆地西部凹陷沙河
设备是钢铁企业进行连续性生产的主要物质基础,对设备的管理一直以来都是企业关注的焦点。设备在不断高速运转的过程中,不可避免的会发生技术性劣化,那么为了保证产品的质量,对设
服务补救对企业来说,尤其是在网络购物情境下,除了能够消除顾客的不满意之外,更是一次扭转顾客印象并藉由服务补救来进一步提升顾客忠诚度的弥珍机会。本文以组织行为学的公
本文主要运用文献法,通过查阅大量相关领域资料,列举出各个时期东西方有关心性领域研究的代表人物,并对其研究结果进行归纳总结,从而可以从多个角度对心性这一概念进行全面深入的
分析了松花江水系有机污染的现状和有机污染的危害,提出了有机污染的防治对策。
20世纪30年代苏区党和政府面对严重的疫病流行,采取了一系列积极的应对举措,有效地控制了疫病的流行和蔓延,并且积累了丰富的防疫经验,为其后陕甘宁边区及新中国的卫生防疫事