动态关联规则挖掘算法的研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:nextronnpf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一种重要的数据分析技术,而关联规则是一种描述型数据挖掘,关联规则的算法属于无监督学习的方法。动态关联规则挖掘,是在普通关联规则的基础上进一步描述了规则和数据特性随着时间变化的特征,它为关联规则的发展注入了新的活力。本文对数据挖掘,包括关联规则的基本知识做了简要介绍,然后重点对动态关联规则挖掘及其相关算法进行了讨论,给出了ABM算法在动态关联规则上的改进和应用,以及在此基础上将改进的线性链表应用在动态关联规则上,并通过实验验证了算法的有效性。  本文首先对数据挖掘的发展过程、基础知识,以及数据挖掘应用的重要性和发展方向进行了简要的讨论,介绍一些关联规则的必要知识,同时也对关联规则挖掘算法中的三种经典算法进行了详细的描述,讨论了动态关联规则的基础概念及其特点,并介绍了两种经典动态关联规则的挖掘算法。  在上述工作的基础上,给出了ABM算法在动态关联规则上的改进和应用,它采用垂直的数据结构表示格式,并利用矩阵来存储运算所需的辅助信息,同时在挖掘的过程中,创建一维数组来存储所有项目能与数组元素所代表的项目组合成频繁2-项集的数目,且编号不大于该数组元素的编号。该算法通过对矩阵和数组中的值与支持度阈值进行比较,决定是否需要进行交运算,以有效剪裁不必要的运算量。  本文重点是在ABM算法的基础上将改进的线性链表应用在动态关联规则上,它也采用垂直的数据结构表示格式,但与其不同之处是,采用线性链表存储频繁(k-1)-项集的运算结果,并在此基础上充分利用这个运算结果,继而生成频繁k-项集。  本文中所述的两种改进措施,通过实验已证明了其在准确率和时空效率上都有一定的优势。
其他文献
随着信息化的不断深入,信息技术给人们的日常生活带来了巨大的便利,同时也使得人们面临的信息安全风险越来越高。通过信息系统安全风险评估,可以有效地对安全风险进行控制和
互联网金融是基于移动互联网,网络支付,大数据等新技术手段,从而实现资金流通,平台中介,资金结算交易相关业务的一种新模式。互联网金融从早期传统金融机构为基础,进行业务线上化、
多机器人系统的追捕-逃跑问题是人工智能和分布式控制领域的一个热点问题,是研究多机器人系统中团队协作的重要途径。追捕-逃跑问题的复杂度会随着参与者的增加呈指数增长,分层
数据挖掘是从大量数据库记录中挖掘出有价值的模式或有规律等知识的复杂过程,已被广泛应用于金融、保险、运输及国防等科学研究领域。其中决策树分类算法是数据挖掘中最为广泛
太阳能电池板作为太阳能转化为电能的器件,其研究与制造得到人们广泛的关注。在太阳能电池板生产过程中,难免会产生一些缺陷,将很大的影响产品的寿命及光电效率。因此在被投入市场之前,缺陷的检测成为一项非常重要的环节。随着自动化技术的发展,目前基于软件的图像处理方法检测缺陷,对采集的图像要求比较高,且识别率达不到工业检测的要求。本文根据计算机视觉中模拟生物视觉机制模型的最新研究进展以及研究成果,对能够模拟具
存储设备性能预测在存储系统的自动化管理以及任务计划程序中具有广泛的应用,占有重要的地位。传统的方法是利用分析模型、仿真模型来预测存储设备性能,并称这类方法为白盒方法
软件开发过程中产生的软件过程产品,包括需求文档、设计文档、程序源代码和测试文档等,它们并不是孤立存在的,彼此之间是相互关联的,而这种关联对程序理解、软件维护、甚至对整个
图像数据作为生活和学习中一种至关重要的信息载体,是网络环境中不可缺少的数据信息资源。海量的图像数据不断地被创造,并且在互联网上发布、传播、分享和交流,如何在浩瀚的
移动IPv6作为下一代互联网的主要协议,具有较好的移动性支持,更高的安全性,并且容易扩展,能为人们提供很好的网络服务。但是,对于一些对QoS要求较高的应用,现有的标准MIPv6协
随着计算机网络和多媒体技术的迅猛发展,图像、视频、音频等多种形式的数字作品的创作、存储和传输变得极其便利,人们享受便利的同时,各种非法复制、分发、篡改等,也严重侵害了多