基于半结构化数据的关联规则挖掘研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:XX200003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于在大型数据库中存储的数据往往非常庞大,因此分析处理数据的工作越加困难。为了有效的从数据库中找出有用的资料,数据挖掘(Data Mining)技术应运而生。随着数据交换需求的与日俱增,半结构化数据(Semi-structured)XML文件蓬勃生长,原生型XML数据库中存放大量XML文件。如何挖掘出隐藏在原生型XML数据库里的知识或规则是本研究的一个重点。针对关联规则挖掘应用所面临的困难,分析了XML语言的技术特点,提出一种基于半结构化数据的关联规则挖掘模式。该模式充分利用半结构化数据源的自描述性、开放性和可扩展行方面的优势。近年来许多研究人员在从事数据挖掘相关技术的研究,其中被广泛讨论的议题就是在事务数据库中挖掘出关联规则。在对关联规则挖掘中基于Apriori算法的改进算法的深入分析和研究后,本文根据Apriori算法的不足,提出了一种改进策略,从而得到一种优化的Apriori算法。最后通过仿真实验表明该改进算法有效地提高了Apriori算法的挖掘速度。
其他文献
近些年,随着人们对精神文化的不断追求,以及国家对文化产业的大力支持,文化演出服务行业随之繁荣。文化演出服务提供者提供的资源日益丰富,观众的需求偏好日益个性化,如何将丰富的
为了提高决策科学化水平,电信企业也纷纷构建了以数据仓库系统为核心的经营分析系统,为企业的决策提供管理信息。然而,经营分析系统不能实时地根据变化数据产生信息,进而支持企业
数据挖掘是指从大量的数据中提取隐含的、事先未知的、并且潜在有用的知识的过程,是目前国际上数据库和信息决策领域前沿的研究方向之一。随着时序数据在金融和科技应用中的广
近几年来,随着社会信息化进程的不断深入发展,人类对信息的需求和依赖程度越来越高,如何从海量的信息资源中快速有效的获取有用的信息,已经成为研究的热点,这也给信息检索带来了极
下一代网络开放了网络能力,但是随着不断涌现的新的业务需求,开放业务能力预计不远的将来将成为下一个重大的研究热点。业务能力的开放也带来了一系列业务层面特有的安全问题,这
近年来,随着应用要求不断增强,机器人技术得到了持续发展。作为一门高科技综合学科,机器人技术的发展延伸出了许多新的技术研究领域,也带动了这些领域的技术发展。其中,路径
随着开放分布式计算的快速发展,中间件技术已经从面向对象计算的阶段发展到了面向服务计算的阶段。SOC更加靠近应用层的业务逻辑,具有敏捷性、动态适应性等特性,可与模型驱动的
数据挖掘技术将传统的数据分析方法与处理大量数据的复杂算法相结合。数据挖掘为探查和分析新的数据类型以及用新方法分析旧有数据类型提供了良好的机会。数据挖掘的目的是从
随着通信网络技术的迅速发展,特别是高速通信网络的发展,网络的规模越来越大,链路容量越来越高,链路越来越稀疏,网络可靠性研究越来越为人们所关注。目前,有关系统可靠性约束或目标
随着航空电子系统的发展,航空计算领域对数据传输速度的要求越来越高,复杂的网络计算环境要能够高速传输大量机载设备的计算数据。传统的机载网络系统已经不能够满足复杂计算的