论文部分内容阅读
随着信息化进程不断加快,数据资源日益丰富,信息已经成为世界上最有价值的商品。如何从大量的数据中找出对决策有用的信息支持决策已成为当务之急。数据挖掘技术的出现,使人们有能力认识已有数据的潜在价值,发现蕴涵在数据海洋中的信息和知识。正是由于这样的重要性,数据挖掘技术是目前数据库和信息决策领域前沿研究方向之一。 挖掘关联规则是数据挖掘领域的重要问题之一,但大多数算法没有对群体的特征与行为的多维关联规则挖掘需求给予足够的满足。本文基于多维关联规则的挖掘,提出了基于维约束和哈希技术的多维关联规则挖掘算法——CPH(Count of candidates and Prune transactions based on Hashing);通过考察属性的相关性,提出了对相反属性项集关联规则挖掘的算法——AOAA(Association rules of opposite Attribute Aggregates),并将它们应用于大型开放型实验室综合管理网络系统中。 论文分为七章,重点是对关联规则挖掘算法的研究、基于多维关联规则挖掘改进算法的设计以及在大型开放型实验室综合管理网络系统中的应用。论文研究的主要问题及相关成果如下: ◆ 对数据挖掘技术进行了详细的介绍,对多种数据挖掘方法和技术进行了分析比较,并对关联规则挖掘经典算法及其改进算法进行了详细的研究。 ◆ 根据对关联规则挖掘算法的分析,提出了CPH算法和AOAA算法。其中,CPH算法采用维搜索技术、哈希技术和事务压缩技术,减少了算法扫描数据库的次数,提高了多维频繁项集的求解效率:AOAA算法考虑属性的相关性问题,并对相反属性间的关联规则进行探讨,使挖掘出的关联规则可信度更高。 ◆ 将CPH算法和AOAA算法应用于大型开放型实验室综合管理网络系统中,对算法的性能进行了分析,验证了算法有较优越的性能。