论文部分内容阅读
用关联规则挖掘方法来构造分类模型在数据挖掘领域被称为关联分类。关联分类方法将数据挖掘中的两个重要技术——关联规则挖掘和分类技术很好的结合起来。近几年的研究成果表明,已有的关联分类算法在分类准确率方面比起传统的分类方法,如决策树分类,有了很大的提升。然而,在对关联分类方法研究的过程中发现,已有的这些算法对其在实际应用会遇到的问题没有给予足够的关注;与此同时,将高效的分类方法用于解决实际问题的需求却与日俱增。因此,本文从实际应用的角度出发,对提高关联分类方法的性能方面进行了深入研究。首先,针对实际应用中常见的数据库更新情况,提出一种适用于MCAR关联分类算法的增量算法——IUAC。该算法基于频繁模式树挖掘和更新关联规则,并使用一种树形结构来存储最终用于分类的关联规则。同时,增加了对分类规则的约束条件,进一步控制用于分类的关联规则的数量。其次,针对实际应用中常会出现的多标号分类问题,提出多标号懒关联分类方法——CMLAC。该方法在对已有多标号技术和懒关联分类方法进行研究的基础上,采用循环过滤策略,发掘出标号之间的潜在关系,得到一个多标号的分类关联规则集MCARs,从而使得已有的懒关联分类方法能够解决多标号分类问题。