论文部分内容阅读
数据库管理系统是信息系统三大支撑平台之一,数据库系统的安全是信息安全研究的重要组成部分。数据库入侵检测是保证数据库安全的最后一道防线,目前数据库入侵检测的研究尚处于起步阶段,提出的方法大多基于数据挖掘技术。本文将研究重点放在关联规则挖掘的经典算法——Apriori算法的改进上,并将改进后的算法应用到数据库入侵检测系统。通过分析Apriori算法生成频繁项集的过程,发现在连接步产生大量的支持度为0的无用项集,这些项集的生成是由于没有考虑布尔属性之间的互斥性,作者据此提出互斥属性的概念,并将其分为显式互斥属性和隐式互斥属性两类。针对显式互斥属性,提出改进的数据预处理算法,在进行数据集转换时,对互斥属性进行标记,这些标记可以避免显式互斥属性的连接;针对隐式互斥属性,提出改进的Apriori算法,在计算C2中候选项集的支持度时,对隐式互斥属性进行标记。通过避免互斥属性间的连接操作,减少必须分析的k-项集的数量,从而节省挖掘频繁项集所需的时间。将改进的数据预处理算法和改进的Apriori算法应用于数据库入侵检测系统,提出一个基于数据挖掘技术的自适应的数据库入侵检测系统模型。模型中,针对滥用检测规则生成的局限性,提出将改进的Apriori算法的中间结果运用到滥用检测规则的生成中,不断完善滥用检测规则库;结合滥用检测和异常检测的特点,先进行滥用检测,再进行异常检测,降低漏检率和误警率;提出根据检测结果,不断更新规则库,提高系统的自适应性。