论文部分内容阅读
日志审计作为实现网络信息管理的重要机制之一,对建立完善的信息管理保障体系具有重要的作用,传统的网络管理日志审计系统存在着检测准确率低、检测速度慢、自适应性差和日志格式无法统一等问题。为了解决这些问题,近几年,出现了基于数据挖掘的网络管理日志审计系统,数据挖掘是一种新兴的、并且在很短时间内得到了广泛应用的先进的智能化数据分析方法。数据挖掘旨在从大量的数据中提取隐藏的预测性信息,发掘数据间潜在的模式,找出某些常被忽略的信息,以易于理解和观察的方式呈现给用户。本文的主要工作有以下几点:1.学习并研究网络管理、网络安全审计和数据挖掘技术,找出数据挖掘和日志审计在技术上的结合点,建立基于数据挖掘的网络管理日志审计系统;2.重点研究了关联规则算法,学习相应的关联规则算法Apriori和FP-Growth算法,针对这两种算法存在的问题进行研究,并分别从FP树的构造、查找、遍历等几个方面提出了FP二叉树、FP排序树及其改进方法,并最终通过理论分析和实验证明,新算法在时空效率上明显优于现有算法;3.对常见的网络设备的日志格式进行研究和分析,定义了标准事件格式,采集到的所有的日志事件信息都要经过预处理,转换为标准事件,另外,对日志事件进行了分级和丰富,以方便对数据进行数据挖掘和生成报表等操作;4.利用Petri网的理论,给出了网络故障处理的形式化流程定义,为提高故障处理效率,规范化处理步骤提供了一种新的解决方案;5.给出了基于数据挖掘的网络管理日志审计系统的实现方案和系统模型图,将大量的数据挖掘的技术和理论应用于该系统,提高了审计速度及准确性,实现了完整的网络管理日志审计系统。数据挖掘技术和基于数据挖掘的日志审计系统是都是目前研究的热点,本文改进了关联规则算法,并将其应用到基于数据挖掘的日志审计系统中,实践表明改进的算法在时空效率方面优于FP-Growth算法并且具有良好的伸缩性。