论文部分内容阅读
随着计算机网络和信息技术的发展,人们对互联网的使用越来越频繁,这也使得网络安全问题变得越发重要。入侵检测系统作为保护网络系统安全的关键技术和重要手段,已经成为当前网络安全方面研究的热点和重要方向。粗糙集作为一种新的处理模糊和不确定性知识的数学工具,提供了一整套比较完整的小样本学习方法,能够在样本数据集中发现属性之间的关系,从中筛选出重要性强的属性以反映数据之间的本质关系,并能根据挑选出来的属性快速有效地得到最小预测规则集,适用于系统的实时检测。因此,对粗糙集理论在入侵检测中的应用进行研究具有重要的现实意义。粗糙集理论的属性约简是一个NP-Hard问题,如何快速、准确地获得最小属性约简集是目前研究的热点。本文提出了一种改进的属性约简算法,在粗糙集的属性重要性概念的基础上,引入了加权平均属性重要性的概念,并以之作为启发式函数指导约简过程。算法根据加权平均重要性指标将属性排序,以保证最重要的属性能首先被加入约简。实验结果表明,该算法能够有效地得到样本集的最小相对约简,并能在对入侵检测数据的处理中获得了较高的检测效率。经典的粗糙集理论已经被一些学者引入了入侵检测研究。然而,这些方法在运用粗糙集理论在做属性约简之前,都需要采用离散化算法对数值型属性进行离散化预处理,这种转换不可避免的会带来了信息损失,使得入侵检测的结果在一定程度上受到影响。因此,本文提出了一种基于邻域粗糙集的网络入侵检测算法。由于加入了邻域关系的判断过程,该算法避免了数据预处理时的离散化处理,减少了信息损失。在KDD Cup 1999数据上的实验结果表明,该算法能获得较高的检测率和较低的误检率。