论文部分内容阅读
随着计算机技术和通信技术的迅猛发展,计算机安全问题更加突出和复杂,入侵检测技术是目前保证计算机安全的必要手段。基于上述研究背景,本文用数据挖掘中孤立点分析方法的入侵检测算法,开展了基于数据挖掘的网络入侵检测研究。首先,基于模糊C均值聚类的入侵检测算法利用了一种新的距离定义,使算法能够处理异构的网络源数据。基于序列最小优化的入侵检测算法不能够处理离散型的数据,所以构造了一种基于距离的新核函数,使异构数据能通过构造的核函数映射到高维空间上。寻找一个包含目标类的最优超球体,将目标类数据与所有异常数据区分开,可以认为超球体外部的点是异常点。其次,将聚类和支持向量机算法结合在一起,这种方法通过减少支持向量机算法训练集规模的方法来降低算法的训练时间。在检测时,通过将网络数据包和聚类算法生成的聚类中心进行比较来确定是否需要进一步采用支持向量机分类,从而只将一部分对于聚类算法比较难于分类的数据包送往序列最小优化算法分类。这样将大大减少通过支持向量机分类的数据数量,既提高了整个算法的检测速度又充分发挥了序列最小优化算法分类精确的特点。最后,算法在某些参数的选取上只能采用试探的方法,需要人工干预。寻找一个合适的方法来自动地确定算法中各参数的值,也是今后研究的一个重要方向。