论文部分内容阅读
入侵检测作为一种主动防御技术已经是现代计算机网络安全系统不可或缺的组成部分,一直是现代网络安全领域研究的热点。支持向量机技术一直是入侵检测领域的重要研究内容,但是基于传统支持向量机的入侵检测系统在训练时间和检测精度上至今未取得突破性进展,尤其当数据量较大时,效果总是不尽如意。对支持向量机技术(Twin Support Vector Machines,TWSVM)将传统支持向量机(SVM)中的一个二次规划问题分成两个规模较小的形如传统SVM的二次规划问题,简化了计算复杂度,缩短了训练时间,该研究成果为入侵检测系统改进上述问题提供了新的思路。针对目前基于传统支持向量机的多类分类算法在训练速度上尤其是面对较大规模的训练样本时存在的弱势,本文在对TWSVM分析研究的基础上,结合二叉树多类分类思想,提出了一种新的基于TWSVM的多类分类算法(Binary Tree Twin Support Vector Machines,BT-TWSVM)。另外,为了减少二叉树多类分类算法的误差累积,BT-TWSVM算法在分类前首先通过聚类算法得到各类的聚类中心,通过比较各聚类中心之间的距离来衡量样本的差异以决定二叉树节点处类别的分离顺序,提高检测精度。最后利用KDDCup99数据集对算法进行了仿真实验,并与基于传统支持向量机的多类分类算法进行比较。实验结果表明,该算法不仅保持了较高的检测精度,在训练速度上还体现了一定的优势,尤其当训练数据较大时,这种优势更为明显,是基于传统支持向量机的多类分类算法训练速度的近两倍,为入侵检测领域大规模数据集的处理提供了有效参考价值。