论文部分内容阅读
对等网络技术(Peer-to-Peer,简称P2P)的迅速发展,使得其应用已经占据了互联网业务总量的60%-80%,甚至引起了网络拥塞,严重影响了其他正常网络业务的开展,因此就需要对P2P流量进行识别。目前现有的基于端口扫描、应用层特征串、流量特征等识别方法,对越来越多的使用动态端口甚至经过加密的P2P应用显得力不从心,使得P2P流量识别越来越困难。如何快速、准确、有效的识别和控制P2P流量具有非常重要的理论意义和现实价值。支持向量机(Support Vector Machine,简称SVM)在避免局部最优解,克服“维数灾难”,解决小样本、高维输入空间的P2P流量识别问题上体现出了很多独有的优势,为解决P2P流量识别问题提供了一条新的途径。本文从P2P流量识别的原理为切入点,研究分析了P2P流量识别技术中存在的主要问题和实现有效的P2P流量识别方案所需要的技术,提出了一种基于小波SVM的P2P流量识别模型。重点工作如下:1、特征向量的选取:根据节点流量呈现出有差异的行为特征,从数据包,网络流,节点连接三个层面进行特征向量的分析,通过实验选取了具有行为特征的三维特征向量,作为支持向量机的输入向量。2、核函数的构造:将小波分析中多尺度的学习方法和SVM结合起来,引入Mexican hat小波函数来构造SVM的核函数,实现对流量样本的多尺度逼近,自适应的处理P2P流量的非线性变化特征,提高识别精确率。3、训练算法:提出一种基于小波支持向量机的Boosting迭代算法应用于P2P流量识别,通过在学习过程中重点训练错分的样本,来提高学习机的泛化能力,减小误报率。最后,对论文提出的新的P2P流量识别模型进行验证,采集了真实的P2P网络流量,使用建模工具MATLAB 7.0中的SVM工具箱(LIBSVM)来实现一个用于P2P流量识别的SVM,实验从误报率和漏报率两个方面进行衡量,并同采用径向基核函数的SVM识别模型进行了比较,实验表明,基于小波SVM的P2P流量识别模型具有较高的识别精度。