基于小波SVM的P2P流量识别技术研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:aa377059590
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对等网络技术(Peer-to-Peer,简称P2P)的迅速发展,使得其应用已经占据了互联网业务总量的60%-80%,甚至引起了网络拥塞,严重影响了其他正常网络业务的开展,因此就需要对P2P流量进行识别。目前现有的基于端口扫描、应用层特征串、流量特征等识别方法,对越来越多的使用动态端口甚至经过加密的P2P应用显得力不从心,使得P2P流量识别越来越困难。如何快速、准确、有效的识别和控制P2P流量具有非常重要的理论意义和现实价值。支持向量机(Support Vector Machine,简称SVM)在避免局部最优解,克服“维数灾难”,解决小样本、高维输入空间的P2P流量识别问题上体现出了很多独有的优势,为解决P2P流量识别问题提供了一条新的途径。本文从P2P流量识别的原理为切入点,研究分析了P2P流量识别技术中存在的主要问题和实现有效的P2P流量识别方案所需要的技术,提出了一种基于小波SVM的P2P流量识别模型。重点工作如下:1、特征向量的选取:根据节点流量呈现出有差异的行为特征,从数据包,网络流,节点连接三个层面进行特征向量的分析,通过实验选取了具有行为特征的三维特征向量,作为支持向量机的输入向量。2、核函数的构造:将小波分析中多尺度的学习方法和SVM结合起来,引入Mexican hat小波函数来构造SVM的核函数,实现对流量样本的多尺度逼近,自适应的处理P2P流量的非线性变化特征,提高识别精确率。3、训练算法:提出一种基于小波支持向量机的Boosting迭代算法应用于P2P流量识别,通过在学习过程中重点训练错分的样本,来提高学习机的泛化能力,减小误报率。最后,对论文提出的新的P2P流量识别模型进行验证,采集了真实的P2P网络流量,使用建模工具MATLAB 7.0中的SVM工具箱(LIBSVM)来实现一个用于P2P流量识别的SVM,实验从误报率和漏报率两个方面进行衡量,并同采用径向基核函数的SVM识别模型进行了比较,实验表明,基于小波SVM的P2P流量识别模型具有较高的识别精度。
其他文献
参考文献信息是科技文献中的一部分主要内容,用来反映作者所做工作的主要理论基础,同时也提供了一些与该文献相关的其他科技文献的信息。传统的信息检索系统只是把文档的内容
近年来,随着三维数字扫描设备和技术的不断发展,点云模型作为曲面的一种新的表示方式获得了工业界和学术界的大量关注,点云模型在医学辅助诊断、数字娱乐、工业设计、航天模
随着互联网信息的爆炸性增长,搜索引擎已成为人们从海量数据中获取信息的一个重要途径。目前搜索引擎主要还停留在关键词匹配的基础上进行信息的刷选,因此用户输入的查询短语准
随着语义web的发展以及web3.0时代的即将到来,基于web服务的应用也就越来越倍受关注。如何从众多的web服务中准确地找到符合需求的服务就成为研究的难点和应用的关键。语义we
文本情感分类是指通过挖掘和分析文本中的立场、观点、情绪等主观信息,对文本的情感倾向做出类别判断。随着人们在web中表达自己观点越来越普遍,针对文本情感分类的研究也变
合成孔径雷达(SAR)图像分割是SAR图像应用中非常重要的一个环节,但由于SAR图像中相干斑噪声的存在和特征选择不当,使得传统方法不能很好的对SAR图像进行分割。因此,将机器学
医学图像分割是图像处理的一个重要应用领域,也是一个具有挑战性的领域。随着微电子技术和计算机的发展,大批的成像技术应用到了医学领域形成了以MRI、X-CT、核医学等为代表
近年来,由于P2P技术可以解决流媒体传输中的服务器瓶颈问题,极大提高传输能力,从而在新媒体业务中得到了广泛应用,成为流媒体传输的关键技术之一。如何能够在充分利用P2P网络
论文对当前主要几种主流的报表技术进行分析,指出了其中的不足之处。针对实际项目中Web报表关键的几个问题:建模方式、页面间的传值、打印时的内容隐藏、页面设计和实现中的
当前,随着处理器计算能力不断提升,密钥变的越来越不安全,单纯的加密已不能满足保护数据安全性的需要,信息隐藏技术成为了很多研究者关注和研究的热点。本论文的主要研究成果