论文部分内容阅读
近年来,P2P技术作为一种全新的网络应用,正主导着互联网的发展方向,与此同时P2P的管理问题也成为当前互联网络中最大的难题。因此,实现对P2P流量的有效识别及控制成为了当前亟待解决的问题。传统的控制P2P流量方法是基于固定端口的检测技术,但随着技术的发展,很多P2P应用往往采用动态随机端口、跳跃端口、冒充HTTP、有效载荷加密等技术逃避检测。此外还有基于深层数据包检测技术以及基于流量特征的检测技术,但单纯地应用以上检测技术都不能达到很好的效果。支持向量机对小样本集具有泛化能力强,分类精度高的优点。本文在系统地研究了统计学习理论中最成熟的算法支持向量机的相关理论基础上,深入研究了支持向量机在P2P流量检测中的应用技术。论文通过查阅大量文献资料,分析P2P流量特征及在控制P2P流量过程中存在的问题,比较目前P2P流量检测的几种技术及优缺点,提出利用支持向量机来识别P2P流量。主要研究内容和创新点如下:第一,研究支持向量机理论和最小二乘支持向量机,提出最小二乘支持向量机的改进算法。第二,围绕将支持向量机应用到P2P流量检测的思路,提出了基于支持向量机的P2P流量检测模型,利用改进最小二乘支持向量机作为学习机模型,设计P2P流量检测实验,通过训练分类器实验结合交叉组合法得到了合理的核函数参数,并深入探讨了主要参数调整对支持向量机性能的影响。从虚警率和漏警率以及检测率三个方面评价了分类器的分类效果。第三,分析了几种传统的支持向量机多分类算法,提出了基于二分类支持向量机的多分类算法的改进策略,设计了基于二分类SVM的多分类实验,并取得了很好的效果。在本文的最后,对论文所做的工作进行了总结归纳,并提出了一些方法的不足和改进之处,对下一步研究做了展望。