论文部分内容阅读
P2P是对等节点间直接交换资源和服务的网络技术,是为了适应节点间越来越高的信息直接交互需求而产生的,且发展迅速。在企业网中,P2P技术为员工带来便捷的同时,也导致了以下问题:吞噬网络带宽、传播恶意代码、侵犯版权等。所以,必须对P2P流量加以限制,而识别P2P流量是实现管控的前提。 论文围绕P2P业务流识别方法展开研究,对P2P技术理论和目前主流的P2P流量识别方法进行分析,包括:基于端口的方法、DPI、DFI、基于机器学习的方法等。对基于BP神经网络的识别方法展开深入研究。在对BP算法的工作信号正向传播、误差信号反向减弱过程分析的基础上,捕获典型P2P业务流量,得到包含6类流量特征的样本数据。运用Matlab神经网络工具箱建立单隐含层BP神经网络模型,训练网络,仿真实现对P2P业务流的粗粒度识别,建立效果评价体系,对P2P流量的识别准确度达到91.08%。对五种具体P2P进程:Web、BT、QQLive、PPStream、FTP流量进行捕获分析,得到包含5类流量特征的样本数据。仿真实现对五种进程业务流的细粒度分类器,对QQLive、PPStream、BT、Web和FTP业务流的识别准确度分别为86.8%、84.6%、84.2%、83.7%和80.5%。 传统BP算法具有收敛慢和易陷入极小值的缺陷,提出加入减震荡因子的最速下降算法,对BP误差修正算法进行改进,用改进后的算法训练、测试网络。经多次实验发现用此种算法来识别P2P流量,能达到用时短、准确度高的要求,对QQLive、PPStream、BT和FTP流量的区分准确度分别提高了4.5%、4.3%、2%和4%。