论文部分内容阅读
P2P (Peer to Peer)是近年来互联网最热门的技术之一,在VoIP、下载、协调计算等领域得到飞速发展。同样在流媒体领域,该技术也体现了强劲的发展劲头,既有PPLIVE、PPS、UUSee、QQLIVE等专门的P2P流媒体应用软件,也有基于浏览器的优酷网,土豆网等P2P流媒体网站。这些应用软件和网站为用户提供了形式丰富多彩的娱乐节目,如热门影视剧的点播,精彩体育赛事的转播,庆典活动的现场直播等。然而,P2P流媒体方便用户娱乐的同时,对网络带宽造成了巨大的消耗,使运营商的基础网络建设陷入了“拥塞-扩容-再拥塞”的非正常局面,盈利能力降低,服务质量下降。为了更好的使用互联网,限制P2P流媒体对网络带宽的无限使用,对其流量进行识别和监控成为当前研究的热门课题。目前主要的P2P流量识别方法分为基于概率性特征的识别技术和基于确定性特征的识别技术两大类,本文致力于实时识别P2P流媒体流量的研究,主要研究内容和创新点如下:基于概率性特征的P2P流媒体流量实时识别研究:基于概率性特征对流量进行识别是当今研究的热点,已有不少研究者结合机器学习将其应用到P2P流量的识别当中。但这些方法大多需要在流结束后才能识别出该流的网络业务种类,因此这些方法主要是从离线的角度对网络流量进行分析,一般应用于网络优化、业务流量分析和用户的行为分析等方面。本文通过分析P2P流媒体流量的特征,提出通过P2P流媒体子流的特征完成对流量的实时识别。该方法忽略了对非媒体数据传输流的识别,解决了基于概率性特征的识别准确率不高的问题。同时,识别采用流中部分报文组成的子流,使得在整条流结束前完成对流量的识别。基于确定性特征的P2P流媒体流量实时识别研究:基于确定性特征识别流量是目前准确率较高同时应用最广的方法之一,该方法通过识别数据报文中的特征指纹确定报文所承载的应用。但目前该方法所用的特征指纹一般都是人工看协议规范、报文获得,由于私有协议的广泛采用,特征指纹也越来越难以总结。本文研究实现了自动协议指纹挖掘算法,对四种热门P2P流媒体应用的特征指纹进行了全面提取,并分析了特征指纹在流中的位置,研究了识别方法的实时性。P2P流媒体流量实时识别的二级策略:在完成以上两种P2P流媒体流量实时识别方法的基础上,本文提出了对P2P流媒体流量实时识别的二级策略。该策略结合了两种识别方法的优点,提高了识别的准确率,同时保证了对最新软件版本的P2P流媒体流量仍具有较高的识别率。