论文部分内容阅读
互联网承载了大量的信息资源和网络业务,网络规模不断扩大,网络组成也日益复杂,越来越有必要对网络行为进行深入的研究和分析。互联网流量包含了丰富的信息,通过对互联网流量的有效分析,能够及时了解到网络的运行状况,网络业务的运行规律和网络用户的行为信息,给网络管理人员提供了有效的技术数据。另一方面,随着网络业务的极大丰富,传统的尽力而为网络已无法满足网络业务各种各样的QoS需求。针对计算机网络系统的QoS问题,研究者提出了很多解决方案,但是,这些方法都还无法彻底解决网络的QoS问题,并且始终没有成功部署,使网络的QoS研究陷入了瓶颈。 为此,本文重点对互联网流量行为特征与流量控制进行分析研究,主要研究内容及结论如下: (1)为了发现互联网流量的长期演化规律,以互联网数据分析合作组织提供的五年骨干网流量数据为研究对象,分别从数据包、数据流和网络应用方面进行了分析研究。同时,基于数据包和字节序列,采用时域、频域和小波域上的多种方法检验了流量的自相似特性。结果表明,网络流量的多个特征在演化规律上呈现出各异性的同时,网络流量的自相似特性依然存在,并且在数据包序列和字节序列上具有同一性,为互联网的协议设计、设备开发、网络管理等提供了数据支持。 (2)网络流数据的概念漂移现象会造成分类模型失效,分类准确率下降。针对此问题,提出了一种基于概要数据结构的网络流量概念漂移检测方法。首先使用Count-Min概要数据结构记录网络流的特征信息,然后通过监测两个连续数据块之间的Hellinger距离来检测网络流量概念漂移。如果检测到概念漂移,则进一步判断漂移的类型。结果表明该方法在进行概念漂移检测时,降低了误检率和漏检率,并且能够正确识别网络流量概念漂移类型。 (3)朴素贝叶斯分类方法广泛应用于互联网流量分类,此方法假设在给定类别下所有流量特征同等重要并且是独立的。该假设在现实中难以满足,致使分类准确率不高。针对该问题,提出了一种基于特征加权的朴素贝叶斯流量分类算法。该算法基于NetFlow记录的特征信息,采用特征选择算法ReliefF和相关系数方法计算每个特征的权重值,然后将网络流量分配至后验概率最大的应用类别中。结果表明,这种算法具有超过94%的分类准确率,并且维持了朴素贝叶斯方法简单高效、分类稳定的特性,可以满足当前高带宽网络流量分类的需求。 (4)软件定义网络将控制层从物理设备中剥离出来,并且提供了一个可编程接口,从而实现了对网络的灵活控制。同时,利用SDN中心控制器,能够在网络中部署先进的管理策略。因此,基于SDN技术,提出了一种业务流QoS保障的路由机制。首先,将该问题形式化为多约束最优问题,并且将业务流划分为QoS流和best-effort流。然后,基于网络全局视图和业务流QoS需求,SDN控制应用为数据流计算合适的转发路径,提升用户体验的同时,尽可能提高物理链路利用率。结果表明,该方法能够为业务流计算合适的转发路径,从而满足业务的QoS需求。