论文部分内容阅读
网络流量的特性分析一直是通信网络性能分析的一个极其重要的问题。对网络流量的理解对解决许多网络方面的问题很重要,诸如流量预测,异常检测和容量规划等。但是网络流量呈现高维多变的特性,目前还没有一种很好的方法进行研究。
PCA(主成分分析法)是一种最常用的分析高维对象的方法,成功应用于图像识别、神经网络等领域。由于网络流量同样存在高维问题,因此,AnukoolLakhina等人提出引入PCA算法进行分析。
实验在一组真实的网络流量数据上进行。采用PCA算法对其进行处理后,我发现整个流量呈现低维特性,即,一个网络有近百条流量,这些流量能够用一部分独立的变量较为精确的近似。
接下来,我还研究了如何运用PCA将流量的内在特征分解成三部分:共同的周期性的趋势,短暂生存的脉冲型的流量和背景噪声。这三类特征对于研究每条流量的结构提供了一个更直观的工具,其中脉冲型的流量有助于检测网络流量的突发点。然后,我还初步研究了PCA的这一分解在时域上的稳定性,即采用PCA对前一时段流量的分析结果对于分析后一时段的流量是否有效。
总的来说,根据仿真结果来看,将PCA算法引入流量分析领域还是可行的。