论文部分内容阅读
监控大型网络的性能对于网络状态跟踪、性能优化、流量工程、异常检测、故障分析等至关重要。然而,要想获得全网性能视图,存在测量代价高的挑战。为了降低测量代价,可以测量网络的路径或时间间隔子集,同时利用它们的时空相关性推断剩余的网络性能数据。缺失数据恢复的质量很大程度上依赖于推测算法。张量填充以其利用多维数据结构进行更精确的缺失数据推测的能力引起了人们的关注。然而,传统的张量填充算法仅通过内积建模数据特征之间的三阶相互作用,不足以捕获不同特征维度之间的高阶非线性关系。近年来,深度学习在语音识别、计算机视觉和自然语言处理方面取得了巨大的成功。因此,在本文工作中,努力开发基于深度学习的技术来解决基于内积交互的张量填充的缺陷问题。该文的主要研究工作和成果如下:
1)为了解决现有张量填充算法的局限性,本文提出了一种新的神经张量填充(NTC)模型。NTC模型通过外积操作有效地建模数据特征之间的三阶相互作用,并创建了三阶相互作用映射张量。在此基础上,应用3D卷积神经网络从局部到全局范围学习特征映射之间的高阶相互作用。本文从理论上证明了这种操作具有更好的学习能力。进一步在两个真实的网络监控数据集(Abilene和WS-DREAM)上进行了大量的实验,以证明NTC模型可以显著降低丢失数据恢复的错误率。当采样率较低为1%时,使用NTC模型时,测试数据的恢复误差率约为0.05(Abilene)和0.13(WS-DREAM),而使用目前最佳的张量填充算法时,恢复误差率约为0.99(Abilene)和0.99(WS-DREAM),分别是NTC模型的21倍和8倍。
2)本文提出了另一种融合型神经张量填充(FuNTC)模型来解决NTC模型只能提取潜在特征维度之间非线性复杂结构信息的缺点。在神经网络的框架下,NTC模型与张量分解模型共享相同的潜在特征嵌入,能够同时高效提取非线性特征信息和线性特征信息,实现更高精度的数据恢复。FuNTC模型继承了NTC模型的优点同时弥补了其不能捕获高阶线性特征的缺点。在两个真实的网络监控数据集(Abilene和WS-DREAM)的实验中表明,使用FuNTC模型比NTC模型具有更好的恢复性能。当采样率为1%时,目前最佳的张量填充算法其恢复误差分别是FuNTC的24倍(Abilene)和8倍(WS-DREAM)。
1)为了解决现有张量填充算法的局限性,本文提出了一种新的神经张量填充(NTC)模型。NTC模型通过外积操作有效地建模数据特征之间的三阶相互作用,并创建了三阶相互作用映射张量。在此基础上,应用3D卷积神经网络从局部到全局范围学习特征映射之间的高阶相互作用。本文从理论上证明了这种操作具有更好的学习能力。进一步在两个真实的网络监控数据集(Abilene和WS-DREAM)上进行了大量的实验,以证明NTC模型可以显著降低丢失数据恢复的错误率。当采样率较低为1%时,使用NTC模型时,测试数据的恢复误差率约为0.05(Abilene)和0.13(WS-DREAM),而使用目前最佳的张量填充算法时,恢复误差率约为0.99(Abilene)和0.99(WS-DREAM),分别是NTC模型的21倍和8倍。
2)本文提出了另一种融合型神经张量填充(FuNTC)模型来解决NTC模型只能提取潜在特征维度之间非线性复杂结构信息的缺点。在神经网络的框架下,NTC模型与张量分解模型共享相同的潜在特征嵌入,能够同时高效提取非线性特征信息和线性特征信息,实现更高精度的数据恢复。FuNTC模型继承了NTC模型的优点同时弥补了其不能捕获高阶线性特征的缺点。在两个真实的网络监控数据集(Abilene和WS-DREAM)的实验中表明,使用FuNTC模型比NTC模型具有更好的恢复性能。当采样率为1%时,目前最佳的张量填充算法其恢复误差分别是FuNTC的24倍(Abilene)和8倍(WS-DREAM)。