论文部分内容阅读
为了对移动通信基站内的设备和环境进行实时监控,各大通信运营商普遍采用了 动环监控系统(Power and Environment Monitoring System,PEMS)。近些年来,随着移动通信基站规模的不断扩大,动环监控系统面临着越来越严峻的挑战。监控中心几乎每天都会收到成千上万条告警记录,这些海量的告警记录已经超出了运维人员处理的极限。如何进行告警的合理化设置进而减少告警数量已经成为一个亟待解决的问题。告警相关性分析作为告警合理化的一个重要过程受到了广泛关注,并逐渐成为一个研究热点。基于数据挖掘的告警相关性分析是指利用告警的日志记录,通过设计合理的算法来挖掘潜在相关告警的过程。在本文中,相关告警指的是在时间上具有伴随关系的告警。值得注意的是,动环告警一般存在时延,并且这种时延还是动态的,因此传统的数据挖掘算法难以取得令人满意的效果。为了解决这种具有动态时延的告警相关性挖掘问题,我们提出了两种不同的方法。第一种方法是基于动态时间弯曲(Dynamic Time Warping,DTW)的告警相关性分析。原始的告警序列一般表示为矩形函数,这种表示形式难以利用告警的时间信息,因此我们首先通过二维空间映射(Two Dimension Space Mapping,TDSM)将告警序列转化为典型的时间序列,然后利用DTW计算告警时间序列的相似性,进而挖掘潜在的相关告警。与传统的告警相关性分析方法相比,该方法不仅可以充分利用告警的时间信息,而且还可以有效解决告警延迟时间变化的难题,从而使得挖掘结果更为精准。第二种方法是基于Alarm2Vec的告警相关性分析。告警序列和单词序列之间存在着很多共性,这使得告警也可以像单词一样嵌入到多维空间中。Alarm2Vec受启发于自然语言处理中的词嵌入方法,它通过神经网络将告警转化为多维空间中的一个向量,使得具有较强关联关系的告警在多维空间中距离较近。向量的每个维度表示了告警的某一特征,告警之间的相关性可以通过向量之间的距离来衡量。Alarm2Vec算法利用了相关的告警具有相似上下文关系的特征,使得具有语义和时间关联的告警在多维空间中具有较近的距离,从而实现了告警相关性挖掘的目的。我们使用上述两种算法分析了某通信运营商PEMS产生的告警数据,发现了许多有意义的潜在相关告警。