论文部分内容阅读
随着科学技术的发展与人类社会的进步,不管是在科学领域还是在生活领域都积累了大量的数据,其中大部分数据都是时间序列数据。时间序列异常检测也越来越重要并广泛应用于各个领域,例如信用卡欺诈检测、医疗监控、网络安全入侵检测等。 本文首先简要阐述了时间序列异常检测技术的研究现状,根据时间序列异常检测技术的发展过程,对异常检测技术进行了分类,并分析了各自的优缺点。现有的异常检测方法中,基于预测的异常检测技术由于其异常检测范围广而备受研究者的追捧,其中马尔可夫链技术因其实现简单、参数少而被广泛接受。本文深入研究分析了传统的基于经典马尔科夫模型的异常检测技术和基于高阶马尔科夫模型的异常检测技术。针对基于经典的马尔可夫模型方法的短时记忆特性忽略了数据之间的相互关联性,同时基于高阶马尔可夫模型方法的长期记忆特性模糊了历史数据与当前测试数据之间的相关性,降低了模型的可靠性的问题。 本文在这两种方法的基础上提出了基于动态马尔科夫模型的时间序列异常检测方法。该方法通过滑动窗口对序列数据进行分割,依据滑动窗口中数据的取值范围使用等宽度区间分割方法定义数据的状态,使用Pearson相关性分析方法确定高阶马尔可夫模型的阶数并建立模型,从而达到平衡记忆长度的目的,并能跟上时间序列的波动趋势。此外,提出了一种异常替换策略来防止已检测出的异常对后续模型建立的影响,以保证异常检测能够连续进行。使用合成数据和真实数据来分析验证所提出方法的各项参数以及测试该检测方法的性能。实验表明本文提出的基于动态马尔科夫模型的异常检测方法提高了适应性和检测准确性,降低了异常检测的误判率,并且克服了传统基于马尔科夫模型异常检测方法无法检测带趋势的非平稳时间序列的局限。 最后将提出的方法扩展到多维时间序列异常检测领域,并做了初步探索研究,提出了基于SVD(Singular Value Decomposition)特征分解和动态马尔科夫模型的多维时间序列异常检测方法,实验表明了此方法具有很好的理论研究意义以及广阔的研究前景。