论文部分内容阅读
时序异常在数据挖掘领域有许多应用,包含聚类性质的改进,数据过滤,总结以及异常检测。数据挖掘中的一个重要方面是异常检测,异常检测不同平常的事,它是一种小模式,这种小是相对聚类来讲的,它区别于其他数据的原因在于不集中于数据间。这里要讨论的是数据挖掘中时间序列这一概念和异常检测算法,时间序列异常检测则是从在自然状况下所形成的时间序列挖掘中出检测出异常的子序列。时间序列分析预测是根据市场过去的变化趋势预测未来的发展,它的前提是假定事物的过去会同样延续到未来。事物的现实是历史发展的结果,而事物的未来又是现实的延伸,事物的过去和未来是有联系的。市场预测的时间序列分析法,正是根据客观事物发展的这种连续规律性,运用过去的历史数据,通过统计分析,进一步推测市场未来的发展趋势。市场预测中,事物的过去会同样延续到未来,市场未来不会发生突然跳跃式变化,而是渐进变化的。满足数据挖掘应用的企业需要具备的条件:大量的客户,竞争激励并且有差异化的需求,完整的电子数据。数据挖掘行业是否能够长存要综合靠考虑公司的具体情况,比如领导是否重视,部门或岗位是否固定长期,对挖掘项目有没有合理计划,是短期还是长期等等。数据挖掘在国内也是最近几年才流行起来的,大有潜力可挖。在这里对时间序列的分析方法和异常检测的方法加以研究,并针对时间序列异常检测进行了深入的研究。首先对一种强制执行的检测算法进行了研究,这种时间序列异常强制检测算法是一种利用基于循环检测原理所进行的检测算法,它通过对自身的匹配能够有效地检测出异常的。基于以上的算法研究又进一步研究一种在检测过程中引入启发规则的检测算法,时间序列的异常检测算法是一种启发式强制算法更高效的算法。针对上述两种时间序列异常检测算法通过VC环境完成对算法思想实现,为了能够展示异常检测还做一些相关的时间序列数据操作的实现。针对一些实际的时间序列数据集进行测试,以证实算法本身的效用并用图形的形式展示出来。