论文部分内容阅读
本文旨在把数据挖掘技术引入到地震预报领域,研究并行关联规则、聚类等在地震预报中的应用,着重讨论并行关联规则在地震地区相关性预报中的应用。
首先,对地震数据进行了数据预处理工作。地震目录数据是由地震时间、经度、纬度、震级组成的数据,如果直接对其进行关联规则挖掘,挖掘出来的结果是一些点与点之间的关联,是没有意义的。本文针对地震目录数据的特点,对地震数据进行了数据预处理工作,提出了分块、画圆、聚类等数据离散化方法和主成分分析法,将地震数据处理成我们需要的地震数据格式。在分块方法中,将地区位置根据经度、纬度分出一个一个块来,找出块与块之间的关联;在聚类方法中,运用聚类算法本文将中国地震划分成了20个地震带,所得结果与地震专家得出的结论进行比较,具有一定的参考价值,并可以利用所得结果去寻找地震带之间的地震相关性。
其次,为提高运算速度和处理大数据量的需要,对关联规则算法进行了比较深入的研究,针对预处理后的数据的特点,每一条数据含有大量的项集,提出FPM_LP(FastParallelMiningofLocalPruning)并行关联规则挖掘算法。算法采用主从模式设计,并采用了多种剪枝技术,其中局部剪枝技术剪掉了非局部频繁项集以使生成侯选项集的频繁项集减少,经在自强2000机器上运行,算法效率得到了有效的提高。
再次,运用并行关联规则算法FPMLP,对地震地区相关性进行了挖掘,挖掘出了一批有意义的结果,例如云南与新疆、新疆地区内部的地震相关性等,得到了地震专家的肯定。
最后,本文还将并行算法整合到“并行数据挖掘在地震预报中的应用”平台中,利用平台提供的资源对专家提供决策支持。具体应用到对地震地区相关性的预报中,应用结果表明,并行算法在地震数据数据挖掘和决策支持上取得了较好的结果。