论文部分内容阅读
本文首先提出了一种带有时间间隔约束的序列模式挖掘算法。此算法在PrefixSpan算法的基础上,对第一层投影数据库的构造方法进行了扩展,并在搜索频繁项时绑定了时间间隔约束,从而得到满足时间间隔约束的序列模式。在挖掘带有时间间隔约束的序列模式时,此算法的性能明显优于GSP算法。其次,提出了一种基于模式增长的泛化序列模式挖掘算法。此算法的基本思想是首先搜索频繁项,然后通过递归地挖掘投影数据库得到相应的泛化序列模式子集,并在构造投影数据库和序列模式增长过程中直接引入滑动时间窗口和时间约束,从而得到泛化序列模式。此算法继承了模式增长算法的优点,其性能明显优于GSP算法。最后,提出了一种新的多维序列模式挖掘算法。此算法首先在序列信息中挖掘序列模式,然后针对每个序列模式,仅在包含此模式的元组的多维信息中挖掘出相应的多维模式,从而缩小了搜索空间。对于多维模式的挖掘,本文基于H-tree结构提出了一种新的快速有效挖掘方法。在维度较高时,此算法能获得优于UniSeq算法的性能。