论文部分内容阅读
FP-growth算法是当前挖掘频繁模式的有效算法之一,但FP树的节点占用空间较大,长时问占用内存不释放,挖掘过程中需要产生大量的条件FP树,因而时空效率不理想。提出了一种循环十字链表结构用作存储事务数据库,而不生成FP树,在挖掘频繁项集的过程中,这种链表结构逐步缩小,减少了内存的使用率,通过构建排序的条件频繁模式树挖掘频繁项集。理论分析和实验表明基于这种结构的排序条件频繁模式树挖掘频繁项集具有较好的时空效率。