论文部分内容阅读
在数据流闭频繁项集挖掘过程中,常忽略历史模式对挖掘结果的影响,并采用一种结构来标记闭频繁项集的类型,导致算法的效率不高.为此提出一种挖掘数据流时间窗口中闭频繁项集的方法NEWT-moment.该方法能在单遍扫描数据流事务的条件下完整地记录模式信息.同时,NEWT-moment提出的剪枝方法能很好地降低滑动窗口树F-tree的空间复杂度与闭频繁模式树NEWT-tree的维护代价.此外,该方法提出的时间衰减机制能区分历史和最新模式对挖掘结果的影响;并且,NEWT-tree直接存储闭频繁项集,可随时快速读取闭频