数据流时间窗口中闭频繁项集的在线挖掘

来源 :中国科学技术大学学报 | 被引量 : 0次 | 上传用户:yzhyzhyzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据流闭频繁项集挖掘过程中,常忽略历史模式对挖掘结果的影响,并采用一种结构来标记闭频繁项集的类型,导致算法的效率不高.为此提出一种挖掘数据流时间窗口中闭频繁项集的方法NEWT-moment.该方法能在单遍扫描数据流事务的条件下完整地记录模式信息.同时,NEWT-moment提出的剪枝方法能很好地降低滑动窗口树F-tree的空间复杂度与闭频繁模式树NEWT-tree的维护代价.此外,该方法提出的时间衰减机制能区分历史和最新模式对挖掘结果的影响;并且,NEWT-tree直接存储闭频繁项集,可随时快速读取闭频
其他文献
研究了一类链环上型为8k的线性码的支重量分布与Hamming重量分布的关系,利用MacWilliams恒等式建立了该链环上线性码的支重量分布与其对偶码的支重量分布之间的关系.
期刊