一种面向数据流的频繁项集挖掘算法

来源 :昆明理工大学学报:理工版 | 被引量 : 0次 | 上传用户:ivyjiawx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与传统静态数据库中的数据不同,数据流是一个按时间到达的有序的项集,这使得经典的频繁项集挖掘算法难以适用到数据流中.根据数据流的特点,提出了数据流频繁项集挖掘算法FP—SegCount.该算法将数据流分段并利用改进的FP—growth算法挖掘分段中的频繁项集.然后,利用Count Min Sketch进行项集计数.算法解决了压缩统计和计算快速高效的问题.通过和FP—Ds算法的实验对比,FP—SegCount算法具有较好的时间效率.
其他文献
企业的竞争。归根结底是人才的竞争。而人力资源的开发,是提高企业竞争力的有效手段。现代企业新设备、新工艺更新换代,新产品层出不穷,需要员工不断吸收新的知识和技能.以适应企
选取广州市海珠区果树保护区20世纪90年代(1:50000)地形图,1998年和2004年(1:25000)二期土地利用现状图为基本信息源,在MAP—INF07.0支持下,提取基本数据,通过对景观格局指数的计算和分
土地利用直接改变土壤侵蚀的方式和强度,具有突出的侵蚀环境效应.以黑惠江流域为例,探讨了滇西高山峡谷区土地利用对土壤侵蚀的影响.研究表明,本区土地利用内部转化以林地转化最为
技术创新与吸纳技术的经济意义技术创新是创新的重要形式.早在1999年,《中共中央、国务院关于加强技术创新,发展高科技,实现产业化的决定》就明确指出,技术创新是“企业应用创新的
滇东沉积磷块岩矿床是云南省重要的磷矿石资源地,东川区绿茂乡麻栗坪磷矿区地质研究程度低,矿山开发利用程度不高.结合区内的详查工作,系统阐述了矿区的成矿地质背景、矿区地质、
根据《项目管理知识体系》的定义,项目管理是指把各种系统、方法和人员结合在一起.在规定的时间、预算和质量目标范围内完成项目的各项工作。纵观我国软件项目管理的发展历程.项
这些年来,我国高度重视公共图书馆的管理发展,并推出了相应的公共图书馆法,旨在为社会大众提供更好的阅读服务。实际上,公共图书馆法对高职图书馆服务模式的转变及服务质量的
当前.我国政府网站正处于努力建设服务型政府网站的过程中.而政府网站的特性决定了其提供的服务应该兼顾全体社会成员的需要.尤其应该兼顾广大残疾人获取、利用政府信息的需要。
针对昆钢6号高炉(2000m^3)炉缸炉底情况,应用传热学原理,开发了对炉缸炉底侵蚀状况进行监测的二维数学模型.通过对模型的计算,得到了炉缸炉底的温度场分布,从计算所得到的侵蚀图来看
信息技术的发展给传统出版行业带来了挑战,电子出版,网络出版已经成为当下适合人们需求的出版方式。传统出版行业必须要深刻把握电子网络出版行业中的编辑技术,更新传统出版