海量高维数据下的频繁项目集挖掘算法研究

来源 :计算机应用与软件 | 被引量 : 3次 | 上传用户:luowenying124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁项目集的挖掘是数据挖掘领域最重要的研究方向之一。近年来,以互联网为代表的信息技术加速着全球的数字化进程,在给人们生活带来便利的同时也产生了规模非常庞大的数据,而且这些数据的维数非常高。因此,针对目前的大规模数据,主要研究海量高维数据的频繁项目集挖掘算法。提出了高效的、负载均衡的、扩展性良好的频繁项目集挖掘算法,同时设计了基于MapReduce编程模型的分布式算法。实验结果显示,该算法在时间复杂度和空间复杂度上相比传统算法都有明显的提升。
其他文献
鸦胆子别名雅旦子、鸭蛋子、老鸭胆,是苦木科植物鸦胆子(Brucea Javanica L.Merr.)的干燥成熟果实,性味苦、寒、有小毒,归大肠、肝经,始载于《本草纲目拾遗》主产于广西、广东
随着互联网技术的飞速发展,信息的多样化及产生速度有着质的飞跃,促使数据呈现爆发式的增长。大量的数据中势必蕴含着很多有价值的信息,数据挖掘就是在这些数据中“沙里淘金
8月12日,国家文物鉴定委员会2005年全体会议在北京召开。国家文物局党组书记、局长单霁翔,副局长董保华、童明康出席了会议。
主旋律展览是以弘扬时代主旋律、传播先进文化为主题的展览。江泽民同志将主旋律概括为:一切有利于发扬爱国主义、集体主义、社会主义的思想和精神;一切有利于改革开放和现代化
近年来,受广深港高铁、港珠澳大桥、国家环保政策、中美贸易战等因素影响,广东航运A公司的航运物流板块业务板块受到了较大的冲击,近几年业务呈现不同程度的下跌,因此广东航
在基于隐马尔可夫模型(HMM)的联机手写维吾尔文单词识别中,语言模型是非常重要的一部分,对整个识别系统的识别效果产生重要影响。好的语言模型可以减少由训练模型不够合理而产生的误识,因此,选择一种合适的语言模型显得至关重要。分别对2-Gram统计语言模型和上下文有关的规则语言模型作实验对比,结果表明,基于上下文有关的规则语言模型在维吾尔文手写体识别中取得了较满意的结果。
研究提供数字认证基础服务的OpenID协议认证机制,设计并实现了基于OpenID的身份认证系统。该系统兼容OpenID1.1和OpenID 2.0规范,实现三个扩展协议,并且通过具体应用分析了其安全性。使用该标准认证系统可以整合其他的登录认证系统,实现单点登录。
能源匮乏和环境污染已成为当今世界各国所面临的两大难题,柴油机凭借高热效率和高可靠性得到越来越广泛的应用。利用自制的电控恒温燃油预热装置,对柴油发动机进行燃油室外预热
为贯彻国务院关于整顿和规范文物市场秩序的要求,推动整顿工作的进一步深入,2001年12月11日和20—26日,国家文物局会同公安部、国家工商行政管理总局、文化部组成联合检查组,分别
应用于无线Ad Hoc网络中的机会路由,结点转发候选集的选取通常是基于最短路径期望传输次数,没有充分考虑无线网络结点进行数据转发的广播特性。以多路径期望传输次数为路由量度,提出一种最优转发候选集算法MCET。实现对无线网络中除了目的结点以外的所有结点选取考虑多路径转发期望值的转发候选集,并在按照结点选取的顺序依次优先排列优先级。仿真结果表明,比较于传统的基于最短路径期望传输次数的机会路由,应用了最