云计算下关联分类技术的研究与实现

被引量 : 0次 | 上传用户:jhxuxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算(Cloud Computing)技术是互联网快速发展以后才出现一个全新概念。时隔仅仅几年,云计算受到各界关注的程度就超过了网格计算(Grid Computing)。它在本质上讲它是一种商业计算模型,是将计算任务分布在大量计算机构成的资源池上,形成庞大的计算力来满足用户所需要的服务。简而言之,其原理是通过网络将庞大的计算任务分割成无数个较小的子任务,然后分发给各个计算节点处理,等处理完成之后将结果回传给用户。利用这种技术解决方案可以实现强大的计算能力。总之,云计算为普通用户和一般机构提供了强大的计算能力,并且大大地降低了成本。伴随着信息技术的飞速发展,信息量也在爆炸式的飞速增长。从这些海量的数据信息中挖掘出有用的信息,是件非常不容易的事情。许多传统数据挖掘算法往往只能适用小规模数据,当遇到处理海量数据时,它们往往会因处理量的非常巨大而速度减慢甚至无法运行。这无疑是许多传统挖掘算法的瓶颈。云计算它以其可靠、方便和无限强大的计算能力为海量的数据挖掘提供了可能。如果我们能够将传统的数据挖掘算法做改进,使其能部署在云计算框架下运行,对海量数据的处理中遇到的瓶颈问题将能迎刃而解。本文首先介绍云计算基本实现原理。当前各个知名的IT巨头提出的云计算解决方案各不相同。Google公司是云计算领域最知名厂家,它的解决方案简单而又高效,得到大多数人的认可[8]。所以本文主要以Google公司的云计算技术为例介绍相应的技术和策略,同时还主要介绍了开源Hadoop系统及分布式文件系统HDFS和并行处理框架与编程模型MapReduce。接着研究当前非常活跃的关联分类算法。在深入的研究关联分类算法的源泉关联规则算发的同时,并分析其传统算法的技术瓶颈。然后针对这种技术瓶颈提出一种改进方案。实验验证改进方案可以取得更好的性能。在本文的最后,对理论的研究做实验验证。并将这种算法Mapreduce化后部署在Hadoop实验集群平台上运行。实验证明关联分类在Hadoop集群上实现海量数据的分类能达到非常理想的效果。
其他文献
本文采用比较的方式,对中美两国产品责任惩罚性赔偿制度进行研究。具体分为对中美两国产品责任惩罚性赔偿立法背景的比较,主体的比较、归责原则的比较、适用条件的比较以及惩
在非同卵双生子间进行同种移植,几乎必然发生排斥反应.手术技巧的改进、器官灌注与保存、HLA配型和免疫抑制药物的联合使用,极大地提高了移植物的存活率和存活时间.
中国经济发展自进入新常态时期后,产业结构不断完善不断转型升级,其中文化产业和旅游产业均作为绿色朝阳产业和战略性支柱产业,是产业经济发展中的重要一部分,两者的融合发展
本文采用HNO3和HClO4消解土鳖虫样品,火焰原子吸收光谱法测定其中Ca、Mg、Zn、Mn含量。方法简单,精密度高,加标回收率在96.86%—102.46%之间,相对标准偏差(RSD)小于2.36%,结
<正> 随着社会主义市场经济的发展和医疗卫生改革的不断深化,医疗卫生事业取得了可喜的变化,也给医院的发展建设增强了活力,但不可否认医德建设出现了滑坡。首先是医疗行业不
林木属于易燃物品,因此各个地区根据每年气温变化都要将一定时间作为森林防火期,并在此期间禁止一切砍伐、进山等活动,以确保林木免受火灾侵害。而一些地区由于受到各种因素
目的探究丁苯酞软胶囊联合依达拉奉用于临床治疗脑梗塞的疗效。方法选择2014年9月-2016年9月来我院治疗脑梗塞的患者74例作为研究对象,按照随机分组规则,分成对照组、观察组,
口译并非是一种盲目的汉英口头转换行为,它总是自觉或不自觉地受一定的理论知识与实践影响。本文浅要分析了模因理论与口译的关系及相关口译策略技巧。阐述了口译理论对口译实
现在,供电质量越来越引起大家的关注。高耗能、电气化铁路等大量非线性、冲击负荷的接入,造成电网中的电能波形发生畸变,尤其电铁谐波源引起电压凹陷,结束时又快速恢复,造成
微热管已经成为电子器件导热的理想元件,但随着电子芯片不断高功率化和小型化的发展,使得电子产品对微热管的传热性能提出了更高的要求。微热管主要由管壳、吸液芯和端盖组成