支持多计算模式的大数据系统的研究

被引量 : 6次 | 上传用户:BLGKLING
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据的时代的到来,大数据技术发展迅猛,其中最为典型的变化是计算模式的丰富多样,由最初的批处理计算发展到后来的流计算,实时交互式计算等。但不同的计算框架的应用场景比较有限,批处理计算虽能轻松处理海量数据,但响应时间较长;与批处理不同,流式计算是一种连续计算的模式,能够快速响应用户事件;实时交互计算以一种交互式的方式实现大数据处理,也有着快速的响应速度。由于大数据应用场景越来越复杂,传统的单一计算框架模式不能很好的满足数据应用的要求。现在出现了一些关于混合系统的研究,旨在融合多种计算系统,统一大数据计算平台提供多种计算服务。论文研究支持多计算模式的大数据系统。构建支持多种计算模式的统一大数据系统会面临多种问题,包括系统上层接口的不统一性,异构系统的差异性,集群资源统一调度的问题等等。本文研究试图解决以上问题,研究重点为统一的语言抽象层研究,多计算框架支持,编译优化,成本模型评估这四大部分。设计并实现了支持多计算模式的系统原型,在用户层,为了提升系统的易用性,以类SQL语言做查询层语言。目前支持批处理与流处理这两种计算模式,用HBase作为存储端,提升实时查询性能,最大的特点是抽象出了一套分别针对MapReduce与Storm任务的成本评估模型,依据计算出的成本实现智能选择底层的计算框架。经过系统的测试对比,总体性能优于单计算模式的Hive,与SummingBird相当。由于系统可以智能选择计算框架,从整体来看,系统能够兼顾处理速度与系统的吞吐量。当数据量大时,系统的吞吐量比SummingBird的Storm引擎提升16~20%。当框架选择流计算框架时,速度比Hive约提升了33%。
其他文献
目的研究限制流量的部分门静脉动脉化(APS)重建肝血流对肝脏的影响。方法建立APS和限制流量的APS重建肝脏血流的大鼠实验模型,对肝脏血流动力学和结构改变进行为期6个月的对
阐述了包装结构设计的依据 ,应具有的性能 ,包装的结构设计形式 ,以及包装结构在现代包装装璜设计中的作用
湖北省兴山县顺利完成了17处崩滑体、3处长2 939.07 m库岸防护的二期地质灾害的防治工作,为135 m、139 m水库蓄水创造了条件。在兴山县二期地质灾害防治中,紧紧围绕“挡(抗滑
目的:探讨舒血宁注射液发生不良反应的规律和特点,以期为临床合理用药提供参考,为做好风险管理提供依据。方法:检索中国知网数据库(1979年1月—2014年3月)中舒血宁注射液致不
目的 :研究对34例胆囊结石合并胆总管结石患者进行腹腔镜联合胆道镜手术的临床效果。方法 :将2014年1月至2018年11月南京市江宁医院收治的68例胆囊结石合并胆总管结石患者平
相当长一段时间以来,传统的鬼怪玄奇题材电影在大陆电影市场渐渐式微,而由蒲松龄《聊斋志异》乃至更早建立起来的鬼神题材在港台的电影历史上反而佳作屡出。随着大陆与港台地
本文从传播学的角度对"网络推手"出现的必然性作了细致而透辟的论证,同时也对网络推手的理性嬗变趋势作了简单扼要的分析。
目的:探讨应用阿托伐他汀+抗血小板药物治疗脑血栓的临床疗效。方法:将本院2018年1月-2019年1月收治的130例脑血栓患者随机分成研究组(n=65)与对照组(n=65),对照组给予患者常
将 50例肝肾阴虚型骨痹患者随机分为治疗组和对照组 ,各 2 5例 ,分别采用辨证选穴和局部选穴或阿是穴治疗。结果显示辨证选穴的疗效优于常规选穴。
本文认为康海的《中山狼》杂剧,非为讽刺李梦阳而作,是为自己被诬陷罢官,揭露统治阶级的豺狼本性而作