面向大数据挖掘的多任务跨平台可视化作业工具研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:vuip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,大数据与云计算产业获得了蓬勃发展,但大数据挖掘引擎还受限于其专业化的使用方式而产生了技能门槛,同时移动终端的普及使人们的工作环境不再固定。在集群常为多用户共享的情况下,单个任务常占用大量的计算资源,而多任务对同一数据进行挖掘将不可避免地产生重复运算,从而带来了调度灵活性不高、资源闲置、处理效率低等方面的问题,而现有的大数据挖掘引擎尚未对此进行优化,从而限制了大数据挖掘引擎的应用。针对以上问题,在不改变现有大数据挖掘引擎的基础上,本文设计并实现了一种面向大数据挖掘的多任务跨平台可视化作业工具,分析了大数据挖掘在多任务场景下的跨平台可视化需求与存在的问题,并给出了相应的解决方案。本文的主要研究工作归纳如下:(1)针对当前大数据挖掘引擎的易用性差的问题,设计并实现了跨平台可视化前端操作界面。实现了采用可视化工作流模型的数据挖掘工作台、分布式文件系统(Hadoop Distributed File System,HDFS)可视化管理组件以及Web-Shell远程命令行组件,为用户提供了灵活的操作方式及可视化支持,具有较强的跨平台特性,解决了当前大数据挖掘引擎的易用性差的问题。(2)针对当前大数据挖掘引擎在多任务场景下的任务调度灵活性差与资源利用率问题,提出并实现了任务拆分提交调度方案。通过对可视化建模生成的工作流进行拆分,使子任务的资源需求降低,从而提升任务调度的灵活性,解决了当前大数据挖掘引擎在多任务场景下任务调度灵活性问题与资源利用率问题。(3)针对当前大数据挖掘引擎在多任务场景下的重复运算问题,提出并实现了任务去重及弹性资源配置方案,通过中间结果复用与弹性资源配置有效提高任务处理效率,解决了当前大数据挖掘引擎在多任务场景下的重复运算问题。理论分析与实验对比表明,本文实现的面向大数据挖掘的多任务跨平台可视化作业工具在不改变当前大数据挖掘引擎的前提下,能够有效降低对用户的技能门槛,提供灵活的使用方式以及良好的用户体验,同时在多任务应用场景下有效提升了任务调度灵活性以及集群资源利用率与任务处理效率,弥补了现有大数据挖掘引擎的不足。
其他文献
<正> 肝硬化腹水的治疗。比其它类型液体潴留的治疗更困难,因为利尿容易继发电解质紊乱、脑病及肾功衰竭.现对十年来肝硬化腹水治疗进展综述如下: 一、利尿剂的应用 1970年,L
改革,是绝地求生的一种选择,是打破陈规的博弈;改革是一种担当,是对一方领导者胆略和胸怀的考量;改革更是一门艺术,是改革者朝乾夕惕、呕心沥血的智慧结晶。
本文介绍临床输液系统的现状及其发展趋势,比较了当前国际上流行的五大厂商的输液系统相关产品,并对未来输液系统在临床中的应用趋势作以展望.
韶山是国家级重点风景名胜和首批国家级重点风景旅游区 ,旅游资源丰富 ,具有很大的内在价值和开发潜力。因此 ,理顺体制 ,加强管理 ;加大投入 ,搞好基础设施建设 ;改造现有旅
<正>鲶鱼?野蛮人?瓷器店里的公牛?……来搅局?来颠覆?来闹革命?……从4年前所谓互联网金融时代开启,互联网巨头们开始扎堆进入金融行业,其就一直被视为这个行业里最大的变数
小学音乐课开设的一大核心目的就是培养学生的审美观,但要真正达到这个目的存在一定困难。此文探讨怎样让学生感受到音乐的美丽,进而在小学音乐课上培养学生的审美观。
本文首先介绍了本杰明·布鲁姆的掌握学习理论的主要内容,然后在单片机教学的备课、上课、实验和考核等环节提出了有效可行的学习策略,借助测验反馈机制,调整教学方法。新的
在高职英语教学中除了教授英语语言的基础知识外,还应该在教学中充分认识到文化知识的学习对英语语言学习的重要性,并且进行适当的文化导入。从词汇学习、影视材料的学习、阅
<正> 读贵刊1980年第九期《芍药甘草汤的研究进展》一文,获益颇多,启发甚大。为从临床、文献和现代科学的不同角度来研究古方,提供了宝贵的经验。兹就笔者于1974年整理上海中
随着科技的发展与社会的进步,地质钻探行业得到了快速的发展。由于地质钻探施工工程量相对比较大、施工工艺相对比较复杂,在施工过程中难免会存在诸多安全性问题,因此,地质钻