基于Spark可视化大数据挖掘平台

来源 :第15届中国系统仿真技术及其应用学术会议 | 被引量 : 0次 | 上传用户:toponeforever
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在千亿级大数据环境下,特征挖掘、实时处理、即席分析、离线计算等场景对计算、存储的性能要求非常高。基于传统的关系型数据库、分布式Hadoop平台实现的数据挖掘平台,无法满足所有的计算场景的要求。鉴于此,本文介绍了基于内存迭代计算框架Spark,实现大数据环境下的可视化大数据挖掘平台。该平台不仅充分利用了内存计算,提高了迭代速度,而且支持各种分布式计算、存储场景,具有很强的扩展性,解决了大数据环境下各种计算场景问题。
其他文献
肺癌是最常见的恶性肿瘤之一,它的发生和基因突变密切相关,所以建立分析基因突变的快速灵敏的检测方法至关重要,目前用于检测基因突变的方法多种多样。 限制性片段长度多态性
  随着我国"文化大繁荣"战略的推进,江苏省博物馆事业得到了蓬勃发展。然而在博物馆高歌猛进的同时,由于主管部门和行政区划的分割,技术人员和展品的限制,使得各个博物馆尤其是
  随着社会经济的迅速发展,人民群众对精神文化的需求、对博物馆的要求越来越高。本文以淮安市博物馆为例,结合近年来工作的具体实践,从现状、实际做法与展望三个方面阐述区域
  文化大发展大繁荣的背景之下,中小博物馆保管部要抓住机遇,迎接挑战,在稳固基础的同时,挖掘藏品内涵,增强工作的透明度,转变收藏思路,为博物馆事业的发展做出更大的贡献。
  当前,加强文化建设、促进文化大发展大繁荣已经成为全民族共同的责任。作为文化传播、传承和创新的机构,博物馆在国家全力推进文化发展的历史背景下,如何在文化建设中承担更
尾矿坝是由尾矿堆积碾压而成的坝体,主要用于堆存金属和非金属矿山进行矿石选别后排出的尾矿或工业废渣。一般情况下,坝体高度可达几十米甚至上百米。如此庞大的岩土体一旦溃坝
大数据是信息技术和计算方法迅速发展的必然产物.商业数据、科学数据和网页数据等促使数据的种类日益增多、规模呈爆炸式增长,大数据时代已经到来.大数据已成为继物力和人力
植物次生代谢产物是人类利用植物资源进行药物、农药等开发的重要物质基础,对植物体内化学成分及化合物活性的研究是合理利用这些资源的重要前提。本文研究了糖胶树叶非碱性成分和抗植物病原真菌活性化合物的筛选。1.糖胶树叶非碱性成分的研究:糖胶树[Alstonia scholaris (L.) R. Br.]叶是我国一些少数民族地区常用的止咳良药,用于痰热阻肺所致的咳嗽、咯痰,及慢性支气管炎,百日咳等症。有关
  本文在对空间信息数据格式分析的基础上,构建了一个空间信息数据大批量生成工具,有效地解决了某地区大批量空间信息数据快速导入、处理和合并的问题。
  自然语言处理技术是计算机科学与语言学的交叉学科,是人工智能的一大分支,主要解决机器理解人类语言的技术问题。该技术应用比较广泛,典型应用有语音识别、文本挖掘、情感分