论文部分内容阅读
云计算技术的虚拟化、可扩展、按需服务以及资源池灵活调度等特性颠覆了传统网路技术模式和商业模式,海量非结构化的数据分析处理急需一种高效并行的编程模型。目前国内外的解决方案具有多种模式,而由Apache软件基金会研发的Hadoop作为大数据分析处理的主流技术迅速崛起。Hadoop是一个分布式系统基础架构,也是一个可开发与运行处理大规模数据的软件平台。Hadoop作为当今云计算与大数据时代背景下最热门的技术之一,其相关生态圈与Spark技术的结合一同影响着学术发展和商业模式。而HadoopSpark结合是未来的趋势。