论文部分内容阅读
随着互联网技术的发展以及商业化海量数据处理需求的提高,云计算逐渐走入人们的视野。它是在网格计算、分布式计算、并行计算的基础上发展起来的。云计算的思想最早是由Google公司提出的,现在市场上很多大公司都已经有了自己的云计算平台,如亚马逊的EC2、微软的Azure、IBM的“蓝云”等。Google公司在2003年和2004年发表两篇关于云计算思想的论文。Hadoop就是Apache公司在此思想基础上改进并研发的一个开源云计算平台。作为一种新兴的计算模式,云计算在受到广泛应用的同时,也逐渐暴露了很多问题,几家大公司的云平台相继出现故障。云安全问题引发了业界的众多舆论,很多公司对云计算望而却步。一时之间,安全性成为限制云计算发展和应用的重要瓶颈。由于它的开源高效性,Hadoop越来越受到业界的青睐。它的应用领域涉及广泛,包括海量数据处理、机器学习、电子商务、数据挖掘以及科学计算等多个领域。然而安全性仍然是Hadoop无法避免的问题。本论文主要针对Hadoop平台下的云安全问题进行研究。首先对云计算的起源、发展、特点、基本架构、服务模式等做了研究。然后仔细研究了Hadoop的算法思想以及运行机制。最后对现有的Hadoop平台进行分析和研究,找出了其中存在的安全漏洞,并提出了改进方法。论文的主要工作内容如下:1)对云计算和Hadoop的定义、发展、特点等做了仔细的研究。首先研究了云计算的基本概念、服务方式和基本框架,重点研究了云计算的关键技术,然后研究了Hadoop的算法思想、基本架构、运行机制等,介绍了Hadoop的安装配置过程。2)研究了云计算面临的安全问题、安全框架以及用户应对策略。3)重点研究了Hadoop云平台现存的安全漏洞、安全机制以及用户应对技巧。4)目前Hadoop在数据存储中并没有对数据进行加密,本文提出了改进的DES加密算法。目前对DES算法的改进基本都是通过加长密钥长度来提高安全性,但一般是以牺牲时间效率为代价的。本论文提出的算法在不改变传统DES算法时间复杂度的情况下,采用加长密钥长度的策略提高了安全性。并且通过实验测试,得出结论,本算法达到了传统DES算法的加密效果,同时加长的密钥长度提高了DES算法抵抗暴力攻击的能力,提高了安全性。通过本论文的研究,提出了改进方法,较好地解决了Hadoop的安全性问题,使得Hadoop运行更加安全稳定。