论文部分内容阅读
互联网的普及与软硬件的迅速发展使得人们的生活方式发生了巨大的改变,云计算作为一种新型的服务使用和交互模式应运而生,这种模式的出现使网络中的服务越发合理并且高效。随着数据密集型应用越来越多的移置到云端中,大数据处理得到了研究者们的广泛关注。为了有效且快速地对数据型应用进行处理,人们往往采用MapReduce/Hadoop分布式处理框架。在该种计算框架下输入的大规模数据将会被划分成为若干个子数据块,并且这些数据块相互独立的。在这样的情况下,如果存储数据的数据节点和其对应计算节点之间的最大访问延迟没有受到限制,那么任务的运行时间将在很大程度上会被延迟。与此同时计算节点之间往往需要相互通信以收集各自数据运行的结果,因此被分配用于处理数据节点的计算节点之间的最大访问延迟也需要受到限制从而控制总的运行时间。本文在对云计算产生的背景、基本概念、特点以及体系结构等云计算中的基本概念做了相关介绍后,就传统云计算架构与分布式云计算架构的异同和数据节点不同的网络拓扑结构展开本文的研究。主要做了以下几点工作:第一,根据分布式云计算环境下的虚拟机调度问题的特性,将本文研究的问题形式化,建立数学模型,并对该问题目前的研究现状进行相应的分析。第二,本文对蚁群算法简单介绍之后,以基本蚁群算法的固有缺点引入最大最小蚁群算法作为本文的基础算法,并且在详细分析本文研究问题的具体特点后,对算法进行了相应的优化和改进。例如针对蚁群初始路径选择的随机性提出了基于具有最优迭代思想的初始位置选择策略,优化最大最小蚁群算法的信息素更新策略。与此同时提出两种局部搜索策略:双重变异搜索技术以及K-NN搜索技术以提高算法的收敛速度和解的质量。鉴于蚁群算法本身是一种并行算法,本文引入并行蚁群策略从工程上使算法的收敛速度得到提升。第三,基于Matlab软件进行仿真,首先对算法的性能进行评估,对优化最大最小蚁群算法的初始参数进行了调整,并且在此基础上以总访问延迟、最大访问延迟以及每次迭代过程中获得的最优解作为判断依据对本文提出的算法和目前最优的算法的优劣性进行对比。其次是系统实验分析,该板块主要选取了四个新型数据中心网络拓扑架构,并在这四个架构上以最大访问延迟为判断依据对本文提出的算法和目前最优算法的性能效果进行了评测。通过上述两种实验验证了本文提的算法是有效并且优质的。