论文部分内容阅读
大量的大规模密集型数据需要存储在多个服务器中,而应用越来越广泛的云计算环境很好地解决了大规模密集型数据在分配过程中遇到的规模性问题。随着云计算技术的发展,云环境下的数据分配已成为云计算的一个重要组成部分,并在资源利用,负载均衡等方面有着极其重要的作用。
同时,云计算环境中多服务器之间的数据分配也有着诸多挑战。首先,大规模的廉价服务器会给云计算下服务的实时性带来阻碍,用户不能快速而准确的掌握其环境下的每一个服务器状态。其次,密集型的数据分配会带来服务器之间数据量的传输,从而导致数据访问效率的低下。最后,单位时间之间数据负载的波动会引起服务器的访问瓶颈,从而带来较低的资源利用率和服务质量。
本文首先以大规模密集型数据中的数据流为建模对象,提出了一种数据分配算法,在保证服务器负载平衡的基础上兼顾了密集型数据之间的依赖性。实验表明,相比于同类的数据分配算法,本文提出的算法具有更好的综合表现,特别是在保证服务器的负载平衡方面,效果尤为突出。而针对数据分配之后的负载波动或者是服务器过载现象,本文提出了一种基于负载控制的数据调整策略。该策略利用R-tree索引来掌握云计算的全局环境,使用两步裁剪策略筛选服务器,通过服务器选择策略寻找目标服务器来接受热点数据。实验表明,相比于同类的数据调整策略,本文提出的策略能够更为快速且有效的通过数据调整的方式完成服务器负载的调控工作。