论文部分内容阅读
分布式实时数据库是为了满足20世纪八、九十年代开始出现的计算机集成制造、工业过程控制、空中交通管制、智能交通、股票交易监控系统等新的应用领域对数据库提出的新需求,并随着计算机领域的发展和数据库技术的变革应运而生的。分布式实时数据库由于实际应用的需求已成为目前研究的热点。数据缓冲在数据库系统中发挥着重要的作用。由于内存访问时间远远低于磁盘访问时间,在对事务进行处理时,若能直接从内存中取到所需数据将会节省很多时间。许多分布式实时数据库为了满足实时性的需要大多选取内存数据库来存储数据库的全部或部分工作版本。但实际上,实时数据库中的数据是指数级增长的。当数据库中数据容量过大时,将其都存放在内存中是不现实的。因此,提供有效的缓冲区管理显得尤为重要。本文在研究实时数据库缓冲区管理算法的基础上,针对分布式环境提出了层次缓冲区替换算法。该算法使用了树形结构,并给数据页赋予了实时性质(比如截止期、时间戳等),目的是为了在进行缓冲区替换时能选出合适的替换页,提高实时事务的缓冲区命中率,降低截止期错失率。负载平衡技术是分布式系统中重点研究的内容。分布式是相对集中式而言的,分布式环境中的各个结点可以并发或并行处理一个任务或多个任务。但是,因结点处理能力不同或分配到的任务大小不同,容易出现各结点负载不平衡的情况。负载平衡算法是针对这种情况提出的解决方案。目前有关负载平衡的算法很多,本文在研究相关算法的基础上,结合分布式实时数据库环境提出了基于网络预测技术的负载平衡算法和基于数据复制技术的负载平衡算法。其中,使用网络距离预测技术是为了给全局实时数据库系统进行负载分配和负载迁移时提供依据。通过使用预测的结点间的网络距离来选择实时网络环境中最佳实时事务处理结点和距离重载结点最近的轻载结点。通过这样方式可以节省实时事务时间,提高事务截止期完成比例。而基于数据复制技术的负载平衡算法则是分别使用了数据库中数据复制和对等网络中处理热点数据的概念,通过在轻载的实时数据库系统结点之间,在合适的时机将最近一段时间内的热点数据复制到距离源复制结点最近的目标复制结点上为以后的负载分配提供更好的负载平衡环境。通过对比实验验证了以上算法的有效性。