论文部分内容阅读
平安城市系统是由某研究所开发的物联网系统。这个系统包括许多业务子系统,用来实现城市安保、交通调度和医疗急救调度等综合管理的功能。平安城市系统分为业务系统层和资源管理层。业务系统层包括许多业务子系统,这些业务系统是独立的子系统,负责实现某一块业务功能,比如交通调度系统。同时这些业务系统需要协同工作,实现一体化管理的功能。资源管理层使用基础设施即服务技术来管理底层的物理资源,并且以虚拟机的形式为上层业务系统提供资源服务。平安城市系统是一个复杂的综合性系统。由于系统的规模很大,为了使系统能够提供稳定可靠的服务,需要为系统部署高可用机制,降低故障概率,缩短维护时间。提高系统的可用性,一方面需要增强业务系统自身的可靠性,另一方面需要增强虚拟机的可用性。本文主要论述了虚拟机相关的高可用机制。资源管理层使用的系统是基于开源平台CloudStack重新开发的系统。由于业务系统的规模很大,虚拟机的故障率比较高,维护周期很长,不能满足系统可用性的要求。通过对现有问题的研究发现,现有的虚拟机在状态转换的时候容易发生异常。虚拟机在出现异常时,会一直处于异常状态,既不能提供正常的资源服务,又无法释放虚拟机占用的资源,并且虚拟机上的业务系统也无法提供正常的服务。针对系统现有的问题,主要从两个方面实现高可用机制。首先,增强虚拟机的异常处理功能。系统实时监测虚拟机的状态,当监测到虚拟机处于异常状态时,系统会捕获异常,并自动分析异常的类型,然后做出相应的处理。其次,增加虚拟机迁移功能。对于比较重要的虚拟机,为其增加自动迁移功能。虚拟机宕机时,系统会在原来的主机上自动重启虚拟机,如果虚拟机无法在原来的主机上重启,系统会选择其它可用的主机来重启虚拟机,使虚拟机尽快恢复正常,保证业务系统的连续性。通过这两种方式,缩短了虚拟机在发生异常时的处理时间,避免虚拟机一直处于异常状态,使虚拟机在最短时间内恢复正常。通过部署高可用机制,改善了虚拟机的可靠性,从而提高了系统的可用性。论文在阐述了高可用机制的基本概念、原理和方法的基础上,介绍了高可用机制实现的相关技术;分析了平安城市系统高可用机制的应用需求和技术需求,分别对系统的数据和过程进行建模;给出了系统的应用架构设计,设计了系统的具体业务流程;实现了系统的高可用机制。基于平安城市系统高可用机制系统的测试结果表明,高可用机制能够较好的改善系统的可用性,从而使系统可以更加稳定的运行,有效提升系统整体的可靠性,达到了预定设计目标。