应用软件运行状况全掌握

来源 :计算机世界 | 被引量 : 0次 | 上传用户:acecar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在业务数据和业务处理逐步集中,信息化日益普及的大背景下,软件系统的大型化和复杂化是必然趋势,这就对软件系统的可用性提出了更高的要求。一般而言,软件系统的高可用性是由软件的各项技术指标综合决定的,如软件系统的稳定性、安全性、可维护性、系统性能等。系统实现了高稳定性、高可维护性、高安全性、高性能,即可以取得高的系统可用性。从应用角度来说,提高这些技术指标的方法可以分为两大类,一是在问题出现前预警,二是在问题出现后有高效的解决手段,通俗地说就是及早发现和快速解决。
  如何为运维人员提供充足、及时的预警,如何为运维人员跟踪解决问题提供有力的支持呢?孙子说“知彼知己者,百战不殆”,现代军事领域也有一个论断是:“发现即被消灭”,说的都是侦察手段的重要性,如果战争一方的行动完全被对方掌握,那他被消灭就是很容易的事情。同样在应用程序运行维护过程中,如果应用软件系统的各种运行状态、各个模块、各个函数、甚至每个数据的变化都是可知的、可跟踪、甚至可预测的,也就是说这些信息完全被运维人员所掌握,那么系统正常运行就易于得到保障,即使出现问题解决起来也将不是很难的事情。
  本文将应用软件在运行过程中以多种方式、多层次、多角度将自身运行情况呈现给用户的能力称为应用软件系统的可视性(application visibility);相应地,具有良好可视性的应用系统称为可视化应用系统(visual application)。
  应用软件的管理难题
  全面掌握应用系统的运行状况对应用软件管理员而言非常重要,因为这可以提前发现隐患,一旦出现故障也能及时找到问题之所在。然而,做到这一点并不容易,其中面临着应用程序监控和系统运维过程的不确定性等诸多难题。
  1.应用系统监控之难
  与操作系统、中间件等基础性软件相比,应用程序的监控要困难得多。比如,中国人寿目前已经建立起来比较完善的基础平台监控机制,通过整合利用基础平台提供的各种监控接口,统一到监控平台上,形成一个完整的基础平台运行视图,并增加各种管理功能,取得了很好的效果。其之所以成功,一个很重要的因素是各种基础平台,包括硬件、操作系统、数据库、中间件等都是成熟的通用平台产品,这些产品自身都包含了丰富的运行监控接口(可称之为具有良好的可视性),管理者或使用者所做的就是利用和挖掘这些功能,并根据自己的应用特点进行针对性的整合,以统一友好的界面展现给管理人员。
  而应用监控虽然也取得了一些非常好的效果,但相比系统监控效果还是有不小的差距,最根本的原因在于应用系统自身没有提供足够的、有效的关于自身运行的详细信息,也就说应用软件自身不具有很好的软件可视性。仅从应用程序消耗的公共资源来判断应用运行情况具有很大的局限性,如跟踪Tuxedo服务队列可以判断某个应用功能的排队情况,但不能很好地给出进一步的信息。就好像一台高档中央空调,仅仅能够监控它的电压、电流、温度这些通用指标是没法很好满足监控需要的,要想知道空调运行情况还需要很多指标以反映其内部部件的运行情况。应用程序监控的另一思路是对应用日志的监控,但很多情况下应用程序日志也不能满足监控要求,需要反过来在源程序中增加针对性的日志输出。另外,不同应用系统源程序的结构差异使得增加理想日志信息的工作量和风险都具有不确定性,而且这种打补丁的方式缺乏规划和统一管理。这种状况其实是反映了程序原有的可视性不能很好满足应用监控的要求。
  2. 系统运维过程的不确定性
  目前由于主要应用系统运行文档、运维文档不够完善,系统运维过程中查看源程序仍是最重要的问题定位、问题分析手段。系统运行中出现问题时,界面上和日志文件中的报错信息是问题定位的切入点,如果报错信息、日志记录比较明确、比较完整,运维人员就比较容易跟踪到出错前程序的运行轨迹,继而根据程序上下文逻辑判断出现问题的根本原因;反之如果日志记录不明确、不完整。例如,在程序流程跟踪过程中某个关键变量的值变化没有记录下来,运维人员判断和解决起来就困难得多,虽然看得见却摸不着,这时候问题的解决就需要依靠运维人员的经验想办法进行问题重现,有时甚至要修改源程序加入调试信息并模拟运行。这种情况下运维的效率很大程度上依赖程序日志的详细程度,依赖运维人员经验的积累,这就导致整体上应用软件的问题定位效率具有不确定性,直接后果是系统高可用性无法得到保证。
  分析其原因,一是目前主要应用系统提供的日志很多是软件在开发过程中加入的调试信息,并不能称为软件系统的运行日志;二是日志侧重于记录出错现场的异常信息,不注重正常运行信息,而在实际生产环境中,那些在测试环境中从来不出现异常的地方还是会出现异常。
  如果解决了目前应用软件系统的日志不全面的问题是不是就可以适应将来的需要,尤其是大集中系统的需要呢?笔者认为仍然不能满足。按目前的模式,在源程序中加入全覆盖的日志,将对系统运行效率、运行日志空间消耗、日志跟踪效率带来新的问题,因为对于特大型软件系统,系统逻辑复杂,程序调用层次多,并发操作量巨大,而且规范的应用软件维护模式不是以源程序为基础的,源程序对运维人员是不开放的。
  软件可视性的
  两个特征
  要解决应用软件管理中存在的上述难题,需要从多方面着手,其中之一就是提高应用软件的可视性。理想的应用软件可视性应具有以下特性:
  1.多角度
  可视性良好的应用软件是一个“白盒”系统。不同类型的用户可以从各自的角度对其内部进行观察。用户可以是前台操作者、后台操作者、应用管理者或者系统审计者等。前台操作者和后台操作者可以非常直观地看到自己已经完成、正在进行、将要进行的操作,也可以看到操作对象的全面信息,包括历史信息、相关信息;应用管理者可以看到权限范围内系统中正在进行的所有操作员和操作对象的活动信息和历史信息;系统审计者可以看到权限范围内所有操作和对象的历史信息。
  2. 结构化
  可视性良好的应用软件可以实现结构化、系统化的观察(或监控)。如果软件的监控平台是软件的仪表板,应用软件可视性功能则是仪表板和各运行单元之间以及运行单元内部的传感器。软件系统的整体运行状况、各部件的运行状况信息可以通过传感器获取,并传递给仪表板,以方便及时地展现在用户的面前,给出一个软件系统运行情况的全貌。这是软件系统可视性的最基本要求。
  在仪表板的基础上,可以对各个部件的运行情况进行进一步深入的展现,逐层展现部件内部的运行情况,类似于数据仓库中的下钻分析。相对于传统机械设备和模拟电子设备,应用软件系统作为纯数字信息系统,在数据采集、数据管理上具有更大的优势,应该比空调、汽车更易于实现。
  关注可视性
  对运行效率的影响
  目前,大型应用系统所消耗资源主要分为主机资源和存储资源两大方面。要实现应用系统完全的可视性,在主机资源和存储资源上的开销都将是十分巨大的,可能会影响系统的运行效率和存储效率。在运行效率方面,类似的情况如Informix的存储过程trace模式和非trace模式在效率上的不同,其运行效率有一倍以上的差异;在存储效率方面,保证良好的可视性特征所需的存储开销将随着业务处理集中程度的提高、业务规模不断发展而快速增长,如不进行有效管理,数据量可能超过业务数据量甚至存在数量级上的差异。
  运行效率方面的问题解决可以采用类似于数据库的优化策略。这并行操作是关键,即将系统可视性方面的资源开销同程序主业务逻辑处理所占资源独立分配,如采用物理独立的数据库和文件系统以及独立的内存空间,主程序通过特定方式将可视化信息填写到这些专用的空间,再由专用的进程或工具进行整理、加工和展示。类似于Oracle 10g的自动负载仓库 (Automatic Workload Repository)机制。
  存储效率方面问题的解决关键是分级管理,根据可视化数据的性质、时效、历史价值、用户等属性不同而采用不同的存储、转存、销毁策略。
  笔者认为在主机资源上占用主业务逻辑处理程序的15%
其他文献
随着工业化与信息化的融合推进,以及以太网技术在工业控制系统中的大量应用,病毒和木马对SCADA(数据采集与控制)系统的攻击事件频发,直接影响到公共基础设施的安全,造成的损失不可估量。因此,目前国内外生产企业都十分重视工业控制系统的安全防护建设。但由于工控网络存在着特殊性,商用的信息安全技术无法完全适用,解决工业控制系统安全问题需要有针对性的实施特殊措施。  工业控制系统安全吗  近年来的典型工业控
美伊战争中,一架美军“猛禽”无人机遭遇伊拉克米格战机后按指令与之对抗。但米格首先开炮,猛禽随之中弹坠落。美国无人机由几千英里之外的飞行员遥控操作,行动和反应约有1/4秒甚至更长时间延迟,使其无法避开敌机攻击。这场空战被认为是无人机和传统战斗机之间的第一场近距格斗。  5月27日,在日内瓦开幕的联合国人权理事会例行会议要求各国宣布冻结“杀人机器人”武器的试验、生产和使用等。“杀人机器人”顿时成为媒体
近年来,信息网络技术在加油站的运用日益成熟,ERP系统、加管系统、二配系统、油库管理系统等相继在中石油旗下加油站建成投运,特别是加油站管理系统的推广应用实现了加油站进销调存管理的自动化控制,为加油站(远程)合并管理提供了充分条件。可以说,随着各类信息系统在加油站的全面应用,信息化令加油站的管理水平有了质的飞跃,加油站员工信息操作技术明显提高。但同时,发挥已有信息系统的技术优势、改变传统合并站管理模
随着IT行业的迅速发展,伴随而来的IT需求带来了数据中心行业的爆炸式增长。在当今高度信息化的社会中,不管是通讯、搜索、金融、IT、制造还是医疗、政府、贸易,各个行业都依赖于数据中心的数据服务,据称google每一次搜索都会调用全球超过300台服务器的计算,耗费3瓦特的电能。而据美国斯坦福和劳伦斯伯克莱国家实验室研究表明,2005年全球数据中心能耗1230亿千瓦时,电费支出约73亿美元,在2010年
金蝶:网上ERP 安全高效  传统管理软件厂商金蝶推出了部署在Windows Azure公有云平台上的ERP软件K/3 Cloud,搭建起能够通过互联网使用并按需租赁的在线ERP系统。依托Azure平台,国内用户无需购买服务器便能使用功能完备的ERP,并且能够更好地满足企业对多工厂、跨地域、多分支协同的需求。  企业级用户一直担心云平台的安全问题,特别是搭载管理软件的云平台,因为财务、销售、仓储等
IBM软件集团大中华区渠道和工商企业部总监许伟利:“‘蜂潮行动’要做的事情就是与合作伙伴一起开拓市场,主要是三四级市场。”  在2013 IBM软件渠道高峰论坛上,面对众多合作伙伴,IBM软件集团大中华区渠道和工商企业部总监许伟利表示,软件不仅成为新计算时代下的核心角色,也是IBM推动公司持续转型的重要推动力,而IBM软件集团在中国市场的成长是与合作伙伴分不开的。  “在软件领域,我们看到未来有4
“普天在智慧城市方面的解决方案,主要聚焦于平安城市、智能交通、能源管理、智慧医疗等领域。智慧城市的一个重要基础是安全城市,普天在安全城市方面可以提供完整的端到端解决方案。”11月30日,中国普天信息技术研究院有限公司政务网产品部总经理王仑在IT两会现场接受《计算机世界》报记者采访时,特别介绍了普天在智慧城市领域做出的成就。普天从2008年开始研发基于LTE技术的专网产品,在LTE专网标准、产品和市
“电信级机房”常常被一些企业用来描述自己的数据中心建设和管理水平,这在一定程度上也反映出电信企业机房建设和管理的高水平,其在IT领域的标杆作用由此可见一斑。而近几年来,电信行业在IT架构的建设上正在悄悄发生变化,比如,大胆选择x86平台来简化IT系统,将核心系统向虚拟化平台迁移,并逐步建起自己的“云”,而推动这些变化的主要动力则是要提高IT灵活性、降低IT总成本。  湖北联通IT系统的演进就颇有代
本报综合消息 根据易观智库分析,目前,中国手机市场渠道开始进入转型期,一个比较明显的变化是手机厂商直供模式的加强,渠道的扁平化趋势进一步加剧。从2010年12月起,三星手机全面推行了直供模式,经过一年多的发展,三星对手机渠道的把控能力得到不断提升。  另外,运营商加强了对终端市场的管控。易观智库分析师王颖认为,2011年三大运营商终端公司调整动作频繁,且对终端产品的补贴力度在不断提升。高端明星定制
到底什么样的园区是智慧园区?智慧园区应该怎么管理和运营?在全国如火如荼进行智慧城市建设的同时,智慧园区建设需求越来越迫切,大有先行先试的趋势。  作为智慧城市的缩影,同时作为区域经济和产业的主要聚集区,智慧园区和智慧城市相比,实施难度相对趋弱。主要原因在于:各地开发区、园区基本是在城市的新建区域,顶层设计起点高;开发区和园区管理者创新意识强,思想较为活跃;决策机构集中而精简,通常园区管委会遇事就能