关于我们

在线客服

帮助

24小时客服:010-82326699 400-810-5999

建设工程教育网 > 建筑文苑 > 其他相关 > 正文

如何降低无计划变化导致的IT风险

2009-11-06 11:30    【  【打印】【我要纠错】

  1. 降低IT变化成本的良方:IT纪律和IT自动化

  如果IT组织对他们的应用交付和管理行动采用严格的纪律和自动化,那么可以消除大部

  部分改变的成本。

  1.1应用交付

  很多应用故障是由于在开发和部署新应用和应用改变时缺少控制和纪律导致的。

  如果不能正确控制应用的计划,开发和部署,那么将导致:

  ●对其他组建或应用产生意外的副作用;

  ●由于不完善的版本控制,丢失改变的源代码或其他程序;

  ●由于错误的优化和没有在上线的压力下测试,出现上线的性能问题;

  ●由于费事且易于出错的手工部署的错误,出现混合或不兼容的上线版本。

  在应用生命周期的开发和部署阶段,进行小心细致的计划和控制可以消除这些问题。

  1.2计划

  严格的应用交付开始于计划。计划中经常会忽略的几个方面包括:

  ●影响性分析

  ●容量计划

  ●高可用性计划

  如果没有实施应用改变的影响分析,可能会导致意外的停机和性能问题。例如,为了满足一个业务变化对数据库模式作了一处简单的修改,可能也需要对其他模块进行改动。如果没有注意到这些改变而没有做相应的修改,就可导致错误的结果,糟糕的性能或应用的停机。这样的问题通过对应用改变的影响作仔细分析就可以很好地避免。最有效的影响性分析最好是使用自动化工具,该工具可以理解源代码和程序对象之间或其他应用组件之间的关系。

  缺少容量计划是另一个可能导致意外应用故障的问题。分析出在生产环境中可获得充足应用性能所需要的处理器,内存和其他资源等是非常重要的。例如,如果不能提供足够的计算资源处理预计的用户数量,那么就可能导致应用的性能问题和停机。

  最后,缺少为满足高关键应用的可用性而必要的冗余和快速恢复机制计划可能导致代价高昂和长时间的停机。某些故障是非常难以预料的。例如,硬件故障的发生通常没有前兆,并发生在极不方便的时间。IT组织必须为这些故障作计划,并且考虑高可用性体系结构和程序。

  1.3开发

  控制良好的开发过程为多种多样的应用故障提供了重要防线。应该组织这些过程保证所有重要的开发任务,例如说明,编码,优化和测试,能够正确执行。好的过程也需要在相关步骤上作严格的评审。这保证正确的检查和平衡能够捕获不适当或不正确的改变。版本控制是所有良好开发过程的关键环节。不充分的版本控制可能导致丢失源代码的改变,模块的混乱版本和丧失对运行的生产系统全面的信心。所有开发成果都应该在版本控制系统中仔细保留和管理,以防止覆盖重要的改变。

  功能的正确性,性能和扩展性的验证应该紧密地集成在开发过程中。大多数开发组织能够认识到验证软件功能正确性的重要性。而性能和扩展性的问题只是当在生产的负载下应用出现问题时才会注意到。这里需要特别强调的是,性能和扩展性需求应该在普通开发人员编码和测试中验证,同时也以应该在QA过程验证。关键应用交易应该使用分析工具进行准确测量。而且,应用性能也应该在生产级别的压力下测量。最好使用压力测试工具可以帮助你进行自动测试仿真适当的用户负载程度。

  1.4部署

  正确的控制也应该扩展到应用的上线部署阶段。通常,一个应用的更新版本需要在不同的系统上同时部署。另外,也可能依赖系统软件,运行时库和其他共享组件的不同版本。因此,局部或偶尔的部署可能导致错误,故障或糟糕的性能。

  围绕部署的问题通常与手工部署有关,因为手工容易出错。自动部署机制可以保证把正确的组件在正确的是件交付到正确的系统,以防止部署的灾祸。

  2.管理上线应用在应用交付中再多的计划和控制也不会消除应用的故障。即使最完善的质量控制过程也不会发现所有的缺欠。同时,最好的容量规划过程也不会预见到意外应用的使用。因此,需要以及时和主动方式管理应用的可用性和性能。

  早期的识别和解决方式的关键是减少应用问题的影响。通过正确的监测,很多应用问题可以在停机前被发现和解决。

  最终用户的体验监测是应用监测的重要部分。最终用户的响应时间应该一直被测量,并与现有的服务等级协议比较,在问题变得严重之前,能帮助识别和解决性能变化趋势。

  时间应该一直被测量,并与现有的服务等级协议比较,在问题变得严重之前,能帮助识别和解决性能变化趋势。

  现在我们可以采用先进的技术帮助组织捕获,分析和回放完整地最终用户会话。这样的数据对于再现和诊断与应用功能相关的问题而言是非常重要的。这些技术可以被用来分析电子商务和其他自助服务Web应用的可用性问题。

  除最终用户的体验数据外,资源利用情况和性能数据应该根据应用技术栈的层次进行采集,包括Web Server,应用服务器,数据库和网络。这些数据可以在情况变得严重前提供有关问题的重要信息。例如,缺少一个索引导致的性能问题,只有在过量的表扫描时才能采集到特征数据。在对最终用户产生严重影响之前,表扫描监测应该很早就可以发现这个问题。与此类似,Java应用中的内存泄露问题往往很长时间都不会被发现,通过监测内存使用就可以在灾难之前发现这种问题。对相关组件(包括网络,操作系统,应用服务器,数据库和应用等)的细粒度监测和报警,通常可以在停机前发现应用的问题。

  即使采用最好的,能够尽早报警的系统,有时应用也会很快出现问题,导致严重的性能下降甚至停机。这时,公司才会切实感觉到销售额的下降或成本的显著上升。不幸的是,在这种情况下,诊断问题是很困难的。在当前的复杂应用环境中,一个问题可能与很多变化的因素有关。下面是一些造成应用响应时间突然下降的可能原因:

  更改应用代码后未经优化、未经优化的SQL语句、意外删除的索引、意外的数据库资源竞争、Java内存泄露、Web服务器进程数量过多、网络性能问题识别像上面的这些困难问题可能需要多种IT技术。重要的是技术人员应该方便地掌握恰当的数据以便快速缩小问题的可能性。技术人员应该能够快速察看应用,应用服务器,数据库,Web服务器,操作系统和网络的性能和资源特征,并可将这些数据与具体的交易响应时间的下降相关联进行综合分析。拥有合适的工具以简明的方式提供数据时快速解决问题的关键。

  3.结论

  商业组织必须不断地适应变化的市场环境。这给IT部门带来很大压力,必须保证公司的应用系统可以支持全面的战略方向。因此,将面对更为复杂的一个用环境。没有正确的控制和管理,应用环境的持续改变将导致糟糕的应用性能和停机。对于一个组织来说,这些问题意味着销售额和生产效率的大幅降低。Gartner估计任务关键应用的每小时停机成本是42,000美元。而通过在应用的整个生命周期(从开发到生产)中采用严格的方法,可以避免大量的损失。采用适当的工具,谨慎地控制工作流程可以俄日大多数IT部门节省巨额成本。

延伸阅读:风险 it 导致
收藏分享:论坛
分享到:
相关新闻
  • 特色班
    4大班次+2-3套全真模拟题
    提升学习效果
  • 精品班
    4大班次+2-3套全真模拟题+1套预测试题
  • 实验班
    3套全真模拟题+2套预测试题+考前冲关宝典
  • 定制班
    3套模拟题+3套预测题+考前冲关宝典+考前重点
  • 移动班
    以知识点为单元授课练习,
    强化重点、难点、考点
版权声明

  1、凡本网注明“来源:建设工程教育网”的所有作品,版权均属建设工程教育网所有,未经本网授权不得转载、链接、转贴或以其他方式使用;已经本网授权的,应在授权范围内使用,且必须注明“来源:建设工程教育网”。违反上述声明者,本网将追究其法律责任。
  2、本网部分资料为网上搜集转载,均尽力标明作者和出处。对于本网刊载作品涉及版权等问题的,请作者与本网站联系,本网站核实确认后会尽快予以处理。
  本网转载之作品,并不意味着认同该作品的观点或真实性。如其他媒体、网站或个人转载使用,请与著作权人联系,并自负法律责任。
  3、本网站欢迎积极投稿。