> 正文

一个IT老兵从“支付宝”“携程”事件看业务连贯性保障

2015年06月04日 11:47:04 来源: 新华信息化

    在过去一周,热衷“互联网+”主题的大家冷汗不已,“支付宝”和“携程”接踵而至的运维保障事故,让一直以互联网为傲的IT圈一片唏嘘。公开报道的事故原因涉及网络线路中断、运维人员误操作,因此造成其服务较长时间无法恢复。作为一个在IT运维领域工作多年的老兵,看到这些有多年运维经验的企业仍然会在应急响应、操作规范性等基础运维管理工作上栽跟头,其背后折射出的是国内大多数企业运维管理水平还无法保障业务稳定运行的现状。

    目前国内企业IT运维管理工作中突出存在的问题主要有四个:

    第一:自动化程度不高导致误操作几率倍增。当前企业运维例行操作的工作大多还依赖手工,年复一年,这样即便是简单重复的工作,出现误操作的几率也会成倍提升。随着企业业务量的增长,IT设备数量和运维工作将同步增加。但基于编制和成本的考虑,企业的IT人员配备无法满足运维需求。这样会导致工作压力过高,促使误操作几率提升。另外,IT人员的稳定性较低,新人在技能和业务熟悉程度都有限的情况下,出现误操作的几率更大;所以通过自动化运维系统替代大量重复繁杂的例行人工操作,这种方法可以降低误操作几率;同时,也是IT运维的发展趋势。

    第二:缺乏有效的资源管理使运维效率低下。企业做好IT运维服务,首先需要及时收集、分类、更新相关机房资源、物理资源、平台资源、虚拟资源、应用资源到数据资源各类服务对象的信息;如果出现变更的情况,一旦变更前不能准确获悉可能影响的所有相关资源信息,就会引起无法估量的损失;如果在承接业务需求时,不能知晓现有系统性能、存储和网络情况,就会让业务上线成为空谈;如果在采购新设备建设新机房时,不能了解当前运算资源的忙闲程度,就会让企业浪费投资决策失误;所以只有完整准确可用的资源管理服务,才能将运维工作的效率大大提升。

    第三:风险评估与应急准备流于形式使“狼来了”成真。不可否认当下企业越来越重视风险评估,考虑业务连贯性的问题;但能够真正从业务出发,考虑所有可能风险并给出相应对策,同时能够坚持演练的企业却少之又少;首先风险评估需要运维团队中具备或协调理解业务需求的资源,能够对风险做出正确判断,尤其不能遗漏自认为不会发生的或小概率的问题,通常确是损失较大的风险;其次对风险能合理分类分级,提供企业能承受的恢复方案,其中不只包括IT部门还包括业务部门、市场宣传部门、法务部门等整套方案;最后为确保恢复方案的可行,一定要定期演练并及时总结和完善方案,风险模拟越真实,演练带来的效果越可信,当然企业要做好承担由于演练带来的新风险以及演练的相关成本;流于形式的风险应急准备工作只会让“狼来了”成为现实。

    第四:能否敏捷应对业务需求变化是判断 IT价值的最大因素。最后一个问题就是IT运维不能只埋头拉车而不懂抬头看路。运维的目标说到底就是要保障业务的平稳运行,在业务需求变化时也能保持敏捷感知,并随之做出相应调整。但IT运维的管理者们常常会被每天变更、故障、应急等具体事物纠缠的不可开交,而且管理者们大多是技术出身,更喜欢研究专业的问题。所谓不能跳出画看画,迷失在忙碌中却忽视了最终的目标。其实从运维工作的规划开始,就要瞄准业务规划的目标设计;具体工作中也要时刻保持与业务部门的密切沟通,确定运维的保障工作也是业务工作中所需要的内容;当业务需求发生变化时,IT运维部门更要主动出击,了解运维工作的需求变化,并做出积极调整;业务成功,才是运维的成功。

    作为多年的IT老兵与公司神州信息在IT服务领域摸爬滚打了二三十年,我们的技术人员在为行业客户提供IT服务的过程中,不断了解学习行业客户的业务知识,总结行业IT服务经验,摸索和开发出保障行业客户业务运营的IT服务系列产品。早在2004年就提出“IT服务随需而动”的理念,按照ITSS、ISO20000等国内外标准设计的“智慧数据中心(SDC)”服务产品,强调自动化平台、一线服务团队和高端运维专家三位一体的服务模式。通过自动化平台完成数据中心所有资源的监控、巡检、作业和流程流转等工作,一线服务团队统一接口提供快速响应的故障支持和项目配合,通过专家团队提供业务和IT多方面主动的调研评估和优化改进工作。

    通过多年的实践,采用“智慧数据中心”运维的完整或局部方案,能为企业直接带来业务开通成功率提升3-10倍、变更成功率提升15%-30%、IT故障减少30%-50%、例行操作效率提升2-10倍等显著的回报,从而客户可以释放自己的IT精力,将有限的IT资源投入到自身的业务需求中去。

    说一千道一万,做好运维服务,就要以业务发展为纲,智慧服务为翼,专业和管理并重,才能让运维服务的价值得以充分体现!

集成阅读

热点推荐

频道推荐

    010020080870000000000000011121081342970131