IT运维管理中的“望、闻、问、切”
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
IT运维管理中的“望、闻、问、切”
发表时间:2010-1-8 孙永杰来源:e-works
关键字:IT运维管理IT运维服务管理ITIL IT运维实施
信息化应用调查我要找茬在线投稿加入收藏发表评论好文推荐打印文本
事实上IT运维管理跟中医诊疗法有异曲同工之处,一套完整的、基于事前管理的网络运维管理系统针对日常运维工作的特点,能做到及时发现网络中潜在的故障隐患,并能够进行及时处理,以保证整个系统的正常运行。
这个过程中,网络运维管理系统所使用的技巧可以用中医的“望、闻、问、切”来说明,即是把大夫诊脉的理论运用于网络运维管理,切实可行地降低运维管理人员的工作量,做运维管理人员的好帮手。
中华医学博大精深,精髓莫过于“望、闻、问、切”,这四大法宝成为调查了解疾病过程中重要的手段,可谓各司其职,各尽其能,相辅相成,缺一不可。
中医大夫在应诊时,只有将它们有机地结合起来,即“四诊合参”才可能全面而系统地了解病情,从而做出正确判断,果断采取措施。
是否有是曾相识的感觉?
事实上IT运维管理跟中医诊疗法有异曲同工之处,一套完整的、基于事前管理的网络运维管理系统针对日常运维工作的特点,能做到及时发现网络中潜在的故障隐患,并能够进行及时处理,以保证整个系统的正常运行。
这个过程中,网络运维管理系统所使用的技巧可以用中医的“望、闻、问、切”来说明,即是把大夫诊脉的理论运用于网络运维管理,切实可行地降低运维管理人员的工作量,做运维管理人员的好帮手。
IT运维管理中的“望”技巧。
当网络和系统建设好后,正常运行一段时间后状态一直持续,我们的运维管理人员与在高速公路上长时间开车一样,习惯于某个状态而产生麻痹。
而问题产生常常具有突发性,这会造成管理工作的滞后,给企业的工作带来巨大的影响。
随着信息化建设的不断深入,“来电响应式的运维管理”显然不能满足信息化管理的需要,针对运维管理工作的特点,运维管理系统通过网络拓扑图及图上设置的不同颜色,以图形的方式提前预防并告诉用户系统中需要关注的地方。
不同颜色设置表示不同的状态,重载状态下,需要马上关注,中载状态下,需要一般关注,轻载状态下,则暂不需要关注。
这样变被动为主动,只需要通过“望”拓扑图上的颜色就可以及时的发现整个系统中需要关心的部分,采取及时的措施,避免网络和应用系统的中断,做到防患于未然。
IT运维管理中的“闻”技巧。
国内企业在网络运维管理的过程中,运维人员的配置并不多,但承担的工作量较大。
所以,不可能整天盯着拓扑图看,针对企业运维管理人数少,负担重的特点,那么多种智能化的告警方式就是一个主要的解决方法,在故障发生时或状态改变时,通过短消息、语音、E-mail等多种方式主动通知管理人员,即使你在出差也可通过远程客户端的方式,在任何能与网管机连通的地方,直接进行管理。
这样大大降低了管理的工作量,主动的进行管理,这便是采用“闻”的技巧,你只要根据需求把告警设置定义好,即可知道系统在遇到问题时的消息,降低运维管理工作的压力,轻松撑控全局。
IT运维管理中的“问”技巧。
网络告警时,运维管理员需要在第一时间查找到故障源,及时的进行处理,保证整个系统的稳定运行。
设置全面的数据关联性和一致性,可及时进行故障源的查找,所以,首先要将设备的不同颜色与流经设备的流量产生关联。
这是因为任何一个访
问行为在网络中都表现为流量,我们可通过流量的分布,观察网络运行情况。
除此以外,通过数据流量分析技术,得知该流量的组成,由系统自动采取措施,将这些问题流量和访问及时地屏蔽在网络之外,保证了整个系统的稳定、安全运行。
这个过程,我们称之为“问”的技巧,可以帮助管理人员及时解决问题,保证应用系统的正常运行。
IT运维管理中的“切”技巧。
在运维管理过程中,除了对突发的事件进行分析处理外,运维管理的另一任务是对网络的结构和部署进行及时的调整,以保证网络运行能够满足应用系统不断增长的需要。
所以,管理当中统计数据必不可少,事实上突发事件对网络的影响常被忽略不计。
此时,我们只需要运用“切”的技术不断地为网络和应用系统“号脉”,通过设置一定的规则,就可以将这些“号脉”后得到的数据,进行归纳和整理,形成各种统计报表输出,这些统计报表为我们及时发现网络中的性能缺陷和故障多发点提供了数据资料,从而为进一步的投资改造和结构调整,提供有效的帮助,做到车到山前必有路。
ITIL流程管理实施贴身感悟
发表时间:2010-1-7 佚名来源:CIO时代
关键字:ITIL流程管理ITIL IT服务管理目标管理
信息化应用调查我要找茬在线投稿加入收藏发表评论好文推荐打印文本
当流程管理遇到困扰时,就会有人认为以前一直是搞人性化管理,做的很好,现在把人困在流程上,太呆板、不灵活。
体悟之一:以前目标管理,现在流程管理
服务管理实施前后主要的变化,表面看增加了一些流程经理,增加了一些“领导”——事件经理、变更经理,配置经理,问题经理。
其实公司的业务没有发生变化,以前做什么现在还做什么。
以前什么事情自动默认“目标管理”——最快最短流程的完成目标结果。
效率很高,但有时候会出错,事件缺乏跟踪的事情时有发生,总有愤怒的客户出现。
有了流程管理增加了关键质量监控点,虽然短期内完成目标的“整体时间”不可避免的延长,但“响应时间”迅速提高,“出错率”显著减低,几乎没有愤怒的客户出现。
目标管理和流程管理区别是什么呢?
大家都在饭店吃过饭。
客人少服务员多的时候,直接目标管理即可。
下菜单准确,收银准确,客人有求必应。
但客人多服务员少的情况下,同样要满足同样的服务质量,就需要按流程管理,虽然适当影响响应时间,但可以保障有求必应,下菜单准确,上菜顺序不出错,做菜口味不会出错,不漏单,不会有客人没有人服务,或者客人需求无人响应,导致客人受到冷遇而投诉。
目标管理都是客户满意。
中间过程不关注,这就是目标管理;分成几个过程关注,就是流程管理。
分析客户满意一般需要9个方面,比如,1)预约,2)停车,3)进门找座位,4)点菜,5)上菜,6)就餐环境,7)菜品,8)收银,9)即时需求相应。
如果客户不满意,那么那里不满意就
调整这9个流程的质量,直到客户满意,这就是流程管理。
当然这是人人都能看到的流程,还可以细化每个流程的详细步骤,比如菜品制作流程中,大厨自行制作,负责菜品质量,那么就是目标管理,如果把某个菜品细化成100个步骤制作,就像典型的肯德基制作方式,细化到切块大小,加多少克盐,油温1200度,时间20秒,那就是流程管理。
IT服务环境中,比如处理服务器某僵死进程重启问题。
目标管理的情况下,一般是管理员和主管直接沟通,批准后重启,以业务正常为目标。
现在,目标没变还是要“业务正常”,先走事件发现流程,僵死事件自动发给快速响应人员,如果快速响应人员在以前的知识库中没有发现处理办法,转向问题流程。
问题流程分析原因,判断出原因和解决方法,转变更流程。
变更流程就此召开变更评审会,通过后发送变更实施人员重新启动僵死进程。
变更成功,转配置流程的同时,通知快速响应人员监督到变更完毕,问题解决,关闭事件。
这就是流程管理。
体悟之二:流程管理是目标管理风险的“晴雨表”
当流程管理遇到困扰时,就会有人不知不觉的讲,“以前一直是搞人性化管理,做的很好,现在把人困在流程上,太呆板、不灵活。
”其实我们恰恰忘了为什么要实施流程管理,忘掉了出发时的目标“控制目标管理的风险”,典型的在过程中迷失了出发时的目标。
在不需要协作,且质量可预见的前提下,流程管理确实是没用。
但往往我们做的是复杂的任务,需要很多的协作,且结果质量还不确定。
为了保证目标达成,才选择的流程管理。
目标管理是直接负责的管理员第一时间接受任务,处理问题。
现在时快速响应(监控人员第一时间接受任务),问题专家研究方案,变更实施者实施方案。
目标管理时,“问题分析工作”直接由管理员负责,现在由问题流程负责,理论上因为问题流程中的专家相对能力强,处理问题质量高。
虽然初次处理慢一些,但质量有保障,简单问题通过知识库处理反而快了,解放了能力强的人员低水平重复劳动。
发展了分工,充分发挥资源优势,避免了资源浪费,提高资源利用率。
如果事件和问题都是由同一个人担任。
流程管理相比目标管理起了反效果。
增加了流程工作量,同一人处理,质量监控点形同虚设。
变更流程处理在目标管理时,仅仅需要和主管沟通协商,现在需要和变更评审委员会沟通,沟通人员数量增加。
增强了安全性同时不可避免的延长了时间。
如果变更委员会成员太多,比如多于3人,沟通时间会更长。
如果只有一人而且就是之前的主管,那么和以前一样,不一样的地方就是增加了额外流程工作量。
变更实施如果是事件处理人员实施的话,那么有问题,他会在变更实施的时候降低实施质量,因为下一个流程是他自己管理。
因为不需要再审阅实施内容,关闭工作单会掩盖实施的质量。
变更实施人员如果是问题专家实施的话,实施过程有可能不按问题流程结果进行,问题流程的质量将得不到监督和控制。
为了掩盖问题流程的错误,变更过程中的新的修改,虽然解决了问题,将不会被修改到以前的问题单子中,也不会在变更和配置中体现,因为会考核问题解决能力。
少有人会说,“我发现一个我没有看到的问题,这是我犯的错误,但是我解决了,没什么影响,请大家放心使用。
”绝大多数领导都会说,“再找找看。
”——因为开始怀疑你的能力啦。
问题很明白,而且被解决了,但至于是不是按问题方案做的,鬼知道,反正解决啦,下次再出同样问题,别人发现时已经晚了。
这样,配置管理,文档管理,知识库管理全部收到了直接的影响。
变成了不准确的内容。
常此以往,流程还能正常运行吗?
体悟之三:“流程管理”中的“三权分立”
悟到这样一个道理,所有的流程经理都有管理流程质量的职能,但经理不可能面面俱到了每一个质量细节。
因此肯定有没有查到的角落,角落里面往往就隐藏着魔鬼。
质量管理岗位设置再多也不能根本解决质量问题。
副作用就是成本急剧上升,而且你有100种检查方法,就会有101种规避检查的办法。
一般工作流程管理不可能全覆盖的,普通工作一定是目标管理和流程管理相结合进行的,流程管理全覆盖只有航天之类最高安全、不计成本的工作才可能做到。
要根治这个问题,只有从源头解决。
“一次就把事情做对”,把“一次通过率”当成主要的考核指标才能节约质量管理成本。
而且对于相连流程,下一道流程默认检查上一道流程的质量,一旦发现质量问题,“源头”工序以下相关工序按递减比例承担连带责任。
“连带责任发生率”成为考核指标。
最好的办法是先有规章制度形成企业文化,把质量观注入到公司员工的“血液”中。
以前做什么,现在还做什么。
以前服务质量以前是直接主管负责监督,流程管理实施之后有了专门经理监控,更多的可能是双重管理。
目的是什么呢?希望“质量可以预期”。
质量监督的成本很大的。
先假定人是自私的,在没有监控,检查的条件下,不能自我约束。
这样资本拥有者为了资本的效益,雇职业经理人制定各种流程和规范来约束,以便生产出来的产品和服务质量是处于一个可以预见的范畴。
这也是实施服务管理的目的。
鉴于服务管理的特点,ITIL最佳实践在理论上设置了一个相互制衡的组织结构。
目前看来结构是没有发现弱点。
刚才提到监督成本大,消减成本的办法就是使用流程制衡。
事件流程,问题流程,变更流程,配置流程独立性是制衡的基础。
实现流程制衡,需要流程配置专门的人员,而且人员在流程角色之间的重叠程度尽量满足没有衔接关系。
往往单位里面实施流程一个目的就是为了“降低成本需要”,原来人力就显不足,还希望通过流程实施,把人员解放出来。
对于人力资源按“目标管理”都不足的单位来说,人员增加是不可避免的。