IT运维服务部运营方案两篇.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
IT运维服务部运营方案两篇
第1条
ITIT运营服务运营计划运营服务运营计划
1、部门目标基于集团、结合集团业务工作和信息化建设实际,完善运维管理体系建设,加强运维人员梯队建设,加强信息系统正常运行的保障,“以过程为导向,以服务为中心”提高服务质量水平、转变服务理念、拓宽服务范围、提高服务效率、降低故障率,降低运维成本、提高客户服务满意度。
2、业务范围基本业务信息技术基础设施运营和维护(校园网、视频监控网、广播电视网、电话网、服务器和终端设备等。
);应用软件系统的操作和维护。
国际数据中心计算机房的运行和维护;拓展业务承接网络工程、运维项目;信息技术咨询服务等。
3、运行和维护服务管理系统运行和维护服务管理系统规定了参与信息技术运行和维护活动的各种实体及其相互关系。
相关单位按照信息技术运维服务管理体系进行有机组织,协调工作,按照服务协议要求提供不同层次的信息技术运维服务。
3.1运维服务管理对象运维服务管理对象包括基础设施、应用系统、用户、供应商、以及信息技术运维部门和人员。
具体内容如下:1基础设施包括网络、主机系统、存储/备份系统、终端系统、安全系统、机房电源环境等。
2应用系统包括内部办公室、教学系统、门户网站、各种应
用系统等。
3用户包括使用上述信息技术应用系统的用户。
4供应商包括基础设施和应用系统等的供应商。
5运维部门和人员包括集团内信息技术运维服务部门和参与信息技术运维活动的相关部门和人员。
3.2运维系统功能框架根据集团的系统结构和业务发展需求,IT运维服务部将维护框架分为8个具体部分,即服务台、事件管理、工单管理、问题管理、变更管理、配置管理、工程师评估、知识库管理、统计等9个子项目。
具体的操作和维护过程将在此基础上进行。
3.3运维管理组织结构信息技术运维服务部运维管理结构为三层模式,如下图所示。
运行维护部负责人与集团联系业务范围,签订外包协议,负责集团整体运行维护,包括各系统的制定和实施。
各运行维护组组长负责本组的标准化建设,建立运行维护档案、知识库等。
,并领导团队成员开展操作和维护工作。
各小组成员应在组长的指导下进行维护工作。
3.3.1运行维护部门的负责人负责部门的整体运行。
规划、执行、信息技术运行维护工作的完善。
工作描述
1、全面负责制定运行维护服务项目计划,领导各组长安排运行维护工作,每周听取各组长的工作汇报,并负责检查各组长工作
的完成情况。
2、根据运维目标,指导班组长开展用户服务工作,确保运维工作能够满足用户的实际需求;
3、建立并不断完善运维管理体系,优化运维流程,解决运维服务中的特殊问题;
4、规划和提高运行维护工程师的专业服务能力,提高用户整体满意度;
5、制定并持续改进绩效考核体系;
6、制定整理运行维护项目的应急计划体系,并指导运行维护工程师实施;
3.3.2总工程师职责网络规划、网络建设计划制定、核心网络设备管理、网络组工作技术支持。
工作描述
1、群通信网、电话网、广播电视网、监控网、其他网络规划、施工方案制定。
2、网络核心设备的运行、维护和管理(路由器、防火墙、交换机等。
)。
3、绘制网络拓扑图、绘制网络核心设备配置参数信息文件、建立网络核心设备台账等。
4、为网络小组工作提供技术支持和指导。
3.3.3服务台工作故障电话受理,文档管理、人员管理、数据统计。
工作描述
1、负责接受信息技术服务呼叫;
2、故障处理的发起者,同时指派维护工程师跟踪事件处理的状态;
3、执行维护失败统计、用户满意度统计、工作报告输出等。
4、协助部门主管组织文档、分类、保存等。
5、协助部门负责人进行人事考核管理、工资核算等。
3.3.4网络组负责网络线路维护和管理,维护组内正常网络系统,解决网络相关故障,网络工程建设等。
工作描述
1、现有网络设备的日常管理和维护(非核心)、局域网和配线间;
2、确保外部网络的正常光纤线路和局域网的正常运行;
3、监控网络系统和网络设备的运行状态;
4、保证通信网络、监控网络、广播电视网络正常运行,及时解决问题。
5、编写并实施网络部分的应用程序处理计划。
6、网络工程建设。
3.3.5服务器组职责服务器软件和硬件、操作系统、数据库、安全软件、应用系统和其他操作和维护以及数据安全管理。
工作描述
1、监控服务器软件和硬件的运行状态,监控和优化性能,
并进行必要的调整;
2、及时处理服务器软硬件遇到的故障并做好记录;
3、监控业务系统的运行状态,应用、监控和优化数据库性能,进行必要的调整以确保应用和数据库系统的安全性、完整性和运行效率;
4、及时处理应用系统、数据库遇到的故障并做好记录;
5、制定备份、恢复、迁移和灾难准备策略,并根据业务需求执行数据转换和迁移操作;
6、及时更新操作系统、安全软件等系统补丁以确保系统安全;
3.3.6桌面集团职责维护集团桌面系统的正常运行,解决终端、外围设备故障,确保应用系统客户端的正常运行。
工作描述
1、部门计算机、打印机、考勤机、消费类机器维护等。
;
2 、企业资源规划、客户需求计划、一卡通和其他应用系统客户维护、技术支持和培训;
3 、窗口、办公和其他办公软件维护、技术支持和培训。
3.3.7IDC机房集团负责维护集团桌面系统的正常运行,解决终端、外围故障,保证应用系统客户端的正常运行。
工作描述
1、机房电源、精密空调、监控不间断电源等设备、维护和管理;
2、机房通信线路、网络设备、服务器等日常监控。
、维护和管理;
3、检查系统设备以消除安全隐患;
4、分析系统日志,及时发现异常现象;
5、机房每日报表的填写和汇总。
3.3.8组长的职责每个组长除了小组的所有职责外,还应包括相应的职责,如系统建设、人员培训、设备管理。
3.4运营和维护服务流程IT运营和维护服务管理流程包括服务台、事件管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、财务管理、能力管理、可用性管理、服务连续性管理、知识管理和供应商管理等。
随着运行和维护活动的不断深化和不断改进,其他流程可能会逐渐变得独立和标准化。
3.4.1项目运营和维护服务工作流程图3.4.2服务台是支持信息技术运营和维护服务的核心功能,与每个流程密切相关。
所有管理流程都需要通过服务台为用户提供单点联系,以回答用户的相关问题和需求,或者为用户寻求相应的支持人员。
在该系统中,服务台是接收来自各种来源的服务请求和相关信息反馈的唯一入口和出口。
同时,服务台还负责一般请求、可通过知识库解决的请求(历史事件);
他也是复杂问题二线治疗的桥梁。
3.4.3事件管理流程的主要目标是尽快恢复信息技术服务的提供并减少其对业务的不利影响,从而尽可能确保最佳的信息技术服
务质量和可用性水平。
事件管理流程通常包括事件检测和记录、事件分类和支持、事件调查和诊断、事件解决和恢复以及事件关闭。
该系统将所有服务请求和警报归因于事件。
事件管理为服务台和事件管理器提供诸如事件记录、处理、查询、审查、分发等功能。
它还包括通过与信息技术监控系统接口发送警报以形成事件的功能。
3.4.4工单管理工单管理工单管理工单是信息技术现场运维支持的任务载体、二线。
操作和维护工程根据收到的工作指令执行信息技术操作和维护工作。
工单管理是实现创建工单、变更、查询浏览、分配、监督等功能的模块。
3.4.5问题管理流程的主要目标是防止问题和事故的再次发生,并将未解决事件的影响降至最低。
问题管理过程包括诊断事件的根本原因和确定解决问题所需的活动,并负责通过适当的控制过程确保解决方案的实施,特别是变更管理和发布管理。
问题管理还将维护关于紧急解决方案和问题解决方案的信息、。
问题管理是一个模块,它考虑已处理事件的剩余问题或事件的解决方案仅采取临时措施,而不是永久措施,并且不能完全解决问
题。
根据事件、和处理计划,问题处理者在调查后诊断、并提出最终解决方案。
3.4.6变更管理变更管理对所有信息技术基础设施和应用系统实施变更。
变更管理应记录和分类所有要求的变更,并应评估变更请求的风险、影响和业务收益。
它的主要目标是在对服务干扰最小的情况下实现有益的改变。
变更管理是审计信息技术运行和维护活动的一项功能,如增加主要信息技术资源、变更、升级,以免对现有信息技术资源的可用性造成不必要的影响和损害。
同时,他还将实现对工作单中产生的变更进行事后审计的功能。
3.4.7配置管理配置管理流程负责验证在信息技术基础设施和应用系统中实施的变更以及配置项目之间的关系是否已被正确记录;确保配置管理数据库能够准确反映现有配置项的实际版本状态。
配置管理实际上是统一管理所有信息技术资源的功能,包括管理信息技术资源整个生命周期的参数或配置更改记录。
管理信息主要包括分类、模型、版本、位置、状态、相关信息以及核心参数等其他基本信息。
3.4.8工程师绩效考核可以加快运行维护人员的培训,提高运行维护人员的专业技能素质,充分调动运行维护人员的积极性和积极性,提高工作效率。
最大限度地提高部门的整体效率3.4.9知识库管理知识库管理知识库是向信息技术操作和
维护人员提供的重要技术资料内容。
他从工作中遇到的典型案例中收集知识点和综合实用的信息手册。
在该系统中,知识库管理为快速查询和维护提供了方便的人机界面。
3.4.10统计和工作报告运维管理系统提供了一线结算率统计、客户满意度统计、分类事件汇总统计、工作报告生成的功能。
按照一定的格式,根据事件数据、工单数据、问题数据、配置数据、变更数据,可以帮助运行维护经理清楚地列出运行维护的工作内容。
4、人员管理4.1轮换原则运行维护部所有人员统一管理。
运行维护工程师实行轮换制,坚持多岗位培训、综合培训、科学配置、结构优化的原则。
有利于管理技术人员的多岗位实践,提高他们的素质有利于加强管理技术人员队伍建设和优化结构。
有利于增强管理和技术人员的活力和活力,提高效率。
通过轮岗认证并达到相应个人技能水平的工程师可以获得其轮岗团队相应级别的技能认证。
每个团队的技能认证是工程师晋升的必要条件。
4.2工程师等级工程师等级根据信息技术操作和维护技能、工作年限、教育背景、专业等因素分为技师、助理工程师、工程师、总工程师、高级工程师、主管工程师、高级工程师、高级工程师、高级工程师、超级工程师、超级工程师、专家工程师、教授工程师、总工程师。
4.3晋升原则工程师晋升计划旨在改善人力资源的增长机制,建立人才梯队的良性循环,实现部门的可持续发展目标。
影响工程师晋升的因素包括工作量、绩效考核结果、信息技术操作和维护技能水平、工作年限、特殊技能等。
(详见IT运维服务部工程师晋升管理系统)4.4绩效管理:根据服务台、组长、团队成员等不同岗位,提取考核指标,制定目标、明确的考核标准,选择科学合理的考核方法。
绩效考核应客观、公平、公开、公平、科学;True 、精确;民主与集权的结合;责任、权重、利益组合;定性和定量相结合;评估方法应科学、可行;评估周期应适当;考核等级或分数应合理;应反馈评估结果;检验员应合格、到位;评估应该标准化、制度化。
(具体内容需要制定详细的评估规则)5、运行维护服务内容5.1服务目标运行维护服务部提供运行维护服务,包括与信息系统相关的主机设备、运行系统、数据库和存储设备,确保用户现有信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。
同时,根据日常维护数据和记录,提供用户信息系统的总体建设计划和建议,更好地为用户的信息发展提供有力保障。
用户信息系统的组成可以分为硬件设备和软件系统两类。
硬件设备包括网络设备、安全设备、主机设备、存储设备、通信设备、监控设备等。
;软件设备可分为操作系统软件、典型应用软件(如数据库软件、中间件软件)、业务应用软件等。
信息系统资源所涵盖的服务项目范围关键状态和参数指标以下方面运行状态、故障状况配置信息可用性和健康状况性能指标5.2IT资产统计服务内容包括信息统计和记录,如硬件设备型号、数量、版本软件产品型号、版本和补丁信息统计和记录网络结构、网络路由、网络IP地址统计和记录绘制集成的结构图布线系统和记录其他附属设备的统计5.3网络、安全系统运维服务从网络连通性、网络性能、网络监控和管理三个方面实现网络系统的运维管理。
设备基本性能检测cpu、内存使用监控;
检查设备日志;
设备的Snmp状态;
测试Ping和tracert等工具的连通性;
网络安全策略的应用是否正常;
实时监控互联网带宽流量;
网络拓扑链路状态监控;
网络数据包流量异常;
DoS 、DDoS和其他网络攻击监控;
互联网线路误码率、丢包率监控;
5.4服务器、存储系统操作和维护服务服务器、存储系统操作和维护服务包括服务器、存储设备的日常监控、设备运行状态的监控、故障处理、操作系统维护、补丁升级等。
监控管理的内容包括:中央处理器性能管理;
内存使用管理;
硬盘利用率管理;
系统过程管理;
主机性能管理;
实时监控主机电源、风扇使用情况和主机机箱内部温度;
监控主机硬盘的运行状态;
监控硬件状态,如主机网卡、阵列卡;
主机系统文件系统管理;
监控存储交换机设备状态、端口状态、传输速度;
监控备份服务流程、备份(起止时间、成功、错误报警);
监控和记录磁盘阵列等存储硬件故障提示和报警,及时解决故障问题;
监控存储性能。
5.5数据库系统运维服务提供的数据库运维服务包括主动的数据库性能管理,这对于系统的运维非常重要。
通过主动的性能管理,我们可以了解数据库的日常运行状态,识别数据库的性能问题发生在哪里,并进行有针对性的性能优化。
同时,密切关注数据库系统的变化,积极预防可能出现的问题。
监控管理的内容包括数据库基本信息文件系统、碎片、死锁、高CPU利用率或长时间的SQL语句。
监控表空间使用信息;
读取和写入数据库文件输入/0;
会话连接数量监控;
监控数据库监控的运行状态;
检查每日数据备份、数据同步是否正常;
报警日志监控;
分析表格和索引以检查空间碎片;
检测数据库后台进程;
监控数据库对象的空间扩展;
5.6桌面、终端操作维护服务负责维护终端电脑、笔记本和工作站操作系统、应用软件和硬件,解决用户在应用过程中遇到的问题,并进行简单培训,完成打印机、考勤机、消费机等其他终端的故障处理。
6、应急服务响应措施运维项目组制定了详细的应急响应计划,整个过程严谨有序。
然而,在维修过程中,事故将很难完全避免。
我们将对项目实施过程中的突发风险进行详细分析,针对各种突发事件设计相应的防范和化解措施,并提供完整的应急处理流程。
6.1应急预案基本流程的实施6.2应急策略(1)值班人员平时应做好应急事件的监控工作。
对于紧急情况,他们应仔细分析、以准确确定故障发生的数据字段,并负责跟踪事件直到事件结束。
对于不在运行维护中心的故障,应通知负责人第一时间到现场处理,密切关注事件过程和进展,并向领导汇报登记工作。
(2)正常情况下,值班人员需要在10分钟内确认事件。
属于一般事件的,按照事件流程进行调度和处理;否则,应迅速启动应急计划,严格按照应急计划规定的步骤迅速实施应急处理,并及时报告上级领导,掌握实时处理情况。
(3)在处理过程中,如需其他部门到现场进行加固,应及时向上级领导部门汇报,协调沟通,联系技术工程师或厂家技术支持,尽快赶到现场寻求帮助。
7、服务管理模式解决了应急发现和故障启动应急响应计划的扩展问题,通知领导根据事件过程初步确定故障恢复,联系技术支持处理,联系开发商或工厂工程师处理现场一般突发事件的汇总。
修订后的应急预案已解决,应急小组未解决,进度报告未解决,进度报告已报告,进度报告已报告,加固记录为7.1。
信息技术运维服务部将对全集团现有信息技术资源进行全面调查,并根据调查结果,参考市场运维价格,制定运维外包协议。
价格应至少比市场价格低三分之一。
信息办牵头与信息运行维护服务部签订信息运行维护外包协议,由集团分配运行维护费用
7.2服务时间1在工作时间设立专用热线,在非工作时间设立专用移动电话热线,以回答服务请求并记录服务台事件处理结果。
2服务响应时间故障级别响应时间故障解决时间第一类是紧急问题;具体现象是系统崩溃导致业务停止、数据丢失。
10分钟、30分钟内提交一份故障处理计划的二类严重问题;具体的现象是,有些部分失效、系统性能下降,但它可以正常运行而
不影响正常的业务运行。
10分钟,2小时内提交故障处理方案,6小时内属于较严重的三级问题;
具体现象是存在系统错误或警告,但业务系统可以继续运行,其性能不受影响。
20分钟,2小时内提交故障处理方案,12小时内IV属于常见问题;具体现象是系统技术功能、安装或配置咨询,或其他明显不影响业务的预订服务。
30分钟内,4小时内提交故障处理计划7.2行为准则1符合集团的规章制度,严格按照集团的相应规章制度执行。
2.与集团运维体系的其他部门和环节合作,密切配合,共同开展技术支持工作。
3 .遇到技术难度、的业务问题和重大突发事件,及时向负责人汇报。
4现场技术支持应情绪高涨、态度温和。
接电话时,要礼貌,语言清晰,语气亲切。
遵守保密原则。
集团网络、主机、系统软件、应用软件密码等。
、核心参数、业务数据等。
,他们负责保密,不得随意复制和传送。
ITIT运维服务运维方案的运维服务包括信息系统相关主机设备、操作系统、数据库和存储设备等信息系统的运维和安全防范服务,以确保用户现有信息系统的正常运行,降低整体管理成本,提高
网络信息系统的整体服务水平。
同时,根据日常维护数据和记录,提供用户信息系统的总体建设计划和建议,更好地为用户的信息发展提供有力保障。
用户信息系统的组成可以分为硬件设备和软件系统两类。
硬件设备包括网络设备、安全设备、主机设备、存储设备等。
;软件设备可分为操作系统软件、典型应用软件(如数据库软件、中间件软件)、业务应用软件等。
通过对运维服务的有效管理,提高了用户信息系统的服务效率,协调了各业务应用系统的内部运行,改善了网络信息系统部门与业务部门的沟通,提高了服务质量。
根据用户现有环境、组织结构、信息技术资源和管理流程的特点,从流程、人员和技术三个方面规划了用户网络信息系统的结构。
将用户的运营目标、业务需求与信息技术服务保持一致。
信息系统服务的目标是监控和管理用户现有的基础信息系统资源,及时掌握网络信息系统资源的现状和配置信息,反映信息系统资源的可用性和健康状况,创造一个可知的、可控的信息技术环境,以确保用户信息系统各种业务应用系统的可靠性、高效性、持续性、安全运行。
服务项目涵盖的信息系统资源包括以下关键状态和参数指标:运行状态、故障状况、配置信息可用性和健康状况、性能指标、统计维度、提供信息系统管理和工作报告、汇总和提供用户希望了解的数据、报告信息资产、统计服务。
本服务是一项基本服务,包含在
操作和维护服务中,帮助我们了解用户现有的信息资产,更好地提供系统操作和维护服务。
服务内容包括硬件设备型号、数量、版本和其他信息统计记录软件产品型号、版本和补丁和其他信息统计记录网络结构、网络路由、网络IP地址统计记录综合布线系统结构图统计记录其他附属设备的硬件设备列表如下表所示统计网络、安全系统运维服务从网络连通性、网络性能、网络监控和管理三个方面实现网络系统的运维管理。
网络、安全系统基本服务内容序列号服务模块内容描述提供商1现场备件安装与用户合作工程师根据备件到达时间到达现场2现场软件升级首先分析软件升级的必要性和风险。
配合用户进行软件升级3现场故障诊断根据服务级别724小时58小时4电话远程技术支持724小时5问题管理系统总结并发布网络核心交换机巡视典型运行计划系统管理单元维护单元设备名称设备类型管理IP检查内容参考标准检查结果检查结论巡视方法描述巡视周期硬件运行状态电源运行状态正常异常风扇运行状态状态正常□异常模块运行状态□正常□异常系统运行状态检查VLAN状态□正常□异常配置状态□正常□异常OSPF状态□正常□异常日志检查日志状态□正常□异常其他检查内容□正常□异常□正常□异常用户现场值班技术人员根据用户要求提供长期用户现场值班技术人员服务,确保网络的实时连通性和可用性,确保接入交换机、汇聚交换机和核心交换机的正常运行。
现场技术人员记录网络交换机的端口是否能够正常使用,网络的转发和路由是否能够正常进行,测试交换机的性能,评估网络的。