运维工具应用情况说明

运维工具应用情况说明
运维工具应用情况说明

运维服务工具应用情况说明

河南中裕广恒科技股份有限公司

变更履历

目录

一、 运维管理类工具的应用情况 ........................... 5 

1.1 智能交通运维系统 .................................. 5 1.1.1 系统业务介绍 ................................. 5 1.1.2 系统功能及原理 ............................... 6 1.2 知识库 ........................................... 11 1.2.1 系统业务介绍 ................................ 11 1.2.2 系统功能介绍 ................................ 11 二、运维监控类工具 ..................................... 13 

2.1中裕广恒智能交通运维维护管理平台V2.1 ............. 13 2.1.1系统业务介绍 ................................. 13 2.1.2系统功能及原理 ............................... 13 2.1.3工具应用情况 ................................. 17 2.2基于云计算平台的智能云运维终端(智能交通管理系统终端平台V2.0) ....................................... 17 2.2.1系统业务介绍 ................................. 17 2.2.2系统功能及原理 ............................... 17 2.2.3工具应用情况 ................................. 18 三、其他运维及故障检测工具 .............................. 18 

3.1入侵检测系统设备 ................................. 18 

3.2漏洞扫描设备 ..................................... 18 四、使用团队和收益 ..................................... 18 

序言

河南中裕广恒科技股份有限公司服务产品广泛应用于政府、企业、公安等单位,提供网络、PC服务器、小型机、数据库、智能交通等相关硬件设备的现场及定期巡检、故障处理等服务产品,由于行业覆盖面广,系统与各方各面都息息相关,系统的稳定性、安全性及持续运行能力尤其重要,而且随着政府、企业、公安等单位的业务发展,对信息化的依赖程度越来越高,对系统的稳定性、维护能力也提出了更高的要求。

正是在这种情况之下,运维服务的运行管理引起了公司的关注,同时也认识到一个好的运维系统需要好的运维工具支持,公司先后组建了运维研发组、运维部、服务台,针对客户管理、系统故障受理系统、系统监控及系统维护等软硬件平台进行部署及开发,先对目前运维服务工具的应用情况进行说明。

一、运维管理类工具的应用情况

利用智能交通运维系统完成。

1.1智能交通运维系统

1.1.1系统业务介绍

“智能交通运维系统”以ITSS为基础,融合项目管理、业务流程管理,集成移动终端、PGIS、报表引擎等技术手段,为服务团队打造了一套快速反应、高校智能的服务管理平台。对外,用户服务体验和服务质量大幅度提升;对内,运维项目管理水平不断提高和项目成本持续降低。系统主要组成包括以下部分:

1)维护资产的录入、梳理

2)故障受理、登记系统

3)问题管理系统

4)知识库管理系统

5)变更管理系统

6)查询、统计、分析系统

7)用户处理情况评价系统

8)故障业务跟踪系统

1.1.2系统功能及原理

智能交通运维系统架构图来看整体的解决思路:

1、事件管理

事件管理主要是用来管理用户的故障和请求,目的是尽快的恢复运维服务内容的正常运行,响应客户请求,避免用户业务中断,使事故对用户业务运营的影响降至最低。事件管理主要包含如下功能:

支持多种请求提交方式:用户可以通过电话、邮件、微信等多种方式提交故障和请求,确保用户请求可以无障碍提交给服务台,同时基于邮件、微信等多媒体报障信息的提交也确保了用户故障可以被清晰的转达;

自动关联知识库:基于故障现象自动从知识库中搜索相关的解决方案(关联解决方案将以红色显示),有助于提升服务台的一线解决率,从而事件处理整体效率,如图知识库自动关联;

人性化的调度策略:在事件分派环节,系统会根据任务信息分派工作,正确的事件分派,不仅可以提高请求的响应速度,同时也可大大提高事件处理效率,从而提升用户的服务体验和服务满意度,如图事件分派页面;

基于流程引擎的分派策略:系统可以基于流程引擎,根据项目、事件类别等不同的因素决定事件的下一步处理人,支持共享处理、指定唯一人员处理或者多人协同处理;

事件监控Dashboard:可以分别按照项目、状态、SLA、级别等不同的维度展示所有待处理的分布以及明细。

2、任务管理

任务管理主要用来管理周期性和突发性任务,通过发起主动巡检、维修、保养等手段来降低故障发生率、是提高服务质量的重要保障。

支持周期性计划任务制定:支持周期性计划任务制定,可设定计划任务的周期、执行频率,执行频率支持每天、每周、每月;

任务自动生成与派发:系统按照制定的周期性计划任务自动生成任务,生成任务时可根据任务发布设置确定在非工作日时是否生成任务,除此之外,系统还可根据派发策略自动将任务推送给相关负责人;

任务处理流程自定义:支持个性化任务流程的设定,企业可根据实际的任务处理流程,比如根据任务类型、优先级等设计不同的任务流程;

任务处理成本自动归集:支持任务处理工时以及处理费用的记录和统计,并可自动归集到对应的项目。

3、服务级别管理

服务级别管理是服务质量量化管理的重要手段,它管理着运维项目中乙方对甲方的服务质量的协议以及对协议的跟踪、监控,协议类型包括 SLA、OLA、UC。

服务协议自定义:系统支持 SLA、OLA、UC 的自定义,可针对不同项目的需求制定其服务协议,如图服务协议定义;

考核指标自定义:针对项目的实际需求,可定义每个服务协议所包含的考核指标;

完善的提醒和保障机制:为了确保服务协议的合规性,系统可针对考核指标设定目标提前提醒或者超时提醒,提醒的内容以及接收人可配置。

4、绩效管理

运维服务管理系统将人员 KPI 指标与服务过程有效结合起来,自动从服务过程中采集绩效数据,可帮助管理者可从以下几个方面进行人员绩效分析:

其一、分析对象从项目、部门、岗位到个人;其二、考核指标从满意度、SLA 合规性、工时利用率到工作量。?

工作量分析:可按照项目-岗位-人员来分析对应的工单处理总数、平均登记时间、平均响应时间、平均解决时间等指标,可横向比较项目、岗位以及人员之间的工作量指标;?

工时利用率分析:可按照部门-岗位-人员来分析对应的额定工时、实际总耗时、工时利用率以及工单流程每个环节的处理用时,可横向比较部门、岗位、人员之间的工时利用率,如图工时利用率分析;

SLA 合规性分析:可按照项目-岗位-人员来分析对应处理工单的总体合规性以及工单处理的每个环节的合规性,可横向对比项目、岗位以及人员之间的SLA 合规性;

满意度分析:可按照项目-岗位-人员来分析对应处理工单的总体满意度以及工单处理的每个环节的合规性,可横向对比项目、岗位以及人员之间的满意度;

5、报表管理

报表管理能帮助公司从故障分布、效率、满意度等分析项目当前的状况以及存在的问题,可根据企业实际统计分析需求制作各种图形或者统计分析报表。如图所示。

1.2知识库

1.2.1系统业务介绍

知识库使信息和知识有序化,是知识库对组织的首要贡献

建立知识库,必定要对原有的信息和知识做一次大规模的收集和整理,按照一定的方法进行分类保存,并提供相应的检索手段。经过这样一番处理,大量隐含知识被编码化和数字化,信息和知识便从原来的混乱状态变得有序化。这样就方便了信息和知识的检索,并为有效使用打下了基础。

知识库加快知识和信息的流动,有利于知识共享与交流

知识和信息实现了有序化,其寻找和利用时间大大减少,也便自然加快了流动,使有效的知识能够迅速传遍整个企业,这就使人们获得新信息和新知识的速度大大加快。

知识库还有利于实现组织的协作与沟通

公司的知识库可将员工的建议存入,员工在工作中解决了一个难题或发现了处理某件事更好的方法后,可以把这个建议提交给一个由专家组成的评审小组,评审小组对这些建议进行审核,把最好的建议存入知识库,知识库中注明建议者的姓名,以保证提交建议的质量,并保护员工提交建议的积极性。

知识库可以帮助企业实现对客户知识的有效管理

运维部门的信息管理一直是比较复杂的工作,一般老的运维人员拥有很多宝贵的信息,但随着他们负责项目的转变或工作的调动,这些信息和知识便会损失。因此,知识库的一个重要内容就是将运维项目的所有信息进行保存,以方便新的运维人员随时利用。

1.2.2系统功能介绍

知识库系统中包含了知识搜索、知识发布、知识审核、知识库维护、知识分类、知识管理等分支内容,如下图所示:

便捷的知识搜索:支持按类别检索和全文检索,也支持用户从搜索夹中快速找到相关的知识,如图知识搜索;

最有价值知识推荐:系统会自动根据知识的阅读量以及发布时间来计算知识热度并发布热门知识 Top10 排行榜,自动根据知识发布时间更新最新知识 Top10 排行榜;?

基于流程的知识审核:为确保知识的正确性,系统支持知识审核流程,

审核流程可按本企业的业务实际情况进行配置;?

知识评价:支持对知识进行评价,来帮助知识管理人员识别知识是否需要更新、报废等。?

二、运维监控类工具

2.1中裕广恒智能交通运维维护管理平台V2.1

2.1.1系统业务介绍

“中裕广恒智能交通运维维护管理平台V2.1”以ITSS为基础,对用户设备运行状态进行监测,对采集图像质量、数据的可靠性、安全性、一致性进行分析,同时对设备运行、网络运行环境、系统状态、客户访问和系统负载、告警功能等进行管理和分析处置。

系统主要组成包括以下部分:

1)●集成管理管理平台

2)●工单管理子系统

3)●报表管理子系统

4)●基础信息管理子系统

5)●权限管理子系统

2.1.2系统功能及原理

◇项目管理:对项目的信息进行增删改查操作

1、系统管理员点击项目管理按钮—>系统显示出所有项目的报表信息—>点击增加按钮—>系统弹出增加项目模块—>填写完毕可以保存(取消)—>系统根据管理员操作决定是否录入数据库中项目表。

2、系统管理员点击项目管理按钮—>系统显示出整个系统所有项目的报表信息—>点击删除按钮—>系统弹出是否删除项目模块—>可以点击确定(取消)—>系统根据管理员操作决定是否删除该项项目信息。

3、系统管理员点击项目管理按钮—>系统显示出整个系统所有项目的报表信息—>点击修改按钮—>系统弹出修改项目模块—>填写完毕可以保存(取消)—>系统根据管理员操作觉得是否修改数据库中项目信息表。

◇系统模块管理:对系统模块管理模块的信息可以进行增删查改。

1、系统管理员点击系统模块管理按钮—>系统显示出整个系统模块管理下所有模块的报表信息—>点击增加按钮—>系统弹出增加模块页面—>填写完毕可以保存(取消)—>系统根据管理员操作决定是否录入数据库中系统模块信息表。

2、系统管理员点击系统模块管理按钮—>系统显示出整个系统模块管理下所有模块的报表信息—>点击删除按钮—>系统弹出是否删除模块—>可以点击确定(取消)—>系统根据管理员操作决定是否删除数据库中该项系统模块信息。

3、系统管理员点击系统模块管理按钮—>系统显示出整个系统模块管理下所有模块的报表信息—>点击修改按钮—>系统弹出修改模块—>填写完毕可以保存(取消)—>系统根据管理员操作决定是否修改数据库中系统模块信息表。

◇子菜单管理:对子菜单管理模块信息可以进行增删查改。

主要涉及的业务包括自动工单创建模块、新增工单模块、工单派发模块、工单处理模块、申请结案模块、工单结案模块、工单保留模块、事件查询模块、已处理工单汇总模块、历史查询模块。

◇动工单创建模块:

(1)支持通过对告警采集后自动创建工单,加快工单录入速度

(2)支持自动工单的确认,删除,标注功能

◇新增工单模块:

(1) 支持从告警信息,资产信息,GIS展示为入口新增工单

(2)支持根据设备自动加载对应的系统大类

(3)支持自定义的常用语描述故障现象

(4)支持多用户创建工单

◇工单派发模块:

(1)支持根据故障设备,自动关联运维单位及其负责人

(2)支持派发后的短信,邮件等多方式通知

(3)支持对误派发的工单进行返回操作,返回服务台

(4)支持多用户派发工单

◇工单处理模块:

(1)支持根据设备指定默认的维修人员

(2)支持记录多次处理结果

(3)支持对误派工单进行返回服务台

(4)支持派发后的短信,邮件等多方式通知

(5) 支持根据设备类别预定义故障原因及处理过程中的常用语

◇申请结案模块:

(1)支持根据工单处理过程总结故障原因,解决方案向业主申请故障结案

(2)支持对误申请结案的工单进行返回工单处理或服务台

(3)支持短信,邮件等多方式通知

◇工单结案模块:

(1)支持对确认后的故障工单进行关闭

(2)支持对申请结案工单退回重处理

(3) 支持短信,邮件等多方式通知

(4)支持对暂时无法解决的工单进行保留状态

◇工单保留模块:

(1)支持对保留的工单重新返回处理流程

(2) 支持对保留工单进行结案

(3)支持短信,邮件等多方式通知

◇事件查询模块:

(1)支持对处理中的工单按工单产生时间,阶段,资产信息编号,责任人,运维单位等多条件对事件进行查询

(2)支持对所有未结案的工单进行保存

详细业务内容:

2.1.3工具应用情况

此工具在主要用于进行运维项状态监控,通过SNMP协议与各维护项的设备进行对接,实现对各系统设备的状态监控,同时通过电子工单、GIS展示、数据管理、综合管理等功能对各维护项进行状态检测,以获取各维护项的设备的精准运行状态,应用简便,易用性高,同时在多人同时登录时依然采集信息正常运行,系统操作正常。

2.2基于云计算平台的智能云运维终端(智能交通管理系统终端平台V2.0)2.2.1系统业务介绍

基于云计算平台的智能云运维终端(智能交通管理系统终端平台V2.0)会实时的将采集到的的GPS信息、温度、湿度、机柜门的状态、供电、网络及视频等数据发送到终端平台上。终端平台会将这些信息分析,通过高德地图实时展示内、外场设施GPS信息、温度、湿度、机柜门的状态、供电、网络及视频等结果。可清楚方便的查看外场设备完好率情况,能够查看正常、故障、告警等设备状态信息。

2.2.2系统功能及原理

物联智能设备信息管理

包括物联智能设备信息查询、物联智能设备信息维护

物联智能设备状态管理

包括物联智能设备状态查看、物联智能设备状态分析

物联智能设备终端监控管理

包括物联智能设备终端监控设置、物联智能设备终端监控管理

设备运行数据分析管理

包括设备运行数据分析设置、设备运行数据分析管理

设备运行数据查询管理

包括设备运行数据分类查询、查询结果打印

设备运行数据统计管理

包括设备运行数据统计设置、设备运行数据统计管理

2.2.3工具应用情况

此工具在主要用于外场设备状态监控,通过终端平台与各维护项的设备进行对接,实现对各系统设备的状态监控,同时实时获取设备的GPS信息、温度、湿度、机柜门的状态、供电、网络及视频等数据,对各维护项进行状态检测,以获取各维护项的设备的精准运行状态,应用简便,易用性高,同时在多人同时登录时依然采集信息正常运行,系统操作正常。

三、其他运维及故障检测工具

3.1入侵检测系统设备

入侵检测系统可以帮助运维服务人员对网络传输进行即时监视,在发现可疑传输时发出警报或者采取主动反应措施的网络安全设备。

3.2漏洞扫描设备

公司配备了漏洞扫描设备,能够帮助服务人员主动诊断用户系统安全漏洞并提出专业防护,同时能够出具详细的检测报告。可以提前掌握网络中的安全漏洞并做好预防工作,能够有效的避免由于攻击所造成的损失。

四、使用团队和收益

综上所述,我们可以看到加强系统运维中的软硬件工具的开发和使用将帮助我们更好的管理、维护、监控系统的运行。

1、智能交通运维系统主要由运维服务部和服务台全体人员在运维服务过程中

使用,按ITSS流程有效的规范了项目管理、事件管理、变更管理、问题管理、发布管理、备件管理、知识库管理等,通过对客户故障申告、处理系统可以对客户的诉求进行快速响应,对故障进行判断、分析、跟踪、解决,加快了响应速度,缩短了处理时间,提高了客户的满意度,也是公司内部的运

维服务过程管理趋于规范化。

2、运维服务部通过各类系统监控工具可以及时了解客户系统的运行情况,在故

障发生前进行预防,在故障发生后及时告警并自动在智能交通运维系统中生成事件,同时也为系统的巡检提供了大量的数据依据,为客户系统的优化、完善打下了坚实的基础,同时缩短了系统故障响应处理的时长,使故障能够得到及时的解决。

3、运维服务部通过使用如基线核查系统、入侵检测、漏洞扫描等一些硬件测量、

测试工具,可以针对一些疑难故障或入侵攻击进行诊断,这些问题往往无法靠简单的流程、功能测试进行重现,因此使用这些工具可加快问题原因的分析,使一些以往无法判断的故障得到了彻底的解决,有效的减少用户系统的隐患和故障率,提高了客户的满意度。

4、在运维服务实施过程中,面临着各种问题、风险以及新技术应用所提出的新

要求,因此技术研发团队现已具备研发、应用新技术和发现问题、解决问题以及风险控制的能力。

5、通过运维工具实现了主动发现问题,分析问题、诊断问题,公司还制定了事

件、变更、发布、问题等管理流程,通过这几个方面的工作提升了发现问题、解决问题的效率。

总之,公司在系统运维、故障监控及故障处理中应用了大量的硬件及软件辅助工具,规范了运维服务过程,增强了系统运行的稳定性、故障预判能力、故障及时处理能力,提高了客户的满意度。

运维监控工具应用情况说明(模板)

运维监控工具应用情况说明 编写人: 审批人: 发布日期:

变更历史

目录 工具名称 (5) 工具主要功能 (5) 工具应用情况 (6) 运行维护工具使用过程中发现的问题项 (6)

工具名称 pManager3.1综合监控系统 综合监控工具是用于对机房集中进行监控和测量。该工具主要是对机房设备的工作状态进行综合监控,确保设备的工作正常,以及设备出现故障时能够及时的报警和显示。 工具主要功能 综合监控工具是公司自行购买的监控工具 主要功能有: (1)监测报警功能:能够实时的对被监控设备进行在线监测,并将监测的数据信息进行上报,当出现故障灯现象时,可以进行报警提示。 (2)控制功能:能够根据相应的用户权限对被监控设备进行控制,同时可以对设备的参数进行设置。 (4)查询、统计功能:能够对被监控设备的各种存储信息进行查询、统计,如设备的工作时间统计报警记录统计、控制操作统计等。 (5)系统配置功能:设备的监控参数可以进行动态配置,监控画面、设备名称、参量名称、报警名称、报警逻辑关系等进行配置。 (6)用户管理功能:可以增加、删除设备用户,修改用户权限和口令等。 (7)实现功能有综合监控、节能系统、权限管理、报表管理、门禁管理、告警管理等

工具应用情况 综合监控工具已经在机房监控中使用。主要对机房温湿度、服务器、ups、门禁、消防、通信设备、智能空调等进行监测。 运行维护工具使用过程中发现的问题项 设备使用中发现的问题 ●设备CPU利用率监控实例无监控数据 ●查看性能时无监控数据 ●非接口类指标监控任务添加失败 ●服务器共享目录后所有设备无监控数据 ●接口类指标监控任务添加失败 ●添加监控任务后无数据 ●性能监控数据与设备命令行数据不一致

中国移动工单管理子系统操作手册

技术文件 技术文件名称:EOMS工单管理子系统操作手册技术文件编号: 版本:V2.0 文件质量等级:A级 共21 页 (包括封面) 拟制于周理 审核 会签 标准化 批准 南京中兴软创科技股份有限公司

目录 1参数配置 (4) 1.1 故障紧急程度配置 (4) 1.1.1 新增故障紧急程度类型 (5) 1.1.2 修改故障紧急程度类型 (5) 1.1.3 删除故障紧急程度类型 (6) 1.2 外部系统配置 (7) 1.2.1 外部系统配置 (8) 1.2.2 派单规则定制 (8) 2工单流转 (9) 2.1 派发工单 (10) 2.2 受理和回复工单 (12) 2.3 归档工单 (14) 3工单查询 (16) 3.1 工单查询 (16) 3.2 快速查询 (18) 4工单统计 (19) 5故障处理 (20)

工单管理 1参数配置 1.1 故障紧急程度配置 点击“工单管理\参数配置\故障紧急程度配置”进入故障紧急程度配置界面(如图1-1,1-2)。 图1-1 图1-2

1.1.1新增故障紧急程度类型 1.在故障类型和处理时限列表中,右键,点“新增故障紧急程度类型”(如图1-3)。 图1-3 2.输入紧急程度ID,紧急程度名称等(如图1-4)。 图1-4 3.点“确定”按钮,新增故障紧急程度类型完成。 1.1.2修改故障紧急程度类型 1.在故障类型和处理时限列表中,右键,点“修改故障紧急程度类型”(如图1-5)。

图1-5 2.修改紧急程度名称,紧急程度说明等(如图1-6)。 图1-6 3.点“确定”按钮,故障紧急程度类型修改完成。 1.1.3删除故障紧急程度类型 1.在故障紧急程度类型列表中,右键,点“删除故障紧急程度类型”(如图1-7)。

IT部门软件维护与运维人员职责说明

软件维护人员职责及运维人员岗位职责 一、软件维护人员职责 1.1概述 全面负责公司网约车业务有关程序的二次开发和维护工作,对项目负责。负责公司项目的想象设计,编码、内部测试的组织和实施,按照标准流程对技术开发的代码和文档进行管理,及时完成上级交派的各项技术开发任务。 1.2说明 1.全面负责技术开发工作,并严格按照公司的标准流程进行二次开发和代码管理等工作;2.掌握必要的技术开发技能,满足日常开发工作的需求; 3.建立标准的技术开发流程,方便公司对技术开发进行更好的管理; 4.负责更换,维护公司已有软件或设备,解决在日常遇到的各类技术问题; 5.良好的学习能力,不断的提高自身业务水平; 6.恪守保密原则,不将公司内部机密外泄或用于其它不合法的用途,提交可供审核评定的工作成果,保证公司软件系统的正常使用,积极完成上级领导制定的其他开发任务。 二、运维管理人员岗位职责 2.1 软件安装 1.软件安装需要安装在指定的目录下; 2.软件安装操作如需要重启服务器,需要通知相关负责人,通知内容包括:操作原因,操作可能造成的影响,操作时间等信息,得到批准后方能进行安装,重启服务器; 3.严禁在服务器中私自安装与公司业务无关的软件,如私自安装软件造成公司业务受损,

将追究个人的法律责任; 4.日志检查与备份 A.每天定时检查一次每台服务器的日志文件,如发现有“严重错误”的,必须立即检查并排除故障; B.所有日志需定时备份,每天应进行增量备份,每周需进行全备份一次。 C. 备份文件夹统一为:* D:\DataBack\ 下,文件名格式为: YY(年)(月) DD(日) 5.文件、磁盘检查 每天检查每个服务器的磁盘情况,如果发现磁盘的使用容量超过70%以上时: A.应及时删除不必要的文件腾出磁盘空间,必要时提报申购新的磁盘; B.定时检查服务器相关文档,严禁存放违规的软件及资料,一旦发现,立即通知当事人,并要求解释,如果情节严重时,应去除该用户的访问权限,保留现场,同时通知相关负责人进行下一步处理; C. 每月进行一次磁盘文件整理 6. 文件备份管理 A.重要文件需进行定时备份; B.服务器重要数据,每周备份一次; C.每月进行一次备份检查。 7. 服务器管理与故障收集 A. 服务器的故障包括:软件故障,硬件故障,网站故障,黑客入侵与攻击,其他不可预料的未知故障等; B. 故障记录:建立服务器故障日志数据库,对发现的各种故障现象进行详细记录,记录内容包括:故障发生的时间,故障现象,故障位置,故障分析,故障原因,故障记录人员应尽快以书面或者电话或者其他相关形式; C. 对于维护人员不能尽快处理的故障,尽快通知相关负责人并发布公告,自己保留相关记录存档。 D.需要对服务器进行软件改动和服务改动等更新申请时需要对相关负责人提交邮件申请,待主管人员批准后由专门的人员进行操作,并对操作记录进行登记备查。 E、各类故障处理流程首先检查网络状况,联系网络运维人员。检查网络状况,如有必要,对服务器进行重启。核查网络是否异常,登陆服务器检查服务器运行情况,如有必要,对服务器进行重启。

智能运维管理系统

1.1智能运维管理系统 1.1.1设计目标 公安将关键业务运行于IT网络系统之上,那么该系统是否能够正常运行直接关系到业务是否能够正常运行的关键之所在。但目前普遍管理人员经常面临的问题是:网络变慢了、设备发生故障、应用系统运行效率很低、想升级改造系统但无法说清问题的真实原因。网络系统的任何故障如果没有及时得到妥善处理都将会导致很大的影响甚至会成为灾难。因此,如何保障网络系统的正常运行,实现:预知故障,即在故障发生之前发现故障;实时告知,即在第一时间将故障情况通知相关的管理人员;有效处理,即在预定的时间内处理故障,若未及时处理将采取升级措施;以上问题简单来说,如何实现“第一时间发现问题”、“第一时间通知相关人员”,“第一时间处理问题”,成为智能运维管理系统主管关注的重点问题。 本系统设计目标是建设一套对平台服务器、服务软件模块、数字视频设备、监控摄像头和图像质量进行定时巡检诊断、故障记录、告警、统计分析、故障旁路、设备和软件模块整合于一体的智能化运维管理系统。 1.1.2系统组成结构 系统由设备巡检服务器、视频信号诊断服务器、报警转发服务器、网管客户端和数据库组成。 设备巡检服务器通过向各本服务器、服务软件模块、数字视频设备发送巡检指令来获取设备运行状态,对于故障设备,按照服务器热备策略自动启动备份服务器(如流媒体服务器),或重启设备和服务模块,以实现故障旁路和自动恢复功能。 视频信号诊断服务器对系统内视频信号轮巡检测,检测结果在数据库自动产生记录并告警; 故障信号通过报警转发服务器向网管客户端、手机和电子邮件发送告警信

息。 为了提高故障检测诊断效率,增强故障发现的实时性,设备巡检服务器可以分布部署,设计在每个分局部署一台设备巡检服务器,负责对本网络区域内设备的巡检。 报警转发服务器和数据库仍利用一期的设备,无需另外配置。 系统原理结构图如图4.5所示。 派出所分控中心1 派出所分控中心2 派出所分控中心3 智能运维管理系统原理图 1.1.3设备与工程信息管理 可以对前端所有设备的信息进行统一管理,管理人员有针对的进行设备维护,如下图。

软件系统运维手册(完整资料).doc

【最新整理,下载后即可编辑】 系统运维手册 1、目的 (3) 2、适用范围 (3) 3、服务器及数据库概述 (3) 3.1 服务器概述 (3) 3.2 数据库概述 (3) 4、系统服务程序的详细说明 (4) 4.1系统服务程序的构成 (4)

4.2 系统服务程序的启动、关闭及维护管理 (4) 4.2.1 dhcp主服务 (4) 4.2.2 dhcp从服务 (5) 4.2.3 web管理模块 (5) 5、服务器硬件维护(略) (6) 6、windows 2003系统的日常维护 (6) 6.1 定期检查磁盘空间 (6) 6.2 维护系统注册表 (7) 6.3 定期备份系统注册表 ..................................................................... 7 6.4清理system路径下的无用的dll文件 (7) 7、备份策略 (8) 7.1 备份方式 (8) 7.2 备份计划 (8) 7.3 常见故障恢复 (8) 9、数据库的日常维护 (11) 9.1 检查数据库的基本状况 (11) 9.2 检查数据库日志文件 (11) 9.4监控数据库表空间的使用情况(字典管理表空间) (11) 9.4.1 判断是否需要碎片整理 (11) 10、命令解释 (12) 1、目的 楚天行消费卡管理系统运营支撑系统使用的服务器中,服

务器均采用windows xp操作系统,数据库版本为:sql server 2000,随着业务的开展,sql server 数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。 本手册详细描述了程序模块,windows xp操作系统,负载平衡及sql server 数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。 2、适用范围 使用者为网e通宽带网络运营支撑系统维护工程师 3、服务器及数据库概述 3.1 服务器概述 服务器数量:4台,基本信息如下: 3.2 数据库概述 数据库软件分别安装在主服务器上。 4、系统服务程序的详细说明 4.1系统服务程序的构成 DHCP主程序:

运维服务工具应用情况说明书

运维服务工具应用情况说明 编制: 审核: ****公司 二〇一四年一月 所有:****公司。保留所有权利。

目录 序言 (3) 一、运维管理类工具的应用情况 (3) 1.1 400客服故障业务受理系统 (3) 1.1.1系统业务介绍 (3) 1.1.2系统功能及原理 (4) 1.2 知识库管理工具 (5) 1.2.1系统业务介绍 (5) 1.2.2系统功能介绍 (5) 二、监控、系统维护类工具的应用情况 (6) 2.1指挥调度系统监控平台 (6) 2.2硬件系统监控工具 (7) 2.3程控交换机维护工具 (7) 三、其他运维及故障检测工具 (7) 3.1示波器 (7)

序言 ****公司产品广泛应用于****单位的指挥中心,提供特服的受理及后期处理平台,由于行业的特殊性,系统的稳定性、安全性及持续运行能力尤其重要,而且随着业务发展,特服受理系统的涉及围越来越官方,对信息化的依赖程度越来越高,对系统的稳定性、维护能力也提出了更高的要求。 正是在这种情况之下,特服指挥调度系统的运行维护管理引起了公司的关注,同时也认识到一个好的运维系统需要好的运维工具支持,公司先后组建了运维工具开发团队及系统产品监控、维护工具开发团队,针对客户管理、系统故障受理系统、系统监控及系统维护等软硬件平台进行部署及开发,先对目前运维服务工具的应用情况进行说明。 一、运维管理类工具的应用情况 运维、管理类工具目前公司主要是利用400客服故障业务受理系统完成。 1.1400客服故障业务受理系统 1.1.1系统业务介绍 “400客服故障业务受理系统”主要完成公司负责承建的各类系统在运行过程中出现的故障申报的业务受理系统,该系统通过硬件及软件实现对客户的受理、处理、反馈、跟踪功能,并为客户提供7×24小时不间断服务,系统主要组成包括以下部分: 1)故障业务排队接入受理系统 2)后台业务流转通信平台 3)故障受理、登记系统 4)二级分配、处理系统 5)数字录音录时子系统 6)查询、统计、分析系统 7)用户处理情况回访系统 8)故障业务跟踪系统

智慧交通产品总体解决方案-交通运维管理平台

智慧交通产品解决方案 交通运维管理平台 【面向城市交通】

目录 1.1.概述 (3) 1.2.交通运维管理平台 (4) 1.2.1.平台概述 (4) 1.2.2.平台特点 (5) 1.2.3.平台结构 (6) 1.2.4.业务流程 (7) 1.2.5.平台组成 (11) 1.2.6.平台接口 (32)

概述 我公司在用户需求的基础上,通过对城市公安交通指挥系统各技术子系统的功能进行梳理、分类,根据GA/T445-2010《公安交通指挥系统建设技术规范》、GAT1146-2014《公安交通集成指挥平台结构和功能》要求的功能和我公司自行拓展的功能,将城市公安交通管理的业务应用划分为五大核心平台,即智能交通管控平台、交通信息服务平台、交通运维管理平台、交通地理信息平台和交通信息资源平台,如下表所示: 表错误!文档中没有指定样式的文字。-1核心业务平台及功能

1)智能交通管控平台 作为公安交通指挥中心核心应用平台,以总队、支队、大队、路面岗勤为主用户群,以城市交通状况监测、交通日常管控、突发事件处置为核心业务,通过交通信息资源云中心对接交互,为指挥中心、科室、路面等各角色提供各类应用的业务平台。 2)交通地理信息平台 针对交管平台专门打造的地理信息应用系统,以公安网为基础,以警用电子地图为核心,以地理信息技术为支撑,对空间地理数据进行可视化展现及空间数据分析,为核心业务平台提供基础支撑。 3)交通信息服务平台 为公安交管用户提供面向公众的交通信息服务,实现交通信息采、编、审、发,通过诱导屏、微信、微博等方式对外发布。 4)交通运维管理平台 作为交通技术服务部门提供运维管理工具,通过设备管理、设施管理、警力资源管理、应用运行监测和系统管理等手段有效管理交通设备、应用系统和警力资源,提高智能交通系统的整体运行效率。 5)交通信息资源平台 交通信息资源平台为应用系统提供统一的数据采集和传输服务,支撑跨单位间按需信息交换与共享。实现多种类型的数据采集,可靠、快速、安全地数据传输,多种类型的数据交换等一系列的功能和非功能性需求,从而实现互连互通、数据共享。 1.1.交通运维管理平台 1.1.1.平台概述 交通运维管理平台作为一套基础支撑平台,通过交通设备管理系统、交通设施管理系统、

软件系统运维手册

软件系统运维手册文件编码(GHTU-UITID-GGBKT-POIU-WUUI-8968)

系统运维手册

1、目的 楚天行消费卡管理系统运营支撑系统使用的服务器中,服务器均采用windows xp操作系统,数据库版本为:sql server 2000,随着业务的开展, sql server 数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。 本手册详细描述了程序模块,windows xp操作系统,负载平衡及sql server 数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。 2、适用范围 使用者为网e通宽带网络运营支撑系统维护工程师 3、服务器及数据库概述 3.1 服务器概述 服务器数量:4台,基本信息如下:

3.2 数据库概述 数据库软件分别安装在主服务器上。 4、系统服务程序的详细说明 4.1系统服务程序的构成 DHCP主程序: DHCP从程序: 4.2 系统服务程序的启动、关闭及维护管理4.2.1 dhcp主服务 4.2.1.1 dhcp主服务说明

4.2.1.2 dhcp启动、关闭及进程查看方法 1、启动方法: 输入:cd /opt/dpcp ./dhcpd即可 注意:请首先确认数据库服务正常,数据库监听正常。 输出: [root@localhost dhcp]$ ./dhcpd Internet Systems Consortium DHCP Server V3.0.4 Copyright 2004-2006 Internet Systems Consortium. All rights reserved. For info, please visit https://www.360docs.net/doc/d72625526.html,/sw/dhcp/ Wrote 1 leases to leases file. Listening on LPF/eth0/00:0c:29:fb:d4:32/192.168.50/24 Sending on LPF/eth0/00:0c:29:fb:d4:32/192.168.50/24 Sending on Socket/fallback/fallback-net 说明:dhcp启动时,会启动1个进程,正常情况下,dhcp启动的进程数为1个。 2、关闭方法 输入:kill pid

IT可视化综合运维管理系统白皮书V

IT可视化综合运维管理解决方案 SmartView产品 技术白皮书 版本号版本日期修改人修改备注 2011-05-25 常飚创建 2011-07-18 常飚增加IT管理内容 2011-8-11 常飚完善整体描述

目录

一、导论 1.1. 产品背景 IT行业技术突飞猛进地发展,设备集成度不断提高,使各种网络设备之间的界限逐渐模糊,主设备、传输系统、支撑系统之间相互融合,互相渗透,已经逐步向一体化的解决方案迈进。 首先,机房内由设施数量众多,特别是当企业存在分支机构,由于分布范围广,机房内走线将非常复杂,尤其是老机房,如何理清楚设备与设备、设备与系统的拓扑关系,通常是机房维护人员的最为头疼的难题。 其次,对于办公区域,存在大量固定资产、移动办公类设备,这些设备资产的管理常常具有移动性,且各种人为情况较多。办公区域工位与网络也有一定的对应关系,如何找出工位与设备资产、工位与网络端口的对应关系,将能够很大程度上提升并规范企业的IT水平。 此外,当设备出现故障的时候,在相同类型的设备中,如何能快速定位出故障设备,如何真实的通过系统反应出设备环境及周边情况;如何通过系统以往解决过程和系统知识库,提供可参考的解决思路,将能够显着提高运维的自动化程度。 因此,有必要建立一套“集中监控、集中维护、集中管理”的监控系统,实现对企业IT资产实现远程集中监控,实时动态呈现设备告警信息及设备参数;快速定位出故障设备,使维护和管理从人工被动看守的方式向计算机集中控制和管理的模式转变;通过标准的ITIL流程提升企业IT服务效率。 3D仿真是企业IT数字化管理信息化建设的一个重要的组成部分,全三维可视化资源管理与运维监控平台,形象化的虚拟场景和真实数据相结合,通过3维场景能显着增强机房查看与监控,企业办公区域监控,提高设备、设施、资产与流程的直观可视性、可管理型,真正提高企业IT运维管理的效率,让IT真正服务于企业运营。 神州数码针对以上问题推出一套基于生产实景的全3D可视化IT资源管理与运维监控管理平台,形象化的虚拟场景和真实数据相结合,用户在显示屏幕前即可查看到机房中的所有设备,对于日常维护人员对设备的运行监控管理,资产审核人员对设备的盘点清查,以及领导视察机房的建设运行情况,可以使用户不必进入机房即可进行相关工作,

中国移动运维支撑子系统操作手册

技术文件 技术文件名称:EOMS运维支撑子系统操作手册技术文件编号: 版本:V2.0 文件质量等级:A级 共35 页 (包括封面) 拟制于周理 审核 会签 标准化 批准 南京中兴软创科技股份有限公司

版本号 2.0 制定日期2004-12-8 制定人员于周理修订版本号修订日期修订人员修订内容 2.0 2004-12-8 于周理创建文件

目录 1运维经验库 (5) 1.1 运维经验库管理 (5) 1.1.1 增加运维经验 (6) 1.1.2 修改运维经验 (7) 1.1.3 审核运维经验 (8) 1.1.4 作废运维经验 (9) 1.2 运维经验库查询 (9) 2发布管理 (11) 2.1 信息栏目定制 (11) 2.1.1 增加信息栏目 (12) 2.1.2 修改信息栏目 (13) 2.1.3 删除信息栏目 (14) 2.2 维护信息发布 (15) 2.2.1 发布信息 (15) 2.2.2 修改信息 (16) 2.2.3 删除信息 (17) 2.3 撰写公告 (17) 2.3.1 撰写公告 (18) 2.3.2 修改公告 (18) 2.3.3 审核运维经验 (19) 2.3.4 强制失效公告 (19) 2.4 审核公告 (20) 3工单考核 (20) 3.1 工单考核配置 (20) 3.1.1 新增考核部门 (21) 3.1.2 修改考核满分 (22) 3.1.3 增加考核指标 (22) 3.1.4 删除考核部门 (23) 3.1.5 删除考核指标 (23) 3.1.6 修改考核指标 (24) 3.2 工单考核结果查询 (25) 3.2.1 查询考核结果 (25) 3.2.2 查看工单考核规则 (26) 4KPI指标展示 (27) 4.1 指标展示定制 (27) 4.1.1 新增单一指标多时间统计 (27) 4.1.2 新增单一指标多指标类别统计 (28) 4.1.3 新增单一指标多地州统计 (29) 4.1.4 新增多指标统计 (30)

运维管理系统需求说明书

1概述 1.1开发背景和意义 随着公司规模的迅速扩大,现行的纯纸质化办公,效率低下、资料保存和查询非常困难、成本高、不利于多人协同办公,成为日常办公的严重制约。尤其是需要审批的事项,如果遇到审批人出差或不在公司,往往需要等待,协调的成本很高,工作决策不能及时进行,大大降低了工作效率。开发审批系统,使得申请人和审批人不受地域和时间限制,审批流程自动流转,相关人可以快键协调。 1.2开发目标 系统在需求设计时要充分考虑了用户的使用习惯、模块间的相互独立性,减少系统间的相互依赖,使其能单独运行,便于开发和维护,也有利于以后的扩充,做到与其他业务系统的高内聚、松耦合。 特别强调系统的用户体验,以及与实际审批业务的贴合性,真正方便用户的申请和审批业务快键开展。 1.3主要内容 系统主要内容包括: (1) 考勤管理:员工的加班、调休、请假、市内外出、出差等的申请、审批、查询和统计。 (2)转正申请:员工完成试用期,进入转正审批环节,完成该环节后,成为正式员工。 (3)物资申请:办公用物资的申请和审批。 1.4用户对象 包括总公司、山西、广西、河南、湖北等办事处、分公司全部员工。

1.5业务数据时间要求 针对用户对数据的要求,业务数据做永久性保存,部分业务数据可转入查询库中作为历史数据供查询使用。 2功能需求 2.1功能框架 2.1.1总体框架 操作系统运行监控: 虚拟机可用性 cpu负载 内存使用 IO情况 空间使用情况 OS日志 进程情况 计划任务情况 时钟偏差 端口使用情况 路由表 一页查看 多操作系统执行命令: 中间件运行监控: 取jmx的一些指标。 数据库运行监控: 主目录 集群状态 实例状态 监听器状态 表空间预警 归档情况 rman备份情况 不良sql 未使用的索引 大表数据量 alert文件报错

软件系统运维管理守则

精心整理 系统运维手册 1、目的 (3) 2、适用范围 (3) 3、服务器及数据库概述 (3) 3.1 服务器概述 3.2 数据库概述 4、系统服务程序的详细说明 4.1系统服务程序的构成 4.2 5 5 6 6、 6 6.1 6 6.2 7 6.3 定期备份系统注册表 (7) 6.4清理system路径下的无用的dll文件 (7) 7、备份策略 (8) 7.1 备份方式 (8) 7.2 备份计划 (8)

7.3 常见故障恢复 (8) 9、数据库的日常维护 (11) 9.1 检查数据库的基本状况 (11) 9.2 检查数据库日志文件 (11) 9.4监控数据库表空间的使用情况(字典管理表空间) (11) 9.4.1 判断是否需要碎片整理 (11) 10、命令解释 .1、目的 xp 操作系统,数据库版本为:数据 数 2 33.1 服务器数量:4台,基本信息如下:

3.2 数据库概述 数据库软件分别安装在主服务器上。4、系统服务程序的详细说明4.1系统服务程序的构成 DHCP主程序: 4.2.1.2 dhcp启动、关闭及进程查看方法1、启动方法:

输入:cd /opt/dpcp ./dhcpd即可 注意:请首先确认数据库服务正常,数据库监听正常。 输出: [root@localhost dhcp]$ ./dhcpd Internet Systems Consortium DHCP Server V3.0.4 All rights reserved. Wrote 1 leases to leases file. Listening on LPF/eth0/00:0c Sending on LPF/eth0/00:0c 说明:dhcp启动的进程数为1个。 2 输入: 说明:|-dhcpd(4665),则进程id为4665,则 3、进程查看 输入:[root@localhost dhcp]# pstree -p | grep dhcp 输出: |-dhcpd(4665)

移动掌上运维门户系统技术建议书

移动运维门户系统技术建议书 二〇二〇年五月

目录

1 概述 运维门户是技术框架中的重要平台,按总部-省两级系统进行建设,是进入所有网管支撑系统的统一通道,基于界面集成技术,面向应用场景和角色实现各类专题视图。随着4G时代的来临,新型网管信息门户应该是服务不同层面网管用户的网络运行的综合信息发布平台,是网管运维管理、决策支撑的助手;是企业内部宣传、文化沉淀、战略传承的工具;是企业与员工、员工与员工沟通协作的桥梁。 随着4G时代网络飞速发展,移动办公必将取代PC侧成为主流信息交互手段,新型门户将更加侧重在移动侧信息的展现,使资讯推送浏览更加便捷;相对移动办公作为主流资讯获取方式,新型门户Web端则作为统一数据源头,更聚焦于数据应用的规范管理、精准统计。 2 建设目标 要求完成如下模块功能的安卓版和IOS版: 1)建设形成采集层-处理层-呈现层三层架构,并与4A调测接口,实现用户统一认证功能,即登陆一次门户后使用其余APP不需要再用 户认证。能够接入其他厂商APP并快速集成。 2)性能管理模块,展现性能指标报表

3)GIS地图展现模块 4)网络社交平台模块 5)将现有日报推送系统呈现的KPI、监控快报等所有报表呈现在手机中,形成综合呈现模块,便于各层次人员查看 6)信息发布模块:将现有EOMS所有信息公告呈现为手机APP,支持手工上传。 以上功能模块需要在安卓手机和IOS苹果手机都能够应用。 7)网络健康度模块,将所有地市网络质量情况呈现报表,并对地市考核 3 系统总体架构 技术架构 总体技术架构分为三层:数据层,服务管理层和展现层 1)展现层提供手机终端必须的系统组件和必要的业务组件,并在此基础上开发和接入业务应用。 2)服务管理层主要提供平台业务服务的管理,平台后台管理,大厅服

企业信息系统自动化运维工具的应用

龙源期刊网 https://www.360docs.net/doc/d72625526.html, 企业信息系统自动化运维工具的应用 作者:郭晓宏 来源:《电子技术与软件工程》2016年第05期 摘要简要介绍了海洋石油富岛有限公司自动化运维工具点检系统的主要功能,详细分析了点检系统的技术路线及架构,针对不同的应用系统提出了相应的点检数据获取方法。 【关键词】自动化运维点检 1 引言 目前海洋石油富岛有限公司已有生产管理系统、SAP、OA等多套生产与办公系统,目前主要的巡检工作依靠日常的人工点检处理,人工点检费时费力,也无法做到高频度的点检,因而时有系统故障影响业务开展情况的发生 随着信息化在工厂的不断深入,我们发现信息化运维的技术手段远远落后于信息化的发展速度,新形势下信息系统的运维管理越发苍白无力。每增加一个应用系统就需要相应配套服务器和一系列软件,系统蔓延的趋势越来越明显,从而导致运维工作不可控,运维保障难度增大、人员效率低。另一方面,人工巡检的频度和覆盖率有限,造成很多情况下系统出现问题后才被动响应。因而,如何将事后管理变成事前处理,将被动运维转换为主动运维成为一个突出的问题。 通过点检系统的实施,借助新技术的运用,降低人为巡检的工作量,提升运维的效率,降低投资和人力;通过实现系统巡检的自动化处理,以足够的广度和深度去采集充足的信息,逐步实现主动运维的目标。 2 点检系统概述 运维点检模块由服务器端程序、配置客户端、点检客户端三部分构成,服务器端主要为客户端提供数据服务,调度各点检客户端的运转,通过短信接口、电子邮件接口提供报警通知,通过SM系统接口写入运维处理单。 配置客户端由系统管理员和高级用户使用,根据用户授权可以实现对整个点检系统进行配置和监控。点检监控功能可以统一浏览各系统点检的情况,可以查看各点检客户端当前点检项等信息;点检计划管理各点检对象的点检频度和时间。点检单查询可以对以往点检记录进行查询分析;点检对象配置和点检项配置对系统点检的处理进行基础配置,包括点检的条件,各种数据来源,判断条件公式等;用户管理对本系统用户进行配置及授权;接口查询功能可以查询服务器端各接口的运行情况;日志查询可以查询系统的运行情况及后台的处理日志。

信息系统运维管理制度

信息系统运维管理制度 为了规范公司信息系统的管理维护,确保系统硬、软件稳定、安全运行,结合公司实际,制定本制度。制度包括信息机房管理、服务器管理、信息系统应用管理、信息系统变更管理、信息系统应用控制。 一、信息机房管理 1、硬件配备及巡检 1.1、各单位信息机房按规定配备防静电地板、UPS、恒温设备、温湿度感应器、消防设备、防鼠设施等相关基础设施。 1.2、各单位机房管理人员应定期(如每月或每季度)对机房硬件设备设施进行巡检,以保证其有效性。 1.3、各单位机房应建立相关的出入登记、设备机历登记、设备巡检、重大故障等记录,并认真填写。 2、出入管理 2.1、严禁非机房工作人员进入机房,特殊情况需经信息中心批准,并认真填写登记表后方可进入。 2.2、进入机房人员应遵守机房管理制度,更换专用工作鞋。 2.3、进入机房人员不得携带任何易燃、易爆、腐蚀性、强电磁、辐射性、流体物质等对设备正常运行构成威胁的物品。

3、安全管理 3.1、操作人员随时监控中心设备运行状况,发现异常情况应立即按照应急预案规程进行操作,并及时上报和详细记录。 3.2、未经批准,不得在机房设备上随意编写、修改、更换各类软件系统及更改设备参数配置; 3.3、软件系统的维护、增删、配置的更改,必须按规定详细记入相关记录,并对各类记录和档案整理存档。 3.4、机房工作人员应恪守保密制度,不得擅自泄露信息资料与数据。 3.5、机房内严禁吸烟、喝水、吃食物、嬉戏和进行剧烈运动,保持机房安静。 3.6、严禁在机房计算机设备上做与工作无关的事情(如聊天、玩游戏),对外来存储设备(如U盘、移动硬盘等),做到先杀病毒后使用。 3.7、机房严禁乱拉接电源,应不定期对机房内设置的消防器材、烟雾报警、恒温设备进行检查,保障机房安全。 4、操作管理 4.1、机房的工作人员不得擅自脱岗,遇特殊情况离开时,需经机房负责人同意方可离开。 4.2、机房工作人员在有公务离开岗位时,必须关闭显示器;离开岗位1小时以上,必须关闭主机及供电电源。 4.3、每周对机房环境进行清洁,以保持机房整洁;每季度进行一次大清扫,对机器设备检查与除尘。

ITSS实例文件-运维工具管理制度-模板

xxx有限公司 运维工具管理制度

修订记录

目录 1 目的 (3) 2 工具分类分类制度 (3) 3 工具记录制度 (3) 4 采购制度 (3) 5 运维工具发布 (3) 6 运维工具使用情况说明 (4) 7 运维工具的评审 (4) 8 运维工具的改善 (4) 9 衡量指标 (4)

1 目的 公司为提高运维服务效率,以及达到合同约定SLA,在运维服务项目中大力推广工具的使用,即使在客户预算有限的情况下,也主动免费提供运维工具帮助客户进行IT系统运维服务管理,以提高运维服务生产率和故障及时发现和恢复效率。为满足客户特定需要,可以采购第三方运维服务管理工具,以满足客户运维服务项目需要。 2 工具分类分类制度 公司内部的运维工具按用途可分为 1)监控工具 2)管理工具 3 工具记录制度 应对公司所有的运维软件工具及硬件工具的状态及数量进行准确的记录在《运维工具使用清单》,当运维工具的状态发生改变时应及时更新记录。 4 采购制度 公司内部的所有运维工具应采用按需采购的制度,得到批准后才能采购。 5 运维工具发布 运维服务工具分二大类:第一类:实时监控类工具、在线分析类工具和运维管理类工具,第二类为:发现问题的工具,解决问题的工具、日常作业工具和解决方案。 第一类工具由运维部提出需求,研发部立项开发,并联合研发部进

行测试验收,验收通过由研发部开发。如果不具备开发条件,可以向行政部申请采购。 第二类工具由运维部组织技术专家,进行专题研究,编写脚本程序,形成操作规范或解决方案。 6 运维工具使用情况说明 每年需要说明运维工具在项目中的使用情况,包括用于哪个项目、工作情况等,应该有数字方面的描述,以及工具存在的不足,以及待改进项,用以运维部改进完善运维工具。 7 运维工具的评审 每年由运维部组织专家组进行运维服务工具使用效果评估,推荐新运维工具,淘汰落后运维工具。 8 运维工具的改善 运维部将根据运维工具评估结果,提出运维工具替代建议,交副总经理审批后,由运维部改进,或者交行政部申请采购。 9 衡量指标 运维部每半年对运维工具对业务覆盖率进行跟踪,依据运维工具的实际使用情况,统计事件解决率、问题解决率等指标1。

中国移动运维支撑子系统操作手册

技术文件技术文件名称:EOMS运维支撑子系统操作手册技术文件编号: 版本:V2.0 文件质量等级:A级 共 35 页 (包括封面) 拟制于周理 审核 会签 标准化 批准 南京中兴软创科技股份有限公司

目录

运维支撑 1运维经验库 1.1运维经验库管理 点击“运维经验库\运维经验库管理”进入运维经验库管理界面(如图1——2)。 图 1 图 2 1.1.1增加运维经验 1.在运维经验树中选择以知识库,点“增加经验”按钮(如图3)。 图 3 2.在弹出的新增专家经验对话框中,输入案例简述,选择专业,输入时限、设备型号、设备厂家等(如图4)。 图 4 3.点“确定”按钮,新增专家经验完成。 1.1.2修改运维经验 1.在运维经验列表中选中一运维经验项,右键,点“修改故障处理经验”(如图5)。 图 5 2.在弹出的修改故障处理经验对话框中,修改案例简述,专业,处理时限等(如图6)。 图 6 3.点“确定”按钮,运维经验修改完成。 1.1.3审核运维经验 1.在运维经验列表中选中一运维经验项,右键,点“审核故障处理经验”(如图7)。 图 7 2.弹出审核故障处理经验对话框(如图8)。 图 8 3.点“通过”按钮,审核通过,点“不通过”按钮,审核不通过。 1.1.4作废运维经验 1.在运维经验列表中选中一运维经验项,右键,点“作废故障处理经验”(如图9)。

图 9 2.弹出提示“你确认要作废该经验吗?”(如图10)。 图 10 3.选择“确定”则作废经验,选择“取消”则不作废。 1.2 运维经验库查询 1.点击“运维经验库\运维经验库查询”进入运维经验库查询界面(如图11——12)。 图 11 图 12 2.输入查询条件,点“查询”按钮,显示查询结果(如图13)。 图 13 2发布管理 2.1信息栏目定制 点击“发布管理\信息栏目定制”进入信息栏目定制界面(如图14——15)。 图 14 图 15 2.1.1增加信息栏目 1.在运维信息专题树中,右键,点“创建类别”;或者选中以专题项,右键,点“创建子类别”(如图16——17)。 图 16 图 17 2.输入信息栏目名称,备注,选择组织和权限(如图18)。 图 18 3.点“确定”按钮,新增信息栏目完成。 2.1.2修改信息栏目 1.在运维信息专题树中选中一信息栏目项,右键,点“修改”(如图19)。 图 19 2.修改信息栏目名称,备注,权限等(如图20)。 图 20 3.点“确定”按钮,信息栏目修改完成。

软件系统运维指导手册定稿版

软件系统运维指导手册精编W O R D版 IBM system office room 【A0816H-A0912AAAHH-GX8Q8-

系统日常维护 指导手册 目录 1、目的 (4) 2、适用范围 (4) 3、服务器及数据库概述 (4) 3.1 服务器概述 (4) 3.2 数据库概述 (4) 4、系统服务程序的详细说明 (5) 4.1系统服务程序的构成 (5) 4.2 系统服务程序的启动、关闭及维护管理 (5) 4.2.1 dhcp主服务 (5) 4.2.1.1 dhcp主服务说明 (5)

4.2.1.2 dhcp启动、关闭及进程查看方法 (5) 4.2.1.3 配置说明 (6) 4.2.2 dhcp从服务 (6) 4.2.2.1 dhcp从服务说明 (6) 4.2.2.2 dhcp启动、关闭及进程查看方法 (6) 4.2.2.3 配置说明 (7) 4.2.3 web管理模块 (7) 4.2.3.1 web管理模块中主要目录说明 (7) 4.2.5.2 web管理模块中各程序说明 (8) 4.2.5.3 web站点启动、关闭及进程查看方法 (8) 4.2.5.4 web日志说明 (8) 4.2.5.5 日常维护 (8) 5、服务器硬件维护(略) (9) 6、linux系统的日常维护 (9)

6.1 定期检查磁盘空间 (9) 6.2 使用top工具监视cpu及内存的使用率 (10) 6.3 定期查看root邮件 (10) 6.4 定期查看系统日志 (11) 7、备份策略 (11) 7.1 备份方式 (11) 7.2 备份计划 (11) 7.3 常见故障恢复 (11) 7.3.1 实例故障 (12) 7.3.2 介质故障 (12) 9、数据库的日常维护 (14) 9.1 检查数据库的基本状况 (14) 9.1.1 检查oracle的进程 (14) 9.1.2 检查oracle监听进程 (15)

运维操作手册

M PAY运维手册 目录 Mpay运维手册 (1) 一、登录方式说明 (2) 1.1VPN登录说明 (2) 1.2远程桌面登录说明 (5) 1.3主机登录说明 (6) 二、主机操作说明 (6) 1.1交易主机操作说明 (6) 2.2数据库主机操作说明 (11) 2.3文件系统主机操作说明 (11) 三、日志备份操作说明 (12)

一、登录方式说明 1.1VPN登录说明 以下是XP建立拨号VPN的说明 右键单击网上邻居点击属性,点击新建连接会出现如下图所示

完成后,双击桌面图标,弹出登录框输入账号密码,点击连接。 如果连接不上报789错误,则需要修改一下注册表。打开“运行”输入“regedit”来打开“注册表”。 打开“注册表”找到以下这个表项: “HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Service\RasMan\Parameters”,在右边新填一个“DOWN值”。 将这个“DOWN值”改名成“ProhibitIpSec”。

将其值修改成“1”重启计算机后重新进行拨号。 修改完注册表重新连接VPN即可。win7系统不需要修改注册表。 1.2远程桌面登录说明 当连接VPN成功后,点击本地的开始——程序——附件——远程桌面。出现远程桌面登陆框如下图: 输入ip地址:192.168.21.3后,点击连接按钮。连接远程主机后使用以分配好的用户密码进行登陆。

1.3主机登录说明 登陆录生产主机我们一般使用的工具是SSH Secure Shell Client,在每个人的桌面上 都有快捷方式。双击该图标会弹出登录提示框。 生产主机不能以root身份直接登陆,目前操作人员都是以oracle用户先登陆,需要root 身份时使用su –切换身份。 二、主机操作说明 1.1交易主机操作说明 目前生产上交易主机有两台,ip地址分别是192.168.21.1(主)、192.168.21.2(备)。两台交易主机部署的服务完全相同,但运行的服务不同。 交易相关的服务都部署在/home/oracle/目录下,java服务部署在 /usr/local/approot/目录下。 服务运行情况如下:

运维服务工具应用情况说明

运维服务工具应用情况说明编制: 审核: ****公司 二〇一四年一月

版权所有:****公司。保留所有权利。

目录 序言 (4) 一、运维管理类工具的应用情况 (4) 1.1 400客服故障业务受理系统 (4) 1.1.1系统业务介绍 (4) 1.1.2系统功能及原理 (5) 1.2 知识库管理工具 (6) 1.2.1系统业务介绍 (6) 1.2.2系统功能介绍 (7) 二、监控、系统维护类工具的应用情况 (8) 2.1指挥调度系统监控平台 (8) 2.2硬件系统监控工具 (9) 2.3程控交换机维护工具 (9) 三、其他运维及故障检测工具 (10) 3.1示波器 (10)

序言 ****公司产品广泛应用于****单位的指挥中心,提供特服电话的受理及后期处理平台,由于行业的特殊性,系统的稳定性、安全性及持续运行能力尤其重要,而且随着业务发展,特服电话受理系统的涉及范围越来越官方,对信息化的依赖程度越来越高,对系统的稳定性、维护能力也提出了更高的要求。 正是在这种情况之下,特服电话指挥调度系统的运行维护管理引起了公司的关注,同时也认识到一个好的运维系统需要好的运维工具支持,公司先后组建了运维工具开发团队及系统产品监控、维护工具开发团队,针对客户管理、系统故障受理系统、系统监控及系统维护等软硬件平台进行部署及开发,先对目前运维服务工具的应用情况进行说明。 一、运维管理类工具的应用情况 运维、管理类工具目前公司主要是利用400客服故障业务受理系统完成。 1.1400客服故障业务受理系统 1.1.1系统业务介绍 “400客服故障业务受理系统”主要完成公司负责承建的各类系统在运行过程中出现的故障申报的电话业务受理系统,该系统通过硬件及软件实现对客户电话的受理、处理、反馈、跟踪功能,并为客户提供7×24小时不间断服务,系统主要组成包括以下部分: 1)故障业务电话排队接入受理系统 2)后台业务流转通信平台

相关文档
最新文档