运维管理程序

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

运维管理程序

文件编码AQ2I-02版本V03

文件层级□一阶■二阶

□三阶

文件类别

■体系文件

□技术文件

编制部门运维部机密等级■内文□秘密□机密□绝密

编制人文件类别■通用□项目

审核编制日期

审批生效日期

总页数8 分发编号01 文件发布盖章

文件制/修订记录

页码章节制/修订记录

版本

修订人修订日期备注修订前修订后

全部全部首次制定无V01 3 4,5 职责/作业内容V01 V02 3 4,5 职责/作业内容V02 V03

1.目的

规范运维管理流程,以保证服务平台安全、稳定、高效运行。

2.适用范围

适用于T服务平台运维以及客户服务系统运维。

3 术语和定义

运维:提供针对各业务系统的部署配置更新、运行状况监控、问题定位、故障排除等方面的运维服务。

4 职责

4.1 商务拓展经理:

日常应用第三方客户服务系统,并在出现故障或需要维护时配合运维工程师处理故障或维护系统。

4.2平台软件开发工程师/APP软件开发工程师:

提交测试环境和正式环境的项目部署需求,以及程序包和数据包交予运维工程师更新至正式平台,并提出监控需求交予运维工程师配置监控。同时在故障处理时,需相关人员及时跟进。

4.3 轻应用产品项目经理:

对正式平台业务更新的内容进行确认,并跟进故障处理。

4.3 运营经理:

提交最新版手机端APK安装包,交予运维工程师更新至正式平台。并且及时与运维工程师沟通平台变更对用户的影响,以及运营行为对平台的影响。

4.4 测试工程师:

对将提交至线上的程序包和数据包在测试环境进行测试。

4.5 公司各部门:IT规划,管理,监督;IT网络支持;办公软件管理;IT支持;日常IT运维;OA系统,Project,SVN等信息系统运维。

4.6 运维工程师:

负责测试平台和正式平台的服务部署、更新以及故障处理,负责客户服务部运维工作,以及服务器巡检与维护。

负责平台数据库的内容更新、备份、维护,以及故障处理。

负责服务平台网络的安全与维护,以及服务监控。

5 作业内容

5.1 运维服务平台类型

运维工程师对T研发中心所涉及的平台提供运维服务,具体包括:正式平台、线上演示平台、测试平台、客户服务系统平台,各平台提供清单:【ChinaTSP服务器列表】【数据库信息汇总】【服务器列表_测试平台】【设备列表_客服平台】。

5.2 运维服务内容

5.2.1 服务架构设计及平台部署(正式平台、线上演示平台和测试平台)

5.2.1.1根据平台软件开发工程师通过JIRA事务追踪系统提交的项目部署需求工单,运维经理审核通过后,安排运维工程师/数据库管理员/网络工程师设计服务架构并分配资源。

5.2.1.2部署平台操作:

由运维工程师/数据库管理员/网络工程师实施部署和配置平台各服务,并回复于相应的项目部署需求工单。

5.2.2监控及资源安全

5.2.2.1监控

监控职责:及时发现服务器故障和业务故障,并根据《运维应急故障处理方案》文件及时告知相关人员,以便及时正确地处理故障,保障运维KPI的实现。

监控平台:除测试平台外的所有平台。

监控负责人:网络工程师/运维工程师。

监控内容:a)平台软件开发工程师通过JIRA提出的服务监控需求工单;b)运维系统可用性要求,如应用服务端口、数据库服务端口、CPU/内存/硬盘等资源;c)网络设备;d)客户服务系统相关设备。

监控相关表单:a)【运维监控信息汇总表】;b)【运维监控记录表】;c)【手机APP、TSP系统运行监控日报】。

5.2.2.2资源安全

为防止配置丢失和便于新平台部署,运维工程师各成员适时备份各配置文件和自定义脚本(应用配置、数据库配置、网络配置、监控配置等)于SVN中的备份目录。

5.2.3数据库管理

根据《数据安全管理制度》和《数据存储及备份管理规定》,数据库采用:

a)主从灾备机制;

b)对数据库权限进行限制;

c)定期备份数据并进行恢复性测试,并记录于【数据恢复性测试记录单】;

d)对正式平台数据进行脱敏后交予测试平台处理,并记录于【数据脱敏记录单】;

e)对数据操作严格按照相应要求进行,以保障数据安全性和可靠性。

5.2.4 权限控制

运维工程师、网络工程师、数据库管理员分别对系统、网络、数据库进行权限控制。申请人提出权限控制申请时下载并填写【运维工程师权限控制申请表】,表单经过运维工程师经理审批签字后,由运维工程师相应岗位人员执行权限分配,并填写【运维工程师权限控制记录表】表单进行确认备案,以保证运维工作的安全性。

5.2.5 应急故障处理

由运维工程师各岗位人员提供相应的7*24值守,当正式环境的服务器硬件及软件服务系统出现故障时,及时根据《运维应急故障处理方案》进行故障处理和反馈。

5.2.6 正式平台业务更新

5.2.

6.1正式平台业务更新时间限制:

为保障业务系统安全以及故障处理的及时性,以下时间不执行系统变更处理:

a) 国家法定节假日(少于7天)前1周不执行系统变更处理;

b) 国家法定节假日(多于或等于7天)前2周不执行系统变更处理;

c) 工作日(不含周五)下午16时后不执行系统变更处理;

d) 工作日(周五)下午不执行系统变更处理。

紧急变更及故障处理可例外,但需经过研发中心分管副总审批同意方可执行。

5.2.

6.2正式平台业务更新的JIRA流程图:

相关文档
最新文档