运维管理程序
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
运维管理程序
文件编码AQ2I-02版本V03
文件层级□一阶■二阶
□三阶
文件类别
■体系文件
□技术文件
编制部门运维部机密等级■内文□秘密□机密□绝密
编制人文件类别■通用□项目
审核编制日期
审批生效日期
总页数8 分发编号01 文件发布盖章
文件制/修订记录
页码章节制/修订记录
版本
修订人修订日期备注修订前修订后
全部全部首次制定无V01 3 4,5 职责/作业内容V01 V02 3 4,5 职责/作业内容V02 V03
1.目的
规范运维管理流程,以保证服务平台安全、稳定、高效运行。
2.适用范围
适用于T服务平台运维以及客户服务系统运维。
3 术语和定义
运维:提供针对各业务系统的部署配置更新、运行状况监控、问题定位、故障排除等方面的运维服务。
4 职责
4.1 商务拓展经理:
日常应用第三方客户服务系统,并在出现故障或需要维护时配合运维工程师处理故障或维护系统。
4.2平台软件开发工程师/APP软件开发工程师:
提交测试环境和正式环境的项目部署需求,以及程序包和数据包交予运维工程师更新至正式平台,并提出监控需求交予运维工程师配置监控。同时在故障处理时,需相关人员及时跟进。
4.3 轻应用产品项目经理:
对正式平台业务更新的内容进行确认,并跟进故障处理。
4.3 运营经理:
提交最新版手机端APK安装包,交予运维工程师更新至正式平台。并且及时与运维工程师沟通平台变更对用户的影响,以及运营行为对平台的影响。
4.4 测试工程师:
对将提交至线上的程序包和数据包在测试环境进行测试。
4.5 公司各部门:IT规划,管理,监督;IT网络支持;办公软件管理;IT支持;日常IT运维;OA系统,Project,SVN等信息系统运维。
4.6 运维工程师:
负责测试平台和正式平台的服务部署、更新以及故障处理,负责客户服务部运维工作,以及服务器巡检与维护。
负责平台数据库的内容更新、备份、维护,以及故障处理。
负责服务平台网络的安全与维护,以及服务监控。
5 作业内容
5.1 运维服务平台类型
运维工程师对T研发中心所涉及的平台提供运维服务,具体包括:正式平台、线上演示平台、测试平台、客户服务系统平台,各平台提供清单:【ChinaTSP服务器列表】【数据库信息汇总】【服务器列表_测试平台】【设备列表_客服平台】。
5.2 运维服务内容
5.2.1 服务架构设计及平台部署(正式平台、线上演示平台和测试平台)
5.2.1.1根据平台软件开发工程师通过JIRA事务追踪系统提交的项目部署需求工单,运维经理审核通过后,安排运维工程师/数据库管理员/网络工程师设计服务架构并分配资源。
5.2.1.2部署平台操作:
由运维工程师/数据库管理员/网络工程师实施部署和配置平台各服务,并回复于相应的项目部署需求工单。
5.2.2监控及资源安全
5.2.2.1监控
监控职责:及时发现服务器故障和业务故障,并根据《运维应急故障处理方案》文件及时告知相关人员,以便及时正确地处理故障,保障运维KPI的实现。
监控平台:除测试平台外的所有平台。
监控负责人:网络工程师/运维工程师。
监控内容:a)平台软件开发工程师通过JIRA提出的服务监控需求工单;b)运维系统可用性要求,如应用服务端口、数据库服务端口、CPU/内存/硬盘等资源;c)网络设备;d)客户服务系统相关设备。
监控相关表单:a)【运维监控信息汇总表】;b)【运维监控记录表】;c)【手机APP、TSP系统运行监控日报】。
5.2.2.2资源安全
为防止配置丢失和便于新平台部署,运维工程师各成员适时备份各配置文件和自定义脚本(应用配置、数据库配置、网络配置、监控配置等)于SVN中的备份目录。
5.2.3数据库管理
根据《数据安全管理制度》和《数据存储及备份管理规定》,数据库采用:
a)主从灾备机制;
b)对数据库权限进行限制;
c)定期备份数据并进行恢复性测试,并记录于【数据恢复性测试记录单】;
d)对正式平台数据进行脱敏后交予测试平台处理,并记录于【数据脱敏记录单】;
e)对数据操作严格按照相应要求进行,以保障数据安全性和可靠性。
5.2.4 权限控制
运维工程师、网络工程师、数据库管理员分别对系统、网络、数据库进行权限控制。申请人提出权限控制申请时下载并填写【运维工程师权限控制申请表】,表单经过运维工程师经理审批签字后,由运维工程师相应岗位人员执行权限分配,并填写【运维工程师权限控制记录表】表单进行确认备案,以保证运维工作的安全性。
5.2.5 应急故障处理
由运维工程师各岗位人员提供相应的7*24值守,当正式环境的服务器硬件及软件服务系统出现故障时,及时根据《运维应急故障处理方案》进行故障处理和反馈。
5.2.6 正式平台业务更新
5.2.
6.1正式平台业务更新时间限制:
为保障业务系统安全以及故障处理的及时性,以下时间不执行系统变更处理:
a) 国家法定节假日(少于7天)前1周不执行系统变更处理;
b) 国家法定节假日(多于或等于7天)前2周不执行系统变更处理;
c) 工作日(不含周五)下午16时后不执行系统变更处理;
d) 工作日(周五)下午不执行系统变更处理。
紧急变更及故障处理可例外,但需经过研发中心分管副总审批同意方可执行。
5.2.
6.2正式平台业务更新的JIRA流程图: