计算存储管理部分工作要求
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 岗位与任务
计算存储类基础设施日常运维管理工作主要由计算存储类管理岗人员承担,具体岗位有: X86服务器管理岗及存储管理岗。主要负责管理数据中心内的服务器、虚拟化资源池、数据存储及其网络、安装在上述设备上的操作系统和管理系统,主要完成以下工作:
(一)负责建立和维护计算存储类基础设施配置信息库,负责制定计算存储类基础设施日常运维管理流程。
(二)落实计算存储类基础设施日常监控工作,包括硬件状态监控、系统状态监控、性能指标监控等。
(三)开展计算存储类基础设施健康检查工作,包括检查硬件设备状况、检查资源配置情况、检查系统运行情况等。
(四)执行计算存储类基础设施例行维护工作,包括定期备份系统数据、定期核对配置信息、定期维护硬件设备等。
(五)做好计算存储类基础设施故障处理工作,包括排查故障隐患、处理硬件故障、处理软件故障等。
(六)定期开展计算存储类基础设施运行情况分析,编制运行报告,提出资源配置需求及系统优化建议等。
(七)负责做好日常监控记录、故障处理记录、例行维护报告、健康检查报告等文档管理工作。
(八)按照要求,参与完成相关系统运维的配合、支持和保障工作。
2 范围与定义
计算存储类基础设施主要是指税务系统内支撑应用系统运行的X86服务器、存储等物理设备、虚拟化平台、SAN 网络(存储局域网)和集群网络等。
X86 服务器主要是指税务系统内配置的采用X86 CPU架构的服务器设备,典型设备有INTEL系列服务器和AMD系列服务器。
存储主要是指税务系统内配置的大容量、高可靠、高处理能力的保存大量数据的磁盘阵列(SAN存储、NAS等)等。
SAN交换机是指税务系统内配置的连接主机和存储设备、形成高速通道的SAN网络交换设备。
虚拟化平台主要是指服务器虚拟化,税务系统主要使用的虚拟化产品有:VMware、Citrix、PowerVM、Hyper-V、华三等。
备份是指部署在计算存储设备上的操作系统或管理配置系统的备份工作。
其他计算存储类设备的日常运维管理可以参照上述相似设备执行。
3 配置管理
3.1 工作目标
计算存储资源配置管理工作的目标是通过梳理数据中心计算存储类配置项,建立统一的配置数据库,对所管理的
计算存储资源有一个更清晰的了解和掌握,能够更好地规范,控制和管理相关资产,并向其他运维工作提供信息和支持,确保数据中心计算存储资源运维工作能够更有效,并使整个计算存储基础架构更稳定。
3.2 工作内容
3.2.1 X86服务器及虚拟资源池配置信息登记
X86服务器的配置信息主要包括以下信息表:《X86服务器基本信息表》、《虚拟机配置信息表》、《X86操作系统用户信息表》、《虚拟化资源池配置信息表》。
《X86服务器基本信息表》包括以下项目:配置项编号,服务器名称,序列号,品牌型号,CPU,内存,硬盘,操作系统,机房编号,机柜位置,起始U位,结束U位,虚拟化资源池,业务系统,IP地址,网卡数量,HBA卡数量,存储空间,维保信息,安装日期等。各属性描述见下表。
《虚拟机配置信息表》包括以下项目:配置项编号,虚拟机名称,资源池,CPU,内存,硬盘,操作系统,业务系统,IP地址等。具体描述见下表。
《X86操作系统用户信息表》包括以下项目:用户所属服务器的名称、用户名、用户描述、责任人等。具体描述见下表。
《虚拟化资源池配置信息表》包括以下项目:配置项编号,资源池名称,机器数量,虚拟化产品,HA,存储空间。具体描述见下表。
3.2.3存储配置信息登记
存储的相关配置信息主要包括以下信息表:《磁盘阵列
基本信息表》、《NAS设备基本信息表》、《SAN交换机基本信息表》。
《磁盘阵列基本信息表》包括以下项目:配置项编号、磁盘阵列名称、序列号、品牌类型、管理地址、容量、机房编号、机柜位置、维保信息、安装日期等。具体描述见下表。
《NAS设备基本信息表》包括以下项目:配置项编号、NAS名称、序列号、品牌类型、管理地址、服务地址、容量、机柜编号、机柜位置、维保信息、安装日期。具体描述见下表。
《SAN交换机基本信息表》包括以下项目:配置项编号、SAN交换机名称、序列号、品牌类型、管理地址、端口数量、速率、存储信息、机柜编号、机柜位置、维保信息、安装日期。具体描述见下表。
3.2.
4.配置信息更新
在计算存储资源的日常运维管理中,如上述配置信息项发生了变化,必须在变更操作完成后,将变更信息及时更新到相应配置信息库中。涉及重大信息变更的,应制定变更计划、操作流程和回退方案,并在事前审批后进行实施,实施验证后,完成相应配置信息的更新。
4运行监控
4.1工作目标
建立并不断完善计算存储资源的运行监控制度,明确各类监控的参与人员、监控频率、监控对象等内容,保障计算存储资源正常运行。探索运用自动化、可视化的管理监控工具,实现设备故障的智能定位和辅助维护,提升管理和监控效率。
4.2工作内容
4.2.2 X86服务器及虚拟化资源池运行监控
4.2.2.1每日监控
监控内容:
1、服务器运行状况。主要指通过观察服务器硬件指示灯等方式获取硬件运行状态。
2、虚拟化平台运行状况。主要包括虚拟化软件的运行状态和虚拟化管理平台的运行状态等信息。
3、网络和存储连通状况。主要包括服务器与接入交换
机之间网络连通状态和服务器与存储间的连通状态等信息。
监控频率:采用自动方式监控的,每小时一次;采用人工方式监控的,每工作日一次。
X86服务器管理岗人员做好监控日志,并对监控发现的异常信息进行详细记录。
4.2.2.2每周巡检
监控内容:
1、虚拟化平台的高可用状态。主要指配置了高可用的虚拟化资源池中高可用的状态信息。
2、虚拟化平台的多路径状态。主要指虚拟化资源池中服务器与存储之间多路径运行状态等信息。
3、虚拟化资源池的资源使用率。主要包括虚拟化资源池中CPU使用率、内存使用率、存储空间使用率等信息。
监控频率:采用自动方式监控的,每天一次;采用人工方式监控的,每周一次。
X86服务器管理岗人员做好监控日志,并对监控发现的异常信息进行详细记录。
4.2.2.3每月监控
监控内容:
1、本月内更换部件的设备。主要对本月内因故障更换部件的设备进行重点查看,监控其运行状态及运行稳定性。
2、各文件系统inode节点使用率。