(完整版)小型机存储系统巡检报告
存储巡检报告模板
存储巡检报告模板
1. 前言
存储是一个企业非常重要的基础设施,存储设备的正常运行对于保障企业运营
至关重要。
因此,存储巡检是企业运营中的一项非常重要的工作。
本文旨在提供一份存储巡检报告模板,以便各位存储巡检人员在工作中更好地开展巡检工作。
2. 存储巡检报告模板
2.1 工作概述
本次巡检主要对企业存储设备进行检查。
巡检员通过对存储设备的性能、状态、数据完整性等方面进行检查,以判断设备是否正常运行,是否需要维护,同时也检查是否存在安全隐患,如权限管理不当、数据备份不及时等问题。
2.2 巡检时间
本次巡检时间为:(填写具体时间)。
2.3 巡检内容
本次巡检主要内容为:(填写具体巡检项目)。
2.4 巡检结果
本次巡检发现如下问题:
1.存储设备性能评估:
(填写具体评估结果)
2.存储设备状态:
(填写具体状态信息)
3.数据完整性检查:
(填写具体检查结果)
4.安全隐患:
(填写具体发现的安全隐患)
2.5 巡检结论
依据本次巡检结果,存储设备的性能、状态、数据完整性等方面均处于正常状态。
同时,本次巡检也指出了存在的安全隐患,建议相关负责人员尽快处理。
本结论仅限于本次巡检范围内。
3. 总结
通过本次存储巡检,可以看出存储设备正常运行并保持稳定状态。
存储负责人员应加强安全管理,提高数据备份的频率和完整性,保障存储数据的安全,同时应定期对存储设备进行巡检和维护,以确保存储设备的正常运行。
巡检报告(电子版)
巡检报告(电子版)巡检报告(电子版)IBMp系列小型机巡检报告客户名:客户号:巡检时间:客户代表签字:IBM工程师签字:P系列系统预防性维护服务报告单(硬件部分)客户名称:_____________________________机器型号:______序列号:______________检查时间:_____年____月____日____时本年度第______次检查1.机房环境:8.SAN交换机是否正常:□正常□不正常电源电压_____□符合要求□不符合9.通信:零地电压_____□符合要求□不符合网卡状态、IP地址□正常□不正常温度、湿度□符合要求□不符合网卡通信□正常□不正常2.检查系统硬件情况:10.磁盘阵列RAID盘的状态:设备故障灯是否有亮□有□无IBM存储型号______________有其他异常情况□有□无□Good□Degraded□Failed3.硬件错误报告(ErrorLog):□Cache打开□Cache关闭有否硬件故障□有□无□有热备盘□无热备盘mail中有否硬件错误□有□无数据保护方式______________bootlog/consolelog:□正常□不正常是否硬件告警□有□无ServiceProcesslog□正常□不正常11.系统硬件诊断:系统板、CPU、内存□正常□不正常4.机器清洁:I/O 板、扩展卡□正常□不正常根据需要清洁机器□已清洁□不需要硬盘、磁盘阵列□正常□不正常过滤网是否需要更换□需更换□不需要磁带机、磁带库□正常□不正常12.SA是否设置调通□是□否5.逻辑卷/硬盘检查:SA平时是否连接□是□否是否有stale的逻辑卷□有□无13.微码(Microcode)是否满足稳定运行需要6.磁带机是否需要清洗:□需要□不需□是□否7.CPU有否被disable□有□无CPUGUARD设置:□正确□不正确14.运行”snap-r;snapgfkbLc”,取回存档.□主机及主要设备的微码版本:本次预防性维护发现的问题:已经解决的问题及下一不工作计划:客户意见及建议:□非常满意□满意□一般□不满意□非常不满意客户签字:____________年___月___日工程师签字:____________年___月___日IBM全球服务(中国)有限公司技术支持服务部P系列系统预防性维护服务报告单(软件部分)客户名称:_____________________________机器型号:______序列号:______________检查时间:_____年____月____日____时本年度第______次检查1.系统错误报告:6.通信是否系统软件故障:□有□无路由表设置:□正常□不正常mail中有否软件错误:□有□无域名设置:□正常□不正常其他LOG文件:□正常□不正常7.数据是否已作保护2.文件系统:□所有数据□部分数据□没有保护使用率是否正常:□是□否数据保护方式:□RAID-1□RAID-5JFSLOG设置:□正常□不正常□RAID-10□LV镜像□逻辑卷0+13.内存交换区:使用率是否超过70%:□是□否8.系统DUMP设置:□正常□不正常交换逻辑卷设置:□正常□不正常9.用户登录记录检查:□正常□不正常10.HACMP测试:4.系统性能:ClusterVerification:□正常□不正常是否性能瓶颈:□有□无相关参数设置检查:□正常□不正常5.数据备份:接管测试:□正常□不正常系统备份是否符合要求:□是□否最近一次系统备份时间:___________11.补丁程序(PTF):数据备份是否符合要求:□是□否满足稳定运行需要:□是□否备份介质是否保存妥善:□是□否12.运行”snapr;snapgfkbLc”,取回存档操作系统及重要软件的补丁版本:本次预防性维护发现的问题:已经解决的问题及下一步工作计划:客户意见及建议:□非常满意□满意□一般□不满意□非常不满意客户签字:____________年___月___日工程师签字:____________年___月___日IBM全球服务(中国)有限公司技术支持服务部扩展阅读:巡检报告空压机巡检报告报告编号:EXJ-201*-空压机型号:整机编号:服务商公司名称:用户名称:用户联络人:部门:联系电话:传真电话:空压站运行情况描述1.空压机运行时数:小时,压力设置范围:bar。
存储设备巡检报告
存储设备巡检报告
客户名称:湖北省疾控中心巡检时间:
设备型号
数量
DELL存储
DELL PS4000
1台
检测结果
1
双控制器同时正常工作
□正常□不正常
2
电池、电源和风扇模块
□正常□不正常
3
物理硬盘和逻辑盘
□正常□不正常
4
外置磁带库
□正常□不正常
5
其他硬件
参考命令:sysconfig-a,sysconfig –r
系统无故障磁盘、热备盘正常工作
9
网络端口工作情况
参考命令:ifconfig –a, ifstat –a, vif status
设备各端口工作正常
10
存储设备联通性、丢包、延时ping -t
网络连通性良好,无丢包、延时平均小于5ms
11
集群状态
□正常□不正常
5
硬件设备状况
参考命令:sysconfig –v, sysconfig –a, hostname
硬件状况良好、CPU、内存、磁盘利用正常
6
环境检查
参考命令:environment status
系统运行环境良好
7
日志文件检查
参考命令:rdfile /etc/messages
8
系统故障磁盘、热备盘
参考命令:Cf status,cf monitor
无集群、netapp存储单控工作,一控制器损坏
12
磁盘空间使用情况
参考命令:vol status –v, df–h
磁盘正常在线,空间使用率低于80%
13
LUN状态
参考命令:Lun show, lun show -m
存储设备巡检报告
系统无故障磁盘、热备盘正常工作
9
网络端口工作情况
参考命令:ifconfig –a, ifstat –a, vif status
设备各端口工作正常
10
存储设备联通性、丢包、延时ping -t
网络连通性良好,无丢包、延时平均小于5ms
11
集群状态
存储设备巡检报告
存储设备巡检报告
客户名称:湖北省疾控中心巡检时间:
设备型号
数量
DELL存储
DELL PS4000
1台
NetApp存储
NetApp 3040
1台
检测结果
1
双控制器同时正常工作
□正常□不正常
2
电池、电源和风扇模块
□正常□不正常
3
物理硬盘和逻辑盘
□正常□不正常
4
外置磁带库
□正常□不正常
5
其他硬件
参考命令:Cf status,cf monitor
无集群、netapp存储单控工作,一控制器损坏
12
磁盘空间使用情况
参考命令:vol status –v, df–h
磁盘正常在线,空间使用率低于80%
13
LUN状态
参考命令:Lun show, lun show -m
LUN状态正常
14
内存利用率、RAID状态信息
内存利用率、RAID信息正常
□正常□不正常
5
硬件设备状况
参考命令:sysconfig –v, sysconfig –a, hostname
硬件状况良好、CPU、内存、磁盘利用正常
6ห้องสมุดไป่ตู้
存储设备巡检报告
存储设备巡检报告
客户名称:湖北省疾控中心巡检时间:
设备型号
数量
DELL存储
DELL PS4000
1台
NetApp存储
NetApp 3040
1台
检测结果
1
双控制器同时正常工作
□正常□不正常
2
电池、电源和风扇模块
□正常□不正常
3
物理硬盘和逻辑盘
□正常□不正常
4
外置磁带库
□正常□不正常
5
其他硬件
参考命令:Cf status,cf monitor
无集群、netapp存储单控工作,一控制器损坏
12
磁盘空间使用情况
参考命令:vol status –v, df–h
磁盘正常在线,空间使用率低于80%
13
LUN状态
参考命令:Lun show, lun show -m
LUN状态正常
14
内存利用率、RAID状态信息
参考命令:sysconfig-a,sysconfig –r
系统无故障磁盘、热备盘正常工作
9
网络端口工作情况
参考命令:ifconfig –a, ifstat –a, vif status
设备各端口工作正常
10
存储设备联通性、丢包、延时ping -t
网络连通性良好,无丢包、延时平均小于5ms
11
集群状态
□正常□不正常
5
硬件设备状况
参考命令:sysconfig –v, sysconfig –a, hostname
硬件状况良好、CPU、内存、磁盘利用正常
6
环境检查
参考命令:environment status
数据存储设备巡检报告
数据存储设备巡检报告
概述
本次巡检是对公司数据存储设备的一次检查,主要目的是确保设备的正常运行,以及防止数据损失发生。
本次巡检的设备包括服务器、硬盘、网络存储等。
巡检内容
1. 服务器
- 检查硬件是否运行正常,包括电源,风扇等
- 检查操作系统是否正常运行并更新到最新版本
- 检查应用程序是否在运行和正常工作中
2. 硬盘
- 检查硬盘是否有损坏或故障
- 检查文件系统是否正常
- 检查磁盘空间是否充足
3. 网络存储
- 检查网络存储设备是否能够正常连接
- 检查文件共享是否正常工作
巡检结果
1. 服务器:
- 所有服务器运行正常,未发现故障。
- 操作系统已更新到最新版本。
- 应用程序正常工作。
2. 硬盘:
- 所有硬盘表现良好。
- 所有文件系统正常。
- 磁盘空间充足。
3. 网络存储:
- 所有网络存储设备能够正常连接。
- 文件共享正常工作。
结论
本次巡检结果表明,所有数据存储设备运行正常,未发现异常。
同时,对于运行操作系统和应用程序的服务器,已全部更新到最新
版本。
在进行数据存储和共享时,公司可以继续信赖这些设备。
存储设备巡检报告精编WORD版
系统无故障磁盘、热备盘正常工作
9
网络端口工作情况
参考命令:ifconfig –a, ifstat –a, vif status
设备各端口工作正常
10
存储设备联通性、丢包、延时ping -t
网络连通性良好,无丢包、延时平均小于5ms
11
集群状态
5
其他硬件
□正常□不正常
5
硬件设备状况
参考命令:sysconfig –v, sysconfig –a, hostname
硬件状况良好、CPU、内存、磁盘利用正常
6
环境检查
参考命令:environment status
系统运行环境良好
7
日志文件检查
参考命令:rdfile /etc/messages
8
系统故障磁盘、热备盘
参考命令:Cf status,cf monitor
无集群、netapp存储单控工作,一控制器损坏
12
磁盘空间使用情况
参考命令:vol status –v, df–h
磁盘正常在线,空间使用率低于80%
13
LUNபைடு நூலகம்态
参考命令:Lun show, lun show -m
LUN 状态正常
14
内存利用率、RAID状态信息
存储设备巡检报告精编WORD版
存储设备巡检报告
客户名称:湖北省疾控中心巡检时间:
设备型号
数量
DELL存储
DELL PS4000
1台
NetApp存储
NetApp 3040
1台
检测结果
1
双控制器同时正常工作
存储设备巡检报告
存储设备巡检报告一、巡检目的和范围本次巡检的目的是为了确保存储设备的正常运行并提前发现潜在的问题,以保障数据的安全性和稳定性。
巡检的范围包括存储设备的硬件设施、网络环境、软件系统和数据备份等方面。
二、巡检内容和步骤1.硬件设施巡检:检查存储设备的硬件设施,包括服务器、存储阵列、磁盘驱动器等是否正常运行,是否有异常噪音或发热等现象。
检查存储设备的供电和冷却系统是否正常,电源线和散热风扇是否有松动或堵塞。
检查存储设备的机箱和设备拓扑结构是否整齐、清洁。
2.网络环境巡检:检查存储设备的网络连接是否稳定,网络线缆是否连接良好。
检查存储设备的网络传输速度是否正常,网络延迟是否过高。
检查网络交换机或路由器的配置是否正确,防火墙是否正常工作。
3.软件系统巡检:检查存储设备的操作系统和存储管理软件是否正常运行,并及时对系统和软件进行升级和补丁打补。
检查存储设备的文件系统是否有异常或损坏的情况。
检查存储设备的磁盘阵列配置是否合理,磁盘是否有坏道或故障。
4.数据备份巡检:检查存储设备的数据备份是否顺利进行,备份数据是否完整和可恢复。
检查备份设备的状态和容量是否满足需求,是否有足够的空间进行备份。
三、巡检结果和问题处理1.硬件设施巡检结果:经过巡检,存储设备的硬件设施运行正常,无异常噪音和发热现象。
存储设备的供电和冷却系统正常,未发现电源线和散热风扇的松动或堵塞现象。
存储设备的机箱和设备拓扑结构整齐,没有明显的灰尘和污垢。
2.网络环境巡检结果:存储设备的网络连接稳定,网络线缆连接良好。
存储设备的网络传输速度正常,网络延迟在可接受范围内。
网络交换机和路由器的配置正确,防火墙正常工作。
3.软件系统巡检结果:存储设备的操作系统和存储管理软件正常运行。
系统和软件已经升级至最新版本,补丁也已打补,以提供更好的性能和安全保障。
存储设备的文件系统无异常或损坏,磁盘阵列配置合理,磁盘无坏道和故障。
4.数据备份巡检结果:存储设备的数据备份顺利进行,备份数据完整和可恢复。
存储设备巡检报告
9
网络端口工作情况
参考命令:ifconfig –a, ifstat –a, vif status
设备各端口工作正常
10
存储设备联通性、丢包、延时ping -t
网络连通性良好,无丢包、延时平均小于5ms
11
集群状态
参考命令:Cf status,cf monitor
无集群、netapp存储单控工作,一控制器损坏
12
磁盘空间使用情况
参考命令:vol status –v, df–h
磁盘正常在线,空间使用率低于80%
13
LUN状态
参考命令:Lun show, lun show -m
LUN 状态正常
14
内存利用率、RAID状态信息
内存利用率、RAID信息正常
14
15
问题处理:
巡检工程师: 客户代表:
时间: 时间:
存储设备巡检报告
客户名称:湖北省疾控中心巡检时间:
设备型号
数量
DELLApp存储
NetApp 3040
1台
检测结果
1
双控制器同时正常工作
□正常□不正常
2
电池、电源和风扇模块
□正常□不正常
3
物理硬盘和逻辑盘
□正常□不正常
4
外置磁带库
□正常□不正常
5
其他硬件
□正常□不正常
5
硬件设备状况
参考命令:sysconfig –v, sysconfig –a, hostname
硬件状况良好、CPU、内存、磁盘利用正常
6
环境检查
参考命令:environment status
系统运行环境良好
IBM小型机巡检报告
IBM Pxxx小型机服务报告目录前言 (4)第一章系统健康档案 (4)1.1 CPU与内存 (4)1.1.1 处理器数量 (4)1.1.2 处理器物理位置 (4)1.1.3 处理器主频和类型 (4)1.1.4 内存大小 (4)1.1.5 内存类型及物理位置 (5)1.2 ADAPTER (5)1.3 硬盘 (5)1.4 光驱和磁带机等其他设备 (5)1.5 逻辑卷及文件系统配置 (6)1.5.1 rootvg (6)第二章系统软件档案 (7)2.1 操作系统版本及升级建议 (7)2.2 主机微码版本及升级建议 (7)2.3 高可用性集群软件配置情况 (7)第三章系统性能分析报告 (8)第四章问题汇总与分析报告 (9)4.1 问题记录 (9)4.2 问题分析 (9)前言该机SN号为:xxxxxxx ,作为xxx应用服务器。
第一章系统健康档案1.1 CPU与内存1.1.1 处理器数量#lsdev -Ccprocessor* 共有——颗处理器1.1.2 处理器物理位置#lscfg –vp|grep proc有两块处理器卡,proc0-proc7 在C1卡上;proc16-proc23在C4 CPU卡上1.1.3 处理器主频和类型#lsattr -El proc01.1.4 内存大小#lsdev -Ccmemory#lsattr -El L2cache0#lsattr -El mem0共32G内存1.1.5 内存类型及物理位置#lscfg –vp –l mem0有4块8192MB内存卡,具体位置如下:1.2 ADAPTER#lsdev -Ccadapter1.3 硬盘#lsdev -Ccdiskhdisk0与hdisk1是内置硬盘hdisk2-hdisk49是P670通过光通道卡fcs0、fcs1识别IBM FC2105磁盘阵列的逻辑硬盘设备号#lsvpcfg特别提醒:不要将hdsik2-hdisk49加入任何卷组(VG)中;必须用vpath0-vpath12设备号创建卷组(VG)内置硬盘大小:1.4 光驱和磁带机等其他设备#lsdev -Cctape#lscfg –vp -l rmt0#lsdev -Cccdrom.1.5 逻辑卷及文件系统配置注:每个VG一个章节,参考本文档#lspv#lsvg 系统定义的卷组#lsvg –o 系统激活的卷组#df –k 列出文件系统使用情况1.5.1 rootvg#lsvg -l rootvg#lsvg rootvg第二章系统软件档案2.1 操作系统版本及升级建议#oslevel –s当前系统版本为:目前系统运行稳定,征求客户意见后,不建议升级2.2 主机微码版本及升级建议#lsmcode当前系统微码版本为:目前系统运行稳定,征求客户意见后,不建议升级2.3 高可用性集群软件配置情况#lslpp –l|grep cluster目前该机没有运行高可用性软件注:如果安装配置了集群软件请给出详细配置信息第三章系统性能分析报告监控时间为上午8点49分至第二天下午2点49分,每分钟报告一次系统性能。
小型机巡检报告模版
备注:
20.硬件检查诊断(Diagnostic)
运行Diag系统诊断程序
系统、CPU、内存、I/O板□正常□不正常
网卡、SCSI卡、SSA卡□正常□不正常
系统其它扩展卡□正常□不正常
硬盘、磁盘阵列□正常□不正常
磁带库、磁带机□正常□不正常
其它□正常□不正常
21.运行“snap –ac”,取回/tmp/ibmsupt/snap+s/n.pax.Z文件存档
故障内容:
4.查看日志文件,如: /tmp/hacmp.out,/smit.log,/var/adm/ras/bootlog
是否有异常。□有□无
备注:
5.检查文件系统查看有否“80%”以上的文件系统。□有□无
备注:
6.查看卷组信息(lsvg –l vg_name):有否“stale”状态的逻辑卷
□有□无
22.机器清洁情况□良好□一般□已清洁
23.系统整体运行情况:
工程师签字:日期:年月日
客户签字:日期:年月日
注:1~16为A类维护(季度维护),17~19为B类维护(半年维护),20~23为C类维护(年度维护)
工程师服务记录表
本次巡检发现的问题:
已经解决的问题及方法:
处理结果:
客户满意度:1、非常满意()2、满意CMP的测试在于检查系统在出现宕机情况时业务系统能否正常地进行接管切换。由于生产环境的参数设置的改变,有可能导致生产系统和备份系统出现不一致的情况,从而导致在真正发生故障时业务系统不能接管。
HACMP snap文件存档□有□无
Cluster Veritication:□正常□不正常
16.检查机房环境
巡检服务报告(IBM小型机)v1.3
IBM小型机系统预防性维护服务报告单客户名称:机器型号序列号检查时间:20 年月日时本年度第次检查机器名1. 机房环境:电源电压□符合要求□不符合;零地电压□符合要求□不符合温度、湿度:□符合要求□不符合2. 检查系统硬件情况:设备故障灯是否有亮:3. 系统错误报告(Error Log):有否硬件故障:□有□有□无;有其他否异常情况:□有□无;启动日志:□正常□无□不正常mail中有否错误报告:□有□无;服务进程日志:□正常□不正常4. CPU有否被disable:□有□无;CPU GUARD设置:□正确□不正确5. 逻辑卷:6. 有否"stale"状态的逻辑卷:□有□无7. 关键文件系统:使用率是否正常:□是□否;JFSLOG设置:□正常□不正常8. 磁带机是否需要清洗:□需要□不需要9. SAN交换机是否正常:□正常□不正常□没有10. 通信:网卡的状态、IP地址:□正常□不正常网卡通信(ping):□正常□不正常/etc/hosts文件或DNS设置:□正常□不正常路由表设置:□正常□不正常;域名设置:□正常□不正常11. 磁盘阵列RAID盘的状态:IBM存储型号数据保护方式□Cache打开□有热备盘□Cache关闭□无热备盘12. 机器清洁:根据需要清洁机器各部件:□已清洁□不需要过滤网是否需要更换:□要更换□不需要13. 补丁程序(PTF) 系统补丁级别:最新补丁级别:微代码(Microcode) 系统微码级别:最新微码级别:网卡、控制卡、硬盘微码是否需要升级:□是□否请与客户沟通是否需要升级系统补丁和微码:□是□否14. 系统硬件诊断:系统板、CPU、内存、I/O板□正常□不正常网卡、SCSI卡、SSA卡系统其他扩展卡硬盘、磁盘阵列磁带机、磁带库□正常□正常□正常□正常□不正常□不正常□不正常□不正常15. 内存交换区:使用率是否超过70%:□是□否大小是否大于物理内存的1.5倍:□是□否16. 备份:有否有符合要求的系统备份:□有□无最近一次系统备份的时间有否符合要求的用户数据备份:□有□无备份介质是否妥善保存:□有□无17. 检查rootvg是否有做镜像:□有□无18. 系统DUMP设置是否正常:□正常□不正常19. 检查errdemon,srcmstr是否正常:□正常□不正常20. 检查系统参数是否正确:□是□否1./etc/environment文件中TZ不应有夏时制2.如有数据库系统:Aio :available3.Hacmp 系统中I/O pacing: High Water Mark/Low Water Mark:33/244.Hacmp 系统中Syncd:105.Hacmp 系统中Power Monitor子系统应关闭21. 系统性能:有否性能瓶颈:□有□无22. HACMP 测试:□是□否Cluster Verification:□正常□不正常;相关参数设置检查:□正常□不正常接管测试(根据需要):□正常□不正常23. 运行“#snap –r;snap –gfkbLc” ,取回存档。
IBM 小型机巡检服务报告
异常说明:
卷组(VG)配置,检查VG状态是否可用,逻辑卷状态是否为syncd
# lsvg –l vgname
正常
异常说明:
检查是否有磁盘镜象/Raid数据保护
# lsvg –l vgname / smitty检查Raid情况
正常
异常说明:
缓冲区信息
# lsps -a
正常
异常说明:
文件系统信息
# df -k
正常
异常说明:
系统日志检查
系统日志
#errpt
正常
异常说明:
系统邮件
#mail检查有无报错
正常
异常说明:
上次启动时间
# boot
正常
异常说明:
系统备份检查
有否合符要求的系统备份
询问系统管理员
是
否说明:
最近的一次备份时间
询问系统管理员
记录:
是否存在系统备份策略并执行
#lscfg –Cc |grepSystemFirmware
#prtconf |grep Firmware
记录:
系统版本/维护级别
# oslevel -r
记录:
/etc/environmen不能有夏时制
# echo $TZ
正常
异常说明:
AIO是否激活
# lsdev -Cc aio
正常
异常说明:
网卡状态
# ifconfig entX
正常
异常说明:
Ping网关是否丢包
# ping ip address
正常
异常说明:
/etc/hosts文件配置
# cat /etc/hosts
正常
存储设备巡检报告
硬件设备状况
参考命令:sysconfig –v, sysconfig –a, hostname
硬件状况良好、CPU、内存ironment status
系统运行环境良好
7
日志文件检查
参考命令:rdfile /etc/messages
8
系统故障磁盘、热备盘
参考命令:sysconfig-a,sysconfig –r
12
磁盘空间使用情况
参考命令:vol status –v, df–h
磁盘正常在线,空间使用率低于80%
13
LUN状态
参考命令:Lun show, lun show -m
LUN 状态正常
14
内存利用率、RAID状态信息
内存利用率、RAID信息正常
14
15
问题处理:
巡检工程师:客户代表:
时间:时间:
系统无故障磁盘、热备盘正常工作
9
网络端口工作情况
参考命令:ifconfig –a, ifstat –a, vif status
设备各端口工作正常
10
存储设备联通性、丢包、延时ping -t
网络连通性良好,无丢包、延时平均小于5ms
11
集群状态
参考命令:Cf status,cf monitor
无集群、netapp存储单控工作,一控制器损坏
存储设备巡检报告
客户名称:湖北省疾控中心巡检时间:
设备型号
数量
DELL存储
DELL PS4000
1台
NetApp存储
NetApp 3040
1台
检测结果
1
双控制器同时正常工作
□正常□不正常
2
电池、电源和风扇模块
HP 小型机及存储巡检报告
异常 说明: 日志正常
网络
#ioscan –nfClan
正常
异常 说明: 日志正常
#lanscan
正常
异常 说明: 日志正常
#ifconfig lanX
正常
异常 说明: 日志正常
检查网络状态
#netfmt –f nettl.LOG
正常
异常 说明: 日志正常
DVD,CD-ROM
#cstm
#ioscan–fnCdisk
#more/var/adm/syslog/syslog.log
正常
异常 说明:日志正常
系统shutdown日志
#more/etc/shutdownlog
正常
异常 说明:日志正常
文件系统
#bdf(已使用空间不超过90%)
正常
异常 说明:日志正常
系统近期有无HPMC
检查/var/adm/tombstones/ts99
HP 小型机巡检报告
用户单位
联系人电话机器型号源自序列号主机名IP地址
时间
年 月 日
工作总时间
分钟
主机硬件检查
检查内容
参考命令
检查结果
指示灯状态
正常
异常 说明:
分区状态(仅限于SuperDome,rp8400等系列)
MP>CM
CM>PS查看cell, power, cpu, cpu fan, dimm等信息。
客户的意见和建议:
尊敬的客户:
您好!预防性维护服务的主要目的是对您所购买的设备进行全面检查,及早发现潜在的问题,提交详细检查报告及问题的针对性建议,提高用户业务的可用性。浙江星汉工程师有责任将检查的结果向您汇报。
服务器存储网络设备巡检报告
服务器存储网络设备巡检报告服务器存储网络设备巡检报告一、引言随着信息技术的飞速发展,服务器、存储和网络设备在各行各业的数据处理中发挥着日益重要的作用。
为了确保这些设备的稳定性和安全性,我们对所有关键服务器、存储和网络设备进行了全面的巡检。
本报告将详细介绍我们的巡检过程、发现的问题以及采取的相应措施。
二、巡检过程我们按照预定的流程,对所有服务器、存储和网络设备进行了详细的检查。
巡检过程包括以下几个步骤:1、设备外观检查:检查设备的外观是否有明显的损坏,如划痕、凹痕、掉漆等。
2、设备运行状态检查:检查设备的运行状态,包括CPU、内存、硬盘等关键指标。
3、网络连接检查:检查设备的网络连接是否正常,包括网卡、交换机端口、网络线路等。
4、备份配置检查:对设备的配置备份进行验证,确保配置文件的安全性。
三、发现问题在巡检过程中,我们发现以下问题:1、服务器1的硬盘使用率较高,接近80%。
2、网络设备2的某个交换机端口处于故障状态。
3、存储设备3的备份配置文件丢失。
四、采取的措施针对以上发现的问题,我们采取了以下措施:1、对服务器1进行维护,增加硬盘空间,降低硬盘使用率。
2、更换网络设备2的故障端口,确保网络连接的稳定性。
3、重新创建存储设备3的备份配置文件,确保配置文件的安全性。
五、总结与建议本次巡检全面覆盖了所有服务器、存储和网络设备,及时发现并解决了存在的问题,确保了设备的稳定性和安全性。
为了更好地进行设备管理,我们建议:1、定期进行设备巡检,及时发现并解决问题。
2、建立完善的设备管理档案,记录设备的配置信息、运行状态等。
3、加强设备备份管理,确保备份文件的完整性和可用性。
通过以上措施的实施,我们将能够更好地保障服务器、存储和网络设备的稳定运行,为业务发展提供坚实的技术支持。
服务器、存储、数据库巡检服务器、存储与数据库巡检:确保企业数据基础架构稳定性的关键在当今高度数字化的时代,数据对于企业的运行至关重要。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如果是TDP for Exchange应用则应该收集:
tdpexc.log
如果是TSM API客户端应用则应该收集:
dsierror.log
如果是TDP for Oralce,则应该收集:
tdpoerror.log
如果是针对DB2备份,则应该收集:
db2diag.log,db2alert.log,userexit.log
系统错误报告是否有软件错误errpt
是□否□
2
mail中是否有软件错误
是□否□
3
是否有使用率大于85%的文件系统
是□否□
4
JFS log设置是否正确
是□否□
5
是否有Stale LV
是□否□
6
内存交换区使用率是否超过70%
是□否□
7
系统备份是否符合要求
最近一次备份时间:
是□否□
8
rootvg是否有数据保护
序号
测试内容及操作
情况
结果
备注
机房环境
1
工作环境温度要求10℃~25℃
是□否□
2
工作环境相对湿度要求40%~70%
是□否□
3
机房封尘,尘土少
是□否□
4
UPS运行情况
是□否□
系统硬件外观检查
1
设备故障灯是否有亮
是□否□
2
硬件外观是否有异常
是□否□
SM软件检测
1
是否有错误日志记录
是□否□
2
服务器端是否有磁盘错误
是□否□
9
HACMP Cluster Verufication是否正常
是□否□
10
HACMP相关参数是否正确
是□否□
11
HACMP接管测试是否正常
是□否□不做□
12
操作系统版本及补丁情况
13
硬件微码版本
运行snap–r;snap–gfkbLc并且收回系统信息文件存档
1.2
机器型号:序列号:
控制器IP地址:
收集dsmserv.optdevconfigvolhistory文件
收集各个应用程序备份log
发现的问题及解决方案
序号
测试内容及操作
情况
结果
备注
机房环境
1
工作环境温度要求10℃~25℃
是□否□
2
工作环境相对湿度要求40%~70%
是□否□
3
机房封尘,尘土少
是□否□
4
UPS运行情况
是□否□
系统硬件外观检查
是□否□
2
内存是否有deconfigration
是□否□
3
CPU GUARD设置是否正确
是□否□
硬件诊断(不建议在线运行DIAG程序)
1
系统板、CPU、内存是否正常
是□否□
2
IO板、扩展卡是否正常
是□否□
3
磁盘、磁盘阵列是否正常
是□否□
4
磁带机、磁带库是否正常
是□否□
AIX操作系统及HACMP检查
1
是□否□
3
记录微码版本
运行SM Collect收集阵列配置信息并存档
1.3
TSM相关硬件信息
AIX lsdev–Cctape Windows查看设备管理器
设备状态
检查通路Query Path是否全部Online
是□否□
2
检查驱动器QueryDrive
是否全部available
是□否□
检查结果输出:
TSM日志检查
1
查询ACT Log是否有异常
Qact begind=-60 search=fail
是□否□
2
查看磁带状态
q vol access=unavail
q vol access=readonly
是否存在异常
是□否□
检查结果输出:
检查DB、LOG状态
Qdb f=d
Qdbvol f=d
1
AIX是否有硬件故障记录errpt–H
是□否□
2
mail是否有硬件错误
是□否□
3
bootlog/consolelog是否正常
是□否□
4
ASMI log是否正常
是□否□N/A□
5
HMC Event Log是否正常
是□否□N/A□
6
磁带机是否需要清洗
是□否□N/A□
硬件配置检查
1
CPU是否有deconfigration
q system
Q NODE F=D
Q SCHEDULE F=D
q sche type=admin f=d
Q LIBV F=D
q drive f=d
q path f=d
Q act begind=-60 search=fail
q vol access=unavail
q vol access=readonly
1
设备故障灯是否有亮
是□否□
2
硬件外观是否有异常
是□否□
SM软件检测
1
是否有错误日志记录
是□否□
2
服务器端是否有磁盘错误
是□否□
3
记录微码版本
第一章
1
1.1
机器型号:序列号:
主机名:IP地址:
序号
测试内容及操作
情况
结果
备注
机房环境
1
工作环境温度要求10℃~25℃
是□否□
2
工作环境相对湿度要求40%~70%
是□否□
3
机房封尘,尘土少
是□否□
4
UPS运行情况
是□否□
系统硬件外观检查
1
设备故障灯是否有亮
是□否□
2
硬件外观是否有异常
是□否□
硬件错误报告(Error Log)
如果是TDP for SQL,则应该收集:
tdpsql.log
运行dsmadmc批处理收集TSM服务器配置收集macro.out文件
dsmadmc -id=admin -password=admin -outfile=macro.out -NOConfirm macro query.mac
query.mac:
Available Space (MB)
Assigned Capacity(MB)
DB volume name
使用率
是否需要扩充
Qlog f=d
Qlogvol f=d
Available Space (MB)
Assigned Capacity(MB)
Log volume name
使用率
是否需要扩充
检查结果输出: