存储设备巡检报告v10
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
存储设备巡检报告v1.0
————————————————————————————————作者: ————————————————————————————————日期:
XXXXXXX
存储设备巡检报告2015年6月26日
XXX分行
ﻩ存储设备巡检报告
尊敬的XXXXX客户: ﻫ感谢您长期以来对我公司的支持与帮助!
为使贵公司所使用的存储设备更好的运行,在贵公司的大力配合下,我们于2015年06月26日对贵公司网上运行的存储设备进行了软件及硬件巡检工作。现将这次巡检的情况向您汇报如下,并请您对我们的巡检工作给予评价。谢谢!
1巡检基本信息
1.1局点基本信息
客户名称
客户联系人
客户联系电话
巡检人员
巡检时间
1.2巡检设备信息
设备型号设备数量
5
1.3巡检项简介
存储的巡检通过管理节点可对所有节点进行巡检。对巡检和信息收集是对设备当前的状态进行检视,能及时发现设备中存在的问题。检查项包括如下内容:
序号检查项检查方法参考标准或值的范围备注
1 基础巡检巡检工具Ocea
nStor Toolkit
巡检。
根据巡检报告的异常项(会
标红并显示巡检不通过)中
修复建议进行处理。
2 存储使用
情况分析
OceanStor Devi
ceManager
登录OceanStor
DeviceManager,人工
判断和工具判断结合。
3告警信息
检视
OceanStor De
viceManager
登录OceanStor Dev
iceManager导出告警和
事件信息
2存储检查结果汇总
2.1存储基础巡检概述
存储的巡检使用OceanStorToolkit工具进行,包括硬件巡检、软件巡检,具体又包含65个检查子项。详细检查项如下表所示。
说明:“√”表示通过;“×”表示不通过;“○”表示未检查;“-”表示不涉及;“!”表示建议优化。
√:通过×:不通过○:未检查-:不涉及!:建议优化
索引检查父
项
检查子项
22.
0.112.2
1
通过台数/
总台数
1
硬件磁盘利用率 1/1
2 CPU利用率 1/1
3内存利用率1/14磁盘状态 1/1
5电源状态 0/1
6风扇状态 1/1
7网口状态 1/1 8CPU状态1/1 9节点状态 1/1 10磁盘Verify 1/1
11节点温度 1/1 12网口协商单双工巡检 1/1
13光模块状态 1/1
14 SSD 配置 1/1
15系统盘 1/1
16 Nvdimm 1/1 17ECC错误巡检 1/1
18网口ARP解析 1/1 19 BMC的状态 1/1 20版本状态检查 1/1
21检查Modem的状态1/1
22检查节点间时间同步1/1 23检查syslog服务运行状态1/1
24
检查同一个diskpool内的磁盘利
用率是否均匀
1/1
25检查节点SATA盘中是否有坏盘 1/1 26节点池内存一致性检测 0/1
27
软件集群状态1/1
28检查打开的文件句柄数 1/1
29节点网络吞吐量 1/1 30节点IO统计信息 1/1
31看门狗状态 1/1 32MON与各子系统连接状态 1/1 33NTP 服务 1/1
34CM 主节点 1/1 35 ISM运行状态 1/1
36 License状态 1/1 37常见的文件操作测试 1/1 38NAS 客户端1/1 39 NAS 运行状态 1/1
40数据盘空间使用情况1/1 41节点间通讯链路 1/1
42内存池资源使用情况1/1 43关键数据一致性校验 1/1 44系统inode数量1/1 45文件数量超过阈值的目录 1/1
46 linux系统打开的文件句柄数1/1 47 NIS域控服务器的连接状态 1/148检查外部DNS的连通性0/14
9
LDAP域控服务器的连接状态 1/1 50 IPMI地址 1/1
51分级使用率 1/1
52未清除的告警 0/1
53业务主节点状态 1/1
54MON Server节点 1/1
55 Nvdimm内存池的使用1/1
56数据恢复状态 0/1
57检查过去三天是否存在数据恢复任务 0/1
58 nlun 状态1/1
59检查monitor频繁选主 1/1
60检查MDS的子树一致性 1/1
61检查近30天内是否有core和crash0/1
62检查NTP时间同步状态1/1
63检查节点RPC引用计数是否泄漏 1/1
64检测写NOFS是否有超时 1/1
65前端业务IP连通性检测 1/1
2.2存储版本巡检情况概述
现网运行的存储版本汇总如下:
设备型号设备名称设备SN 运行版本版本说明
2.3巡检问题汇总
本次巡检中,发现的不通过项目如下所示:
问题描述解决措施解决时间
3巡检结果总结
巡检项目巡检结果
基础巡检(根据巡检报告进行填写)
存储使用情况分析存储目前已经使用了30%(超过60%建议扩容)
4遗留问题处理
问题描述解决措施计划解决时间
5运行维护及其他方面的建议
1、定期进行设备硬件及软件的巡检。
2、参照《日常维护操作指导》中内容对设备进行例行检查和测试,并记录检
查结果,定期备份数据。
3、有问题请及时联系我们,为您提供7×24小时专家服务。
最后感谢贵公司长期以来对我公司的大力支持和理解,我公司将一如既往的为贵公司提供规范优质的服务。希望贵公司能多给我们的服务提出意见,您的意见就是我们最宝贵的财富。
用户意见:
用户签字: