HP 小型机及存储巡检报告

合集下载

存储巡检报告模板

存储巡检报告模板

存储巡检报告模板
1. 前言
存储是一个企业非常重要的基础设施,存储设备的正常运行对于保障企业运营
至关重要。

因此,存储巡检是企业运营中的一项非常重要的工作。

本文旨在提供一份存储巡检报告模板,以便各位存储巡检人员在工作中更好地开展巡检工作。

2. 存储巡检报告模板
2.1 工作概述
本次巡检主要对企业存储设备进行检查。

巡检员通过对存储设备的性能、状态、数据完整性等方面进行检查,以判断设备是否正常运行,是否需要维护,同时也检查是否存在安全隐患,如权限管理不当、数据备份不及时等问题。

2.2 巡检时间
本次巡检时间为:(填写具体时间)。

2.3 巡检内容
本次巡检主要内容为:(填写具体巡检项目)。

2.4 巡检结果
本次巡检发现如下问题:
1.存储设备性能评估:
(填写具体评估结果)
2.存储设备状态:
(填写具体状态信息)
3.数据完整性检查:
(填写具体检查结果)
4.安全隐患:
(填写具体发现的安全隐患)
2.5 巡检结论
依据本次巡检结果,存储设备的性能、状态、数据完整性等方面均处于正常状态。

同时,本次巡检也指出了存在的安全隐患,建议相关负责人员尽快处理。

本结论仅限于本次巡检范围内。

3. 总结
通过本次存储巡检,可以看出存储设备正常运行并保持稳定状态。

存储负责人员应加强安全管理,提高数据备份的频率和完整性,保障存储数据的安全,同时应定期对存储设备进行巡检和维护,以确保存储设备的正常运行。

(完整版)小型机存储系统巡检报告

(完整版)小型机存储系统巡检报告
检查应用程序备份日志
如果是TDP for Exchange应用则应该收集:
tdpexc.log
如果是TSM API客户端应用则应该收集:
dsierror.log
如果是TDP for Oralce,则应该收集:
tdpoerror.log
如果是针对DB2备份,则应该收集:
db2diag.log,db2alert.log,userexit.log
系统错误报告是否有软件错误errpt
是□否□
2
mail中是否有软件错误
是□否□
3
是否有使用率大于85%的文件系统
是□否□
4
JFS log设置是否正确
是□否□
5
是否有Stale LV
是□否□
6
内存交换区使用率是否超过70%
是□否□
7
系统备份是否符合要求
最近一次备份时间:
是□否□
8
rootvg是否有数据保护
序号
测试内容及操作
情况
结果
备注
机房环境
1
工作环境温度要求10℃~25℃
是□否□
2
工作环境相对湿度要求40%~70%
是□否□
3
机房封尘,尘土少
是□否□
4
UPS运行情况
是□否□
系统硬件外观检查
1
设备故障灯是否有亮
是□否□
2
硬件外观是否有异常
是□否□
SM软件检测
1
是否有错误日志记录
是□否□
2
服务器端是否有磁盘错误
是□否□
9
HACMP Cluster Verufication是否正常
是□否□

存储设备巡检报告

存储设备巡检报告
存储设备巡检报告
存储设备巡检报告
客户名称:湖北省疾控中心巡检时间:
设备型号
数量
DELL存储
DELL PS4000
1台
检测结果
1
双控制器同时正常工作
□正常□不正常
2
电池、电源和风扇模块
□正常□不正常
3
物理硬盘和逻辑盘
□正常□不正常
4
外置磁带库
□正常□不正常
5
其他硬件
参考命令:sysconfig-a,sysconfig –r
系统无故障磁盘、热备盘正常工作
9
网络端口工作情况
参考命令:ifconfig –a, ifstat –a, vif status
设备各端口工作正常
10
存储设备联通性、丢包、延时ping -t
网络连通性良好,无丢包、延时平均小于5ms
11
集群状态
□正常□不正常
5
硬件设备状况
参考命令:sysconfig –v, sysconfig –a, hostname
硬件状况良好、CPU、内存、磁盘利用正常
6
环境检查
参考命令:environment status
系统运行环境良好
7
日志文件检查
参考命令:rdfile /etc/messages
8
系统故障磁盘、热备盘
参考命令:Cf status,cf monitor
无集群、netapp存储单控工作,一控制器损坏
12
磁盘空间使用情况
参考命令:vol status –v, df–h
磁盘正常在线,空间使用率低于80%
13
LUN状态
参考命令:Lun show, lun show -m

数据存储设备巡检报告

数据存储设备巡检报告

数据存储设备巡检报告
概述
本次巡检是对公司数据存储设备的一次检查,主要目的是确保设备的正常运行,以及防止数据损失发生。

本次巡检的设备包括服务器、硬盘、网络存储等。

巡检内容
1. 服务器
- 检查硬件是否运行正常,包括电源,风扇等
- 检查操作系统是否正常运行并更新到最新版本
- 检查应用程序是否在运行和正常工作中
2. 硬盘
- 检查硬盘是否有损坏或故障
- 检查文件系统是否正常
- 检查磁盘空间是否充足
3. 网络存储
- 检查网络存储设备是否能够正常连接
- 检查文件共享是否正常工作
巡检结果
1. 服务器:
- 所有服务器运行正常,未发现故障。

- 操作系统已更新到最新版本。

- 应用程序正常工作。

2. 硬盘:
- 所有硬盘表现良好。

- 所有文件系统正常。

- 磁盘空间充足。

3. 网络存储:
- 所有网络存储设备能够正常连接。

- 文件共享正常工作。

结论
本次巡检结果表明,所有数据存储设备运行正常,未发现异常。

同时,对于运行操作系统和应用程序的服务器,已全部更新到最新
版本。

在进行数据存储和共享时,公司可以继续信赖这些设备。

存储设备巡检报告精编WORD版

存储设备巡检报告精编WORD版
参考命令:sysconfig-a,sysconfig –r
系统无故障磁盘、热备盘正常工作
9
网络端口工作情况
参考命令:ifconfig –a, ifstat –a, vif status
设备各端口工作正常
10
存储设备联通性、丢包、延时ping -t
网络连通性良好,无丢包、延时平均小于5ms
11
集群状态
5
其他硬件
□正常□不正常
5
硬件设备状况
参考命令:sysconfig –v, sysconfig –a, hostname
硬件状况良好、CPU、内存、磁盘利用正常
6
环境检查
参考命令:environment status
系统运行环境良好
7
日志文件检查
参考命令:rdfile /etc/messages
8
系统故障磁盘、热备盘
参考命令:Cf status,cf monitor
无集群、netapp存储单控工作,一控制器损坏
12
磁盘空间使用情况
参考命令:vol status –v, df–h
磁盘正常在线,空间使用率低于80%
13
LUNபைடு நூலகம்态
参考命令:Lun show, lun show -m
LUN 状态正常
14
内存利用率、RAID状态信息
存储设备巡检报告精编WORD版
存储设备巡检报告
客户名称:湖北省疾控中心巡检时间:
设备型号
数量
DELL存储
DELL PS4000
1台
NetApp存储
NetApp 3040
1台
检测结果
1
双控制器同时正常工作

HP小型机巡检表

HP小型机巡检表

HP小型机巡检表小型机巡检表HP(Hewlett-Packard)小型机是一种在中小型企业中广泛使用的服务器,它承担着重要的业务功能。

为了确保HP小型机的稳定运行,提高工作效率,定期进行巡检是非常必要的。

下面是HP小型机巡检表,具体内容如下:1. 硬件巡检:- 检查服务器是否正常启动,CPU和内存使用率是否正常。

- 检查硬盘空间是否充足,如果不够,请及时清理或增加硬盘。

- 检查硬盘是否存在故障或预测失败,如果有,需要进行故障排除或更换硬盘。

- 检查服务器的风扇和散热器是否正常运转,以防止过热造成的故障。

- 检查服务器的电源和电缆连接是否良好,确保供电稳定。

2. 操作系统巡检:- 检查操作系统是否有安全漏洞,及时进行补丁更新。

- 检查病毒防护软件是否正常运行,病毒库是否及时更新。

- 检查操作系统日志,查看是否存在异常事件。

- 检查防火墙设置,确保服务器的安全性。

3. 数据库巡检:- 检查数据库是否正常运行,检查数据库的连接情况。

- 检查数据库日志,查看是否存在异常事件。

- 检查数据库备份,确保备份的完成和可恢复性。

4. 网络巡检:- 检查网络设备是否正常工作,如交换机、路由器等。

- 检查网络连接是否稳定,网络延迟是否过高。

- 检查网络防火墙设置,确保网络安全。

5. 应用程序巡检:- 检查应用程序是否正常运行,包括Web服务器、邮件服务器等。

- 检查应用程序日志,查看是否存在异常事件。

- 检查应用程序的数据备份,确保数据的完整性。

6. 安全巡检:- 检查服务器的访问权限,确保只有授权人员能够访问。

- 检查密码策略,确保密码的安全性。

- 检查服务器的入侵检测系统,确保服务器的安全。

7. 性能巡检:- 检查服务器的性能指标,如CPU使用率、内存使用率、磁盘I/O等。

- 检查服务器的网络带宽使用情况,以及网络延迟情况。

- 检查服务器的响应时间,确保用户体验良好。

通过定期进行以上巡检,可以确保HP小型机的正常运行,及时发现并解决潜在问题,提高工作效率。

存储设备巡检报告

存储设备巡检报告

存储设备巡检报告一、巡检目的和范围本次巡检的目的是为了确保存储设备的正常运行并提前发现潜在的问题,以保障数据的安全性和稳定性。

巡检的范围包括存储设备的硬件设施、网络环境、软件系统和数据备份等方面。

二、巡检内容和步骤1.硬件设施巡检:检查存储设备的硬件设施,包括服务器、存储阵列、磁盘驱动器等是否正常运行,是否有异常噪音或发热等现象。

检查存储设备的供电和冷却系统是否正常,电源线和散热风扇是否有松动或堵塞。

检查存储设备的机箱和设备拓扑结构是否整齐、清洁。

2.网络环境巡检:检查存储设备的网络连接是否稳定,网络线缆是否连接良好。

检查存储设备的网络传输速度是否正常,网络延迟是否过高。

检查网络交换机或路由器的配置是否正确,防火墙是否正常工作。

3.软件系统巡检:检查存储设备的操作系统和存储管理软件是否正常运行,并及时对系统和软件进行升级和补丁打补。

检查存储设备的文件系统是否有异常或损坏的情况。

检查存储设备的磁盘阵列配置是否合理,磁盘是否有坏道或故障。

4.数据备份巡检:检查存储设备的数据备份是否顺利进行,备份数据是否完整和可恢复。

检查备份设备的状态和容量是否满足需求,是否有足够的空间进行备份。

三、巡检结果和问题处理1.硬件设施巡检结果:经过巡检,存储设备的硬件设施运行正常,无异常噪音和发热现象。

存储设备的供电和冷却系统正常,未发现电源线和散热风扇的松动或堵塞现象。

存储设备的机箱和设备拓扑结构整齐,没有明显的灰尘和污垢。

2.网络环境巡检结果:存储设备的网络连接稳定,网络线缆连接良好。

存储设备的网络传输速度正常,网络延迟在可接受范围内。

网络交换机和路由器的配置正确,防火墙正常工作。

3.软件系统巡检结果:存储设备的操作系统和存储管理软件正常运行。

系统和软件已经升级至最新版本,补丁也已打补,以提供更好的性能和安全保障。

存储设备的文件系统无异常或损坏,磁盘阵列配置合理,磁盘无坏道和故障。

4.数据备份巡检结果:存储设备的数据备份顺利进行,备份数据完整和可恢复。

HP小型机及存储巡检手册

HP小型机及存储巡检手册
回车进去就能看到 CPU 内存等主机信息:
移动光标到 File 菜单下,选择 Exit SAM,回车,即可退出 SAM:

用 ioscan –fnCdisk 可查看硬盘的信息,例如:
# ioscan -fnCdisk
Class I H/W Path Driver S/W State H/W Type Description
14 0/0/5/0 RS-232 Interface (103c104 Information Successful
15 8 MEMORY (9b) Information Successful
16 160 CPU (5cb) Information Successful
cstm>select dev 16
------------------------------------------------------
|File View Options Actions Help|
| ---- ---- ------- ------------------------------- ---|
- use "Tab" to move from the list to the menubar
- use the arrow keys to move within screen elements
- use "Ctrl-F" for context-sensitive help anywhere in sam
On screens with a menubar at the top like this:
护空间。
• 电话线:机房应该配备电话线(用于紧急拨号维护或及时电话支持)。

小型机巡检报告模版

小型机巡检报告模版
(根据需要)接管测试□正常□不正常
备注:
20.硬件检查诊断(Diagnostic)
运行Diag系统诊断程序
系统、CPU、内存、I/O板□正常□不正常
网卡、SCSI卡、SSA卡□正常□不正常
系统其它扩展卡□正常□不正常
硬盘、磁盘阵列□正常□不正常
磁带库、磁带机□正常□不正常
其它□正常□不正常
21.运行“snap –ac”,取回/tmp/ibmsupt/snap+s/n.pax.Z文件存档
故障内容:
4.查看日志文件,如: /tmp/hacmp.out,/smit.log,/var/adm/ras/bootlog
是否有异常。□有□无
备注:
5.检查文件系统查看有否“80%”以上的文件系统。□有□无
备注:
6.查看卷组信息(lsvg –l vg_name):有否“stale”状态的逻辑卷
□有□无
22.机器清洁情况□良好□一般□已清洁
23.系统整体运行情况:
工程师签字:日期:年月日
客户签字:日期:年月日
注:1~16为A类维护(季度维护),17~19为B类维护(半年维护),20~23为C类维护(年度维护)
工程师服务记录表
本次巡检发现的问题:
已经解决的问题及方法:
处理结果:
客户满意度:1、非常满意()2、满意CMP的测试在于检查系统在出现宕机情况时业务系统能否正常地进行接管切换。由于生产环境的参数设置的改变,有可能导致生产系统和备份系统出现不一致的情况,从而导致在真正发生故障时业务系统不能接管。
HACMP snap文件存档□有□无
Cluster Veritication:□正常□不正常
16.检查机房环境

HP小型机及存储巡检手册

HP小型机及存储巡检手册

HP小型机及存储巡检手册第一章 1HP 小型机巡检手册2检查机房环境CONTENTS目录第一章检查机房环境:3第二章 HP 小型机巡检42.1系统配置检查 (4)2.2检查系统硬件情况: (8)2.3系统日志检查 (11)2.4LVM 相关检查 (15)2.5集群状态的检查 (18)2.6系统总体性能评估 (20)2.7系统备份检查 (22)第三章 HP PC 服务器巡检233.1检查前面板指示灯 (23)3.2查看SMH(System Management Homepage ) (26)3.3看 iml 日志 (26)3.4查看系统操作日志 (26)3.5看 BOIS 版本号 (27)第四章 HP 磁阵巡检284.1EVA 系列 (28)4.2MSA 系列 (32)第一章检查机房环境第一章 3温度:室内温度应保持在20~25 ℃ ? 湿度:相对湿度应保持在40~60% ? 火线- 零线电压:198~232V ? 零线- 地线电压:应<1V, 最高不超过 3V ? 洁净度:机房应保持清洁,不能有太多的灰尘,如机房太脏应提醒客户注意。

? 维护空间:机柜旁不宜摆放杂物,要根据各机型的规定留有足够的散热空间和维护空间。

? 电话线:机房应该配备电话线(用于紧急拨号维护或及时电话支持)。

? 机房环境( 电源, 空调…) 近期内有没有较大变动4HP 小型机巡检第二章 HP 小型机巡检2.1 系统配置检查2.1.1 检查 HP-UX 操作系统版本在终端上执行以下命令: asogz3:/ # uname -a HP-UX asogz3B.11.11 U 9000/800 1135931517 unlimited-user license2.1.2 检查 PDC 固件版本在 cstm 或 mstm 中看 CPU 设备的 information,以 cstm 为例#cstm cstm>map Dev Last Last Op Num Path Product Active Tool Status === ==================== ========================= =========== 1 system system () Information Successful 2 0 Bus Adapter (582) Information Successful 3 0/0 PCI Bus Adapter (782) Information Successful 4 0/0/0/0 Core PCI 100BT Interface Information Successful 5 0/0/1/0 PCI SCSI Interface (10000 Information Successful 6 0/0/1/0.3.0 SCSI Tape (HPC1537A) Information Successful 7 0/0/1/1 PCI SCSI Interface (10000 Information Successful 8 0/0/1/1.15.0 SCSI Disk (SEAGATEST31840 Information Successful 9 0/0/2/0 PCI SCSI Interface (10000 Information Successful 10 0/0/2/0.3.0 SCSI Disk (HPDVD-ROM) Information Successful 11 0/0/2/1 PCI SCSI Interface (10000 Information Successful 12 0/0/2/1.15.0 SCSI Disk (HP36.4GATLAS10 Information Successful 13 0/0/4/0 RS-232 Interface (103c104 Information Successful 14 0/0/5/0 RS-232 Interface (103c104 Information Successful 15 8 MEMORY (9b) Information Successful 16 160 CPU (5cb) Information Successful第二章 5cstm>select dev 16 cstm>info -- Updating Map -Updating Map... cstm>il Hardware path: 160 Product ID: CPU Module Type: 0 Hardware Model: 0x5cb Software Model: 0x4 Hardware Revision: 0 Software Revision: 0 Hardware ID: 0 Software ID:566770598 Boot ID: 0x1 Software Option: 0x91 Processor Number: 0 Path: 160 Hard Physical Address: 0xfffffffffffa0000 Soft Physical Address: 0 Slot Number: 8 Software Capability: 0x100000f0 PDC Firmware Revision: 41.18 IODC Revision: 0 Instruction Cache [Kbyte]: 512 Processor Speed: N/A Processor State: N/A Monarch: Yes Active: Yes Data Cache [Kbyte]: 10242.1.3 通过 sam 检查 CPU 和内存信息例如检查CPU 信息:hp01:/>#sam Starting the terminal version of sam... T o move around in sam: - use the "Tab" key to move between screen elements - use the arrow keys to move within screen elements - use "Ctrl-F" for context-sensitive help anywhere in sam On screens with a menubar at the top like this: -----------------------------------------------------|File View Options Actions Help| | ---- ---- ------- ------------------------------- ---| - use "Tab" to move from the list to the menubar6HP 小型机巡检- use the arrow keys to move around - use "Return" to pull down a menu or select a menu item - use "Tab" to move from the menubar to the list without selecting a menu item - use the spacebar to select an item in the list On any screen,press "CTRL-K" for more information on how to use the keyboard. Press "Return" to continue... 根据提示按任意键则进到 SAM 界面:在SAM 的界面,可以用tab 键和上下左右箭头方向键来移动光标。

STORAGE存储巡检报告

STORAGE存储巡检报告

设备名称:
检查时间:年月日时本年度第次检查
检查项目:
1.检查存储硬件情况:
设备故障灯是否有亮
SAN交换机端口LED状态
2.存储系统故障报告(Problem Log):
Problem Log/Serviceable Event
有否硬件故障
3.存储系统运行状态:
View Storage Facility State /
CdaPreverify / View RIO Topology
4.通信:
/Master Console/SMC/HMC和存储设备的通信
5.存储设备内部状态:
6.存储系统硬件状态:
双控制器同时正常工作
电池、电源和风扇模块
物理硬盘和逻辑盘
7.微码(Microcode)是否满足IBM的最低要求
8.是否启用了Call Home
9.收集存储设备基本信息存档检查结果:
□有□无
□正常□不正常
□有□无
□正常□不正常
□正常□不正常
□Good □Degraded □Offline□Rebuilding
□正常□不正常
□正常□不正常
□正常□不正常
□是□否
□是□否
□是□否
检查结论:
客户签字:
日期:年月日工程师签字:
日期:年月日。

存储设备巡检报告

存储设备巡检报告
5
硬件设备状况
参考命令:sysconfig –v, sysconfig –a, hostname
硬件状况良好、CPU、内存ironment status
系统运行环境良好
7
日志文件检查
参考命令:rdfile /etc/messages
8
系统故障磁盘、热备盘
参考命令:sysconfig-a,sysconfig –r
12
磁盘空间使用情况
参考命令:vol status –v, df–h
磁盘正常在线,空间使用率低于80%
13
LUN状态
参考命令:Lun show, lun show -m
LUN 状态正常
14
内存利用率、RAID状态信息
内存利用率、RAID信息正常
14
15
问题处理:
巡检工程师:客户代表:
时间:时间:
系统无故障磁盘、热备盘正常工作
9
网络端口工作情况
参考命令:ifconfig –a, ifstat –a, vif status
设备各端口工作正常
10
存储设备联通性、丢包、延时ping -t
网络连通性良好,无丢包、延时平均小于5ms
11
集群状态
参考命令:Cf status,cf monitor
无集群、netapp存储单控工作,一控制器损坏
存储设备巡检报告
客户名称:湖北省疾控中心巡检时间:
设备型号
数量
DELL存储
DELL PS4000
1台
NetApp存储
NetApp 3040
1台
检测结果
1
双控制器同时正常工作
□正常□不正常
2
电池、电源和风扇模块

巡检报告怎么写例文

巡检报告怎么写例文

巡检报告怎么写例文巡检报告是记录巡检过程中所发现问题、异常情况以及解决方案的文档。

以下是一个巡检报告的例文:巡检报告日期:2021年10月15日巡检人:张三一、巡检目的:通过定期巡检,检查设备状态,确认设备运行正常,及时发现并解决问题,确保设备运行稳定。

二、巡检内容:1. 检查服务器A的工作状态- 服务器A正常运行,无异常现象。

- CPU占用率为40%,内存占用率为60%。

- 硬盘空间使用率为70%,剩余空间为30%。

- 网络连接正常。

2. 检查交换机B的工作状态- 交换机B运行正常,无报警信息。

- 所有端口连接正常,无异常现象。

- VLAN配置正确,各个VLAN间可以正常通信。

3. 检查网络安全防火墙的状态- 防火墙运行正常,无报警信息。

- 上网策略及访问控制列表配置正确。

- 对外服务端口的访问控制有更新。

- 安全日志正常记录,未发现异常行为。

4. 检查网络摄像头C的工作状态- 摄像头C正常运行,无异常现象。

- 图像传输流畅,画质清晰。

- 存储设备空间充足。

三、问题与解决:1. 服务器A硬盘空间使用率较高,将进行清理操作,并增加额外的存储设备。

2. 交换机B的某个端口无法连接,需更换网线或更换端口。

3. 网络摄像头C的部分图像存在模糊问题,需进一步调整聚焦。

四、下一步计划:1. 针对服务器A的硬盘空间问题,将进行定期清理,并优化存储策略。

2. 检查交换机B的端口连接问题,尽快解决故障,恢复正常通信。

3. 对于网络摄像头C的模糊图像问题,跟进调整并进行测试,确保画质清晰。

以上为巡检报告的例文,根据实际情况进行相应的修改,以保证报告的准确性和完整性。

HP 小型机及存储巡检报告

HP 小型机及存储巡检报告
正常
异常 说明: 日志正常
网络
#ioscan –nfClan
正常
异常 说明: 日志正常
#lanscan
正常
异常 说明: 日志正常
#ifconfig lanX
正常
异常 说明: 日志正常
检查网络状态
#netfmt –f nettl.LOG
正常
异常 说明: 日志正常
DVD,CD-ROM
#cstm
#ioscan–fnCdisk
#more/var/adm/syslog/syslog.log
正常
异常 说明:日志正常
系统shutdown日志
#more/etc/shutdownlog
正常
异常 说明:日志正常
文件系统
#bdf(已使用空间不超过90%)
正常
异常 说明:日志正常
系统近期有无HPMC
检查/var/adm/tombstones/ts99
HP 小型机巡检报告
用户单位
联系人电话机器型号源自序列号主机名IP地址
时间
年 月 日
工作总时间
分钟
主机硬件检查
检查内容
参考命令
检查结果
指示灯状态
正常
异常 说明:
分区状态(仅限于SuperDome,rp8400等系列)
MP>CM
CM>PS查看cell, power, cpu, cpu fan, dimm等信息。
客户的意见和建议:
尊敬的客户:
您好!预防性维护服务的主要目的是对您所购买的设备进行全面检查,及早发现潜在的问题,提交详细检查报告及问题的针对性建议,提高用户业务的可用性。浙江星汉工程师有责任将检查的结果向您汇报。

服务器存储网络设备巡检报告

服务器存储网络设备巡检报告

服务器存储网络设备巡检报告服务器存储网络设备巡检报告一、引言随着信息技术的飞速发展,服务器、存储和网络设备在各行各业的数据处理中发挥着日益重要的作用。

为了确保这些设备的稳定性和安全性,我们对所有关键服务器、存储和网络设备进行了全面的巡检。

本报告将详细介绍我们的巡检过程、发现的问题以及采取的相应措施。

二、巡检过程我们按照预定的流程,对所有服务器、存储和网络设备进行了详细的检查。

巡检过程包括以下几个步骤:1、设备外观检查:检查设备的外观是否有明显的损坏,如划痕、凹痕、掉漆等。

2、设备运行状态检查:检查设备的运行状态,包括CPU、内存、硬盘等关键指标。

3、网络连接检查:检查设备的网络连接是否正常,包括网卡、交换机端口、网络线路等。

4、备份配置检查:对设备的配置备份进行验证,确保配置文件的安全性。

三、发现问题在巡检过程中,我们发现以下问题:1、服务器1的硬盘使用率较高,接近80%。

2、网络设备2的某个交换机端口处于故障状态。

3、存储设备3的备份配置文件丢失。

四、采取的措施针对以上发现的问题,我们采取了以下措施:1、对服务器1进行维护,增加硬盘空间,降低硬盘使用率。

2、更换网络设备2的故障端口,确保网络连接的稳定性。

3、重新创建存储设备3的备份配置文件,确保配置文件的安全性。

五、总结与建议本次巡检全面覆盖了所有服务器、存储和网络设备,及时发现并解决了存在的问题,确保了设备的稳定性和安全性。

为了更好地进行设备管理,我们建议:1、定期进行设备巡检,及时发现并解决问题。

2、建立完善的设备管理档案,记录设备的配置信息、运行状态等。

3、加强设备备份管理,确保备份文件的完整性和可用性。

通过以上措施的实施,我们将能够更好地保障服务器、存储和网络设备的稳定运行,为业务发展提供坚实的技术支持。

服务器、存储、数据库巡检服务器、存储与数据库巡检:确保企业数据基础架构稳定性的关键在当今高度数字化的时代,数据对于企业的运行至关重要。

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
客户的意见和建议:
尊敬的客户:
您好!预防性维护服务的主要目的是对您所购买的设备进行全面检查,及早发现潜在的问题,提交详细检查报告及问题的针对性建议,提高用户业务的可用性。浙江星汉工程师有责任将检查的结果向您汇报。
如果您已了解此次预防性维护服务的内容,请在此签字:
服务工程师
客户代表
日 期
年月日
日 期
年月日
正常
异常 说明:
检查存储日志
#armlog –e<阵列标识号–ArrayID
正常
异常 说明:
收集存储信息
# logprn–t all–v–a <阵列标识号 -ArrayID>
正常
异常 说明:
此次预防性维护的总结及建议
系统运行情况总结:
改进与建议:
客户对预防性维护的意见及建议
客户对此次服务的评价:
□非常满意□满意□一般□不满意
HP 小型机巡检报告
用户单位
联系人
电话
机器型号
序列号
主机名
IP地址
时间
年 月 日
工作总时间
分钟
主机硬件检查
检查内容
参考命令
检查结果
指示灯状态
正常
异常 说明:
分区状态(仅限于SuperDome,rp8400等系列)
MP>CM
CM>PS查看cell, power, cpu, cpu fan, dimm等信息。

#/usr/sbin/diag/contrib/pdcinfo

有 说明:无HPMC,正常
系统近期有无Core Dump
检查/var/adm/crash

有 说明:无coredump文件,正常
系统有无core文件
#find / -name core -print

有 说明:找到了一些core文件
系统备份检查
#vgcfgbackup vgname做vg配置信息的备份
完成
失败 说明:
询问客户有否在系统变更后或每半年做系统备份(Ignite)

否 建议:
询问客户数据库及应用、应用数据是否定期有效进行备份

否 建议:
询问客户介质(磁份介质是否被妥善保存
N/A

否 建议:
正常
异常 说明: 日志正常
机器的出风口和入风口是否需要清洁
正常
异常 说明: 正常
系统日志检查
检查内容
参考命令
检查结果
dmesg 输出
dmesg检查有否scsi reset,file system full等信息
正常
异常 说明:
系统启动日志
#more/etc/rc.log
正常
异常 说明:日志正常
系统运行日志
正常
异常 说明:
分区配置状态(仅限于SuperDome,rp8400系列且无法联接MP)
#parstatus
正常
异常 说明:
处理器
#mstm
正常
异常 说明: 日志正常
内存
#mstm/dmesg
正常
异常 说明: 日志正常
磁盘
#ioscan –fnCdisk
正常
异常 说明: 日志正常
I/O
#ioscan –nf (注意有否unclaimed, unknown, NO_HW状态)
最近一次make_recovery成功备份时间
/var/opt/ignite/logs/makrec.log1
最近的成功备份时间是:
系统资源使用情况
检查内容
参考命令
检查结果
CPU 平均使用率
#sar
Usr:%
Sys:%
建议:
Idle:%
IO所占用的CPU使用率
#glance
Wio:%
建议:
空闲的物理内存
#top
Free:K
建议:
交换区使用情况
#swapinfo–atm
Pct Used(dev): %
建议:
Pct Used(total): %
存储外设检查( EVA,VA)
检查内容
参考命令
检查结果
EVA存储
检查controller和disk enclosure上的指示灯
正常
异常 说明:
检查是否有错误标记
正常
异常 说明: 日志正常
网络
#ioscan –nfClan
正常
异常 说明: 日志正常
#lanscan
正常
异常 说明: 日志正常
#ifconfig lanX
正常
异常 说明: 日志正常
检查网络状态
#netfmt –f nettl.LOG
正常
异常 说明: 日志正常
DVD,CD-ROM
#cstm
#ioscan–fnCdisk
在SMA上进入https://localhost:2381/
正常
异常 说明:
记录VCS版本号
VCS版本号:
运行SSSU并收集配置信息
SSSU
正常
异常 说明:
VA存储
检查controller和disk enclosure上的指示灯
正常
异常 说明:
检查存储所有硬件、RIAD状态
#armdsp –a<阵列标识号 -ArrayID>
#more/var/adm/syslog/syslog.log
正常
异常 说明:日志正常
系统shutdown日志
#more/etc/shutdownlog
正常
异常 说明:日志正常
文件系统
#bdf(已使用空间不超过90%)
正常
异常 说明:日志正常
系统近期有无HPMC
检查/var/adm/tombstones/ts99
相关文档
最新文档