B小型机日常维护手册
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
IBM P750小型机
日常维护手册服务器硬件运行状态检查
1. 当服务器处于启动和正常工作状态时,其前面板上的状态灯(与电源灯并排)和各
硬盘的状态灯(一排小灯,与各硬盘位置一一对应)应显示为绿色。
2. 当服务器的状态灯出现橙黄色时,说明有硬件告警,此时要检查服务器的电源、接线、硬盘
等。如果有硬件故障则需要立即进行更换和更正,如果查不出具体问题,则需要联系相关专家进一步诊断。
3. 当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮,
如该硬盘有读写操作,则绿灯会不规则闪烁,当硬盘损坏时,则硬盘状态灯将熄灭,或者呈闪烁状态:以1〜3秒的频率有规律地、不停地闪烁。
如果发现有服务器硬件状态灯不正常的情况,请及时联系我公司工程师,以便及时进行诊断并解决故障。
HM Q硬件管理平台)管理与操作
HMC勺两种访问途径:
1、在机房直接通过显示器和键盘进行管理维护等相关操作
2、通过web远程访问,登录HMC we管理界面,访问地址为:
1、登录HMC
浏览器访问连接HM(后,首页界面如下图所示。
点击下图所示链接,进入HMC佥证登录界面。
输入用户名与口令,登录HMC
用户名:hscroot
口令:
成功登录到HM(管理界面如下图所示。
2、注销HMC
在HMC con sole 右上角有(hscroot | help | log off )链接,单击log off ,会出现如下图所示注销界面:
选择Log off,系统返回到HMC初始登录界面状态。
3、重启HMC
左边导航栏中选择? HMC Management ? shut down or Restart ,如下图所示,对HM(进行正常重启及关机操作。
请谨慎对HM(进行关机和重启操作!
4、状态栏功能
状态栏位于HMC左下角位置,如下图所示,负责监控并反映管理系统资源状态和HMC 状态。
单击每个图标状态可以列出详细状态,你可以查到更详细的帮助信息: :非法操作,如果任何被管理的主机执行了非法操作,这个图标将会变亮
:黄灯警告,如果任何被管理的主机有错误并有黄灯被点亮,这个图标也将会变
亮
I一I:报错日志:日志中有报错信息,这个图标将会变亮,此项与
匕:摘要,摘要中会将有用信息做统计并显示在工作栏中。
5、Service Man ageme nt
导航栏中Service Managemen强大的管理功能给用户日常维护提供了更简单直观的界面,如下图所示,
但日平时最常用的子项是ManageServiceable Events,如下图步骤可以对HM(所管理的设备进行日常错误及时直观的观察,以确保IBM小型机能正常工作,下图就是基本
的操作方法图示:
Service Man ageme nt?Ma nage Serviceable Eve nts
6、Service Pla ns-分区管理与操作
如何查看小型机资源配置:
如上图红色标注所示,选中所需查看主机(备注:请不要同时选中多台主机及多个分区),在下拉菜单中选中“ Properties ”,打开参数窗口,通过“ Properties ”可以查看主机运行状态,CPU内存,I/O等重要硬件系统参数,如下图所示。
同理,在分区区域中先中每分区后的Properties选项,便可以直观方便的掌握分区状态和资源配置信息。
如何开关机及激活分区:
关机。
开机。
Operation项中主要包含小型机及分区开关机,及消除报警灯这两项功能,如虽要对小型机下电操作,请先将图15中的分区Deactivate (建议:最好在操作系统中按照正常流程将操作系统shutdown),最后再将主机power off 。
注意:非特殊情况,无专业人员指导,严禁进行开关机操作!手动消除黄灯警告
如下两图所示,Operations 中LED status,及Deactivate Attention LED 两项中所指,针对不同分区或主机所报出的警告黄灯,进行特定的消除黄灯操作。
如何打开控制终端(Terminal Window)
在HMC上对分区操作系统进行操作,可以通过分区下拉菜单Con sole Win dow-?Ope n Terminal Window对选中分区进行操作,如图所示,操作界面如同telnet界面。
在HMC中同一分区只允许打开一个Terminal Window如试图打开第二个窗口,系统提示如图17所示界面。
AIX系统日常维护
1、查看系统的错误记录
很重要,应该定期查看,如发现有硬件(H)类型的报错,应该及时关注。在系统运行时,一些系统错误会记录在errlog 中,其中有些错误还会在终端上显示。检查错误日志可用以下命令:#errpt | more 查看系统所有的记录
IDENTIFIER TIMESTAM P T C RESOURCE_NAME DESCRIPTION
errdemon ERROR LOGGING TURNED ON
errdemon ERROR LOGGING TURNED OFF
clstrmgr OPERATOR NOTIFICATION
其中
IDENTIFIER 为错误编号,当需要检查详细信息时常会用到。
TIME STAMP 为时间标签,它记录的是出错时间,其格式:月月日日时时分分年年 T 为Type ,它记录的是错误类型
P :为永久错误,需引起注意
T :为临时错误。
C 为Class, 它记录的是错误种类,如
H : Hardware
S : Software
O : Errloger comma nd messages U : un determ ined
RESOURCE_NAM S 错误来源
DESCRIPTION 为错误描述
#errpt -aj
其中IDENTIFIER 为错误编号,如 #errpt -aj
#errpt -dH 查看系统所有的硬件出错记录
2、日常检查服务器状态的项目及其相关命令
所列各种设备状态都应为 Available 。
列出系统中可用设备。 列出系统中的所有CPU 列出系统中的所有内存。 列出系统中的所有硬盘。 列出系统中的所有网卡
列出系统中的所有
列出系统中的所有
trouble fou nd ”显示各部分工作正常。 lsps 查看页面空间
lsps - a 查看PAGING SPAC 的使用情况,如果使用率超过 70%就需要采取措施
运行lsdev 命令配以各种参数,
#lsdev - C - H - S a
#lsdev - Cc processor
#lsdev - Cc memory
#lsdev - Cc disk #lsdev -Cc adapter | grep ent #lsdev -Cc adapter | grep scsi #lsdev -Cc adapter | grep ssa lspv 命令
SCSI 卡。
SSA PV 。
#lspv 显示系统中可用的 #lspv hdiskn 显示hdiskn 的具体信息。
#lsdev - Cc pdisk 显示磁盘阵列的硬盘的具体信息。
lsattr 命令
# lsattr - E
lsvg 命令
#lsvg
#lsvg rootvg #lsvg - o oslevel #oslevel n etstat
#n etstat 命令 命令 —in diag 命令
通过运行# diag -l memO 列出系统中内存 mem0勺大小, 列出系统中所有的vg 。 列出rootvg 的详细信息 列出激活的vg 丿
111、O
显示操作系统版本信息。 显示系统中各网卡的配置。可查看网卡的
本项目中内存有4GB IP 配置好了没有。 命令运行硬件诊断程序检测主机内所有硬件,检测结果为
“No