ibm p70小型机日常维护手册

合集下载

IBMPower740小型机+11G数据库维护教程

IBMPower740小型机+11G数据库维护教程

露露Power740小型机+11G数据库维护教程硬件环境:1、Power740小型机+AIX6.1操作系统2、数据库版本:oracle 11.2.0.43、数据库安装模式:Oracle11R2+ASM+RAC(集群负载)一、开机步骤1、打开Power740小型机1和2开关机开关两台服务器都要开机,在确定小型机电源处于关闭情况下开机,如果小型机处于开机状态跳过此步骤。

2、开启集群和数据库小机开机后集群和数据库自动启动,一般不需要手工启动。

Ping 192.168.0.31\32\33\34\35 -t ping通后查询数据库状态。

通过实际IP登录小机1登录方式1:windows开始菜单-运行 telnet 192.168.0.31登录方式2:远程连接小机工具登录方式3:直接在小机操作用户名:root 密码:root#su – grid 切换到grid网格用户$crs_stat –t 查询集群状态ORACLE正常工作状态:3个gsd进程是OFFLINE 其他进程都是ONLINE。

此时完成开机和数据库启动操作,应用程序可以正常使用。

如果等待30分钟还没有正常启动,启动出现异常,可执行以下操作:#su – grid$srvctl start nodeapps -n dbserver1$srvctl start nodeapps -n dbserver2$srvctl start asm -n dbserver2$srvctl start asm -n dbserver1$srvctl start database -d lolo单独启动监听srvctl start listener -n dbserver1srvctl start listener -n dbserver23、启动客户管理系统接口远程桌面192.168.1.24->露露运营绩效管理系统->业务查询->WEB定时任务->【启动任务】4、启动EM说明:EM为ORACLE数据库WEB管理,可以不启动,不启动不影响应用程序使用。

IBM小型机日常操作维护手册

IBM小型机日常操作维护手册

附件六IBM小型机日常操作维护手册目录一、报修 (3)二、开关机 (3)1 开机 (3)A 无分区: (3)B 有分区: (3)2 关机 (4)A 无分区 (4)B有分区 (4)三、日常维护 (4)四、系统备份(仅rootvg备份) (6)一、报修如果碰到硬件或者软件故障,请打IBM 800免费报修电话IBM硬件报修电话8008106677IBM软件报修电话8008101818-5004报修前需要准备:1)机器序列号(如9117-570 06348DA)2)客户单位3)客户联系人及电话4)机器所在城市5)问题描述6)相关日志二、开关机1 开机A 无分区:1)检查电源是否插好2)液晶面板出现“OK”字样,指示灯2秒钟闪烁一次,表示机器此时处在关机状态。

3)按下前面板上白色按钮后,主机会进入硬件自检和引导阶段;液晶面板会显示开机过程码,每一代码表示自检或引导的不同阶段,引导结束时,液晶面板代码消失,终端上有显示,进入AIX操作系统初始化,最后会出现登录提示。

4)如果主机长时间停留在某一代码上(大于20分钟),说明主机或操作系统有故障,请打IBM硬件保修电话8008106677,并提供相关代码。

B 有分区:5)检查电源是否插好6)在HMC中看Service Management里面对应服务器的状态,应为Power off状态7)选中对应的服务器,选中Power On, 选项为Partition to Standby,点击OK8)主机开始硬件自检,启动结束后,在HMC中看到对应的服务器为Standby状态9)选中该主机的对应分区,点击“Active”,启动分区2 关机A 无分区1)停应用2)shutdown -F停操作系统,如果机器全分区,液晶面板会显示停机过程码,最后出现“OK”字样,指示灯2秒钟闪烁一次。

表示停机过程结束。

如果只是需要重新启动,用“shutdown -Fr”命令。

B有分区1)停相关分区应用2)shutdown -F停相关分区3)在HMC中选中对应的服务器,选中Power Off,点击OK4)对应服务器的状态最终应为Power off状态三、日常维护首先对于机器的日常维护来说,要先观察机器的黄色报警灯是否亮起,如果报警灯亮起则登入操作系统使用以下的步骤进行查看:1)#errpt –dH(查看硬件错误日志,一般关心P、H类型的错误)ERROR_IDENTIFIER TIMESTAMP T C RESOURCE_NAME ERROR_DESCRIPTION0E017ED1 0405131090 P H mem2 Memory failure其中,TIMESTAMP代表日期,以MMDDhhmmYY格式;如0319131008表示2008年3月19日13时10分T(Type)一栏中,P表示永久性错误,T 表示零时性错误,U 表示不能决定是什么错误,I 表示信息而非错误。

小型机日常检查维护和备份

小型机日常检查维护和备份

三、日常检查维护1.文件系统是否满方法:df –k 可以以K为单位检查文件系统的使用率。

(90%以上,需要调整)df –m –groot@smk_exchange2:〉df -mFilesystem MB blocks Free %Used Iused %Iused Mounted on/dev/hd4 4096.00 4012.76 3%6152 1% //dev/hd2 8192。

00 6277。

69 24% 41437 3%/usr/dev/hd9var 8192.00 7947。

95 3% 7095 1%/var/dev/hd3 2048.00 1929.64 6%102 1%/tmp/dev/hd1 40960。

00 40451.16 2% 1775 1% /home/proc —- —- - /proc/dev/hd10opt 40960.00 40756.11 1% 8568 1% /optroot@smk_exchange2:〉df —gFilesystem GB blocks Free %Used Iused %Iused Mounted on/dev/hd4 4.00 3。

92 3% 6152 1%//dev/hd2 8。

00 6.13 24%41437 3%/usr/dev/hd9var 8。

00 7.76 3% 7095 1% /var/dev/hd3 2.00 1。

88 6% 102 1%/tmp/dev/hd1 40。

00 39。

50 2%1775 1% /home/proc —- - - - /proc/dev/hd10opt 40。

00 39。

80 1% 8568 1%/optroot@smk_exchange2:>“Iused"是什么意思?已使用的i-node,i-node是分配给文件系统的文件节点,它决定文件系统中文件和文件夹的总数.节点,文件系统下,每个文件,目录都需要的,如果节点用完了,就是该文件系统还有空间,也不能再往里面放东西了,节点和文件,目录一一对应的。

IBM小型机操作系统日常维护手册

IBM小型机操作系统日常维护手册

日常维护手册一.AIX操作系统常用命令1系统开关机AIX引导分为多用户(NORMAL)和单用户(SERVICE)引导两种。

多用户(NORMAL)引导:在主机液晶面板显示“OK”情况下,按下主机前面板的白色电源按钮;单用户(SERVICE)引导:将AIX第一张系统光盘放入CDROM,按下主机前面板的白色电源按钮,在屏幕出现显示后,第二声喇叭声响起之前,按下“5”键。

系统关机命令及顺序:1.将应用顺序及数据库系统停止;2.利用#shutdown指令;2设备查看命令a)lsdev命令该命令用来查看系统设备信息。

#lsdev –Cc 设备类型常用的设备类型有:processor, disk, adapter, tape,memory, tty等。

b)lspv命令用来查看系统硬盘信息。

#lspv 硬盘名用来查看具体硬盘的信息,#lspv -l 硬盘名用来查看硬盘上逻辑卷信息,#lspv –p 硬盘名查看该硬盘物理分区的信息。

c)lscfg命令该命令用来查看设备配置信息。

#lscfg –vl 设备名d)lsattr命令该命令用来查看设备的属性信息。

#lsattr -El设备名3逻辑卷操作命令a)lsvg该命令用来查看系统定义的VG(卷组)。

#lsvg -o查看系统当前激活的VG (卷组)。

#lsvg VG名查看该VG(卷组)的信息,包括PP大小、多少,已使用(分配)的空间,自由空间大小等信息。

#lsvg -l VG名查看该VG(卷组)已经定义的逻辑卷。

#lsvg -o |lsvg -il列出所有系统mount上的逻辑卷。

4文件系统操作命令a)lslv该命令用来列出该逻辑卷所有属性。

b)smitty crjfs该命令用来创建一个文件系统。

c)mount该命令用来查看已安装的文件系统。

#mount 文件系统名用来安装一个文件系统。

#mount -a用来安装所有定义的文件系统#unmount 文件系统名用来卸载一个文件系统。

IBM服务器维护手册

IBM服务器维护手册

[本帖最后由 mfkqwyc86 于 2010-11-4 12:32 编辑]__________________################################################################ ################################ 君子务本,本立而道生。

---mfkqwyc86,飞鹰工作室ITPUT个人空间:----------------------------------------------------------- 0 1.【Oracle RAC】Linux + Oracle 11g R2 RAC 安装配置详细过程02.【Oracle RAC】Oracle RAC更改VIP IP地址_2节点的实验03.【Oracle RAC】Oracle RAC删除一个节点_3节点的实验04.【Oracle RAC】Oracle RAC增加一个节点_3节点的实验05.【Oracle RAC+DG】Oracle RAC+ASM+DataGuard配置实验记录06.【Oracle RAC】Oracle RAC CRS、OCR、Voting破坏重建07.【Oracle 表分区管理】Oracle Partition表分区与分区索引几种方式的实验操作08.【IBM DB2表空间管理】db2表空间管理—实例讲解之精华09.【IBM DB2补丁升级】从升级到DB2 10.【中间件资料下载汇总】WebSphere,MQ,Portal,WebLogic资料下载汇总【PDF格式-共51类】只看该作者mfkqw yc86飞鹰工作室#2使用道具发表于 2010-11-4 12:22 跟贴说明:精华贴数 1个人空间 400 技术积分 826 (3079) 社区积分 28 (9086) 注册日期2007-4-28论坛徽章:1大家看了以下日常维护及故障处理汇总方法后,请大家在贴后跟上自己遇到过的错误问题,及解决方法!!第三类、故障定位、故障排除根据我们在实际商用系统中碰到问题,我们总结出了以下几种常见故障及其定位方式和解决方法。

IBMPower740小型机+11G数据库维护教程

IBMPower740小型机+11G数据库维护教程

IBMPower740小型机+11G数据库维护教程露露Power740小型机+11G数据库维护教程硬件环境:1、Power740小型机+AIX6.1操作系统2、数据库版本:oracle 11.2.0.43、数据库安装模式:Oracle11R2+ASM+RAC(集群负载)一、开机步骤1、打开Power740小型机1和2开关机开关两台服务器都要开机,在确定小型机电源处于关闭情况下开机,如果小型机处于开机状态跳过此步骤。

2、开启集群和数据库小机开机后集群和数据库自动启动,一般不需要手工启动。

Ping 192.168.0.31\32\33\34\35 -t ping通后查询数据库状态。

通过实际IP登录小机1登录方式1:windows开始菜单-运行 telnet 192.168.0.31登录方式2:远程连接小机工具登录方式3:直接在小机操作用户名:root 密码:root#su – grid 切换到grid网格用户$crs_stat –t 查询集群状态ORACLE正常工作状态:3个gsd进程是OFFLINE 其他进程都是ONLINE。

此时完成开机和数据库启动操作,应用程序可以正常使用。

如果等待30分钟还没有正常启动,启动出现异常,可执行以下操作:#su – grid$srvctl start nodeapps -n dbserver1$srvctl start nodeapps -n dbserver2$srvctl start asm -n dbserver2$srvctl start asm -n dbserver1$srvctl start database -d lolo单独启动监听srvctl start listener -n dbserver1srvctl start listener -n dbserver23、启动客户管理系统接口远程桌面192.168.1.24->露露运营绩效管理系统->业务查询->WEB定时任务->【启动任务】4、启动EM说明:EM为ORACLE数据库WEB管理,可以不启动,不启动不影响应用程序使用。

B小型机日常维护手册

B小型机日常维护手册

IBM P750小型机日常维护手册服务器硬件运行状态检查1. 当服务器处于启动和正常工作状态时,其前面板上的状态灯(与电源灯并排)和各硬盘的状态灯(一排小灯,与各硬盘位置一一对应)应显示为绿色。

2. 当服务器的状态灯出现橙黄色时,说明有硬件告警,此时要检查服务器的电源、接线、硬盘等。

如果有硬件故障则需要立即进行更换和更正,如果查不出具体问题,则需要联系相关专家进一步诊断。

3. 当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮,如该硬盘有读写操作,则绿灯会不规则闪烁,当硬盘损坏时,则硬盘状态灯将熄灭,或者呈闪烁状态:以1〜3秒的频率有规律地、不停地闪烁。

如果发现有服务器硬件状态灯不正常的情况,请及时联系我公司工程师,以便及时进行诊断并解决故障。

HM Q硬件管理平台)管理与操作HMC勺两种访问途径:1、在机房直接通过显示器和键盘进行管理维护等相关操作2、通过web远程访问,登录HMC we管理界面,访问地址为:1、登录HMC浏览器访问连接HM(后,首页界面如下图所示。

点击下图所示链接,进入HMC佥证登录界面。

输入用户名与口令,登录HMC用户名:hscroot口令:成功登录到HM(管理界面如下图所示。

2、注销HMC在HMC con sole 右上角有(hscroot | help | log off )链接,单击log off ,会出现如下图所示注销界面:选择Log off,系统返回到HMC初始登录界面状态。

3、重启HMC左边导航栏中选择? HMC Management ? shut down or Restart ,如下图所示,对HM(进行正常重启及关机操作。

请谨慎对HM(进行关机和重启操作!4、状态栏功能状态栏位于HMC左下角位置,如下图所示,负责监控并反映管理系统资源状态和HMC 状态。

单击每个图标状态可以列出详细状态,你可以查到更详细的帮助信息: :非法操作,如果任何被管理的主机执行了非法操作,这个图标将会变亮:黄灯警告,如果任何被管理的主机有错误并有黄灯被点亮,这个图标也将会变亮I一I:报错日志:日志中有报错信息,这个图标将会变亮,此项与匕:摘要,摘要中会将有用信息做统计并显示在工作栏中。

IBM小型机维护指导书V1[1].0

IBM小型机维护指导书V1[1].0

HUAWO江西建行IBM小型机日常维护第一篇:日常维护部分第二篇:故障处理部分第三篇:安图特公司技术支持电话HUAWEI第一篇日常维护部分目录第1章AIX系统管理日常工作(检查篇) (1)1.1 常用的命令 (1)1.2 语法介绍 (1)1.2.1 vmstat :检查内存、CPU、进程状态 (1)1.2.2 sar :检查CPU、IO (2)1.2.3 PS :检查进程状态命令 (3)1.2.4 svmon :显示进程占用内存 (3)1.2.5 iostat :显示磁盘IO (4)1.2.6 netstat, entstat : 显示网卡信息 (4)1.2.7 no:显示tcpip参数设置 (5)1.2.8 其它命令 (5)第2章AIX系统管理日常工作(LV篇) (6)2.1 IBM AIX系统管理的日常工作 (6)2.1.1 开关机步骤 (6)2.1.2 用户组及用户管理 (6)2.1.3 文件系统维护 (6)2.1.4 系统日常管理 (7)2.1.5 系统备份 (7)2.1.6 定时清洗磁带机 (7)2.1.7 定时检查设备指示灯状态 (7)2.1.8 简单故障的判断 (7)2.1.9 熟悉ibm aix 操作系统 (7)2.2 关于IBM AIX的逻辑卷管理 (7)2.3 LVM 命令 (8)第3章AIX系统管理日常工作(关键参数检查篇) (10)3.1 AIO参数检查 (10)3.2 磁盘阵列QUEUE _DEPTH参数检查 (11)3.3 用户参数检查 (11)HUAWEI3.4 激活SSA F AST -W RITE C ACHE (12)3.5 IO参数设置 (12)3.6 SYNCD DAEMON 的数据刷新频率 (12)3.7 检查系统硬盘的镜像 (12)第4章AIX系统管理日常工作(性能分析篇) (13)4.1 性能瓶颈定义 (13)4.2 性能范围 (14)第5章AIX系统管理日常工作(SHUTDOWN篇) (14)5.1 概念 (14)5.2 关机命令 (14)第6章AIX系统管理日常工作(备份与恢复篇) (15)6.1 用SMIT 备份 (15)6.2 手工备份 (15)6.3 恢复系统 (15)第7章HACMP的双机系统的管理和维护 (15)7.1 HACMP双机系统的启动 (15)7.2 HACMP双机系统的关闭 (16)7.3 察看双机系统的当前状态 (16)7.4 HACMP环境下的排错 (17)7.4.1 了解问题的存在 (17)7.4.2 判断问题的出处 (18)错误!文档中没有指定样式的文字。

IBM小型机维护手册

IBM小型机维护手册

IBM小型机维护手册一、AIX操作系统简介AIX操作系统是有IBM公司研发的Unix操作系统,在技术、功能上又有许多增强:模块化的内核;动态调整内核;多线索内核;高效率的输入/输出;实时处理;安全性能;日志文件系统;存储管理(包括镜像技术和条块化技术);系统管理;在线帮助查询。

二、设备管理2.1块设备(Block Device):采用结构化的随机访问方式的具有缓冲的设备。

块设备通常为磁盘文件系统(Disk File System)。

2.2字符设备(Character Device):裸设备(Raw Device),是无缓冲的连续、定向流设备。

字符设备通常为系统周边设备,如终端、打印机等。

2.3主设备号(Major Number):标识系统内核中的设备驱动号。

2.4次设备号(Minor Number):标识特殊的设备类型。

ODM数据库由预定义数据库(Predefined Database)和定制数据库(Customized Database)组成。

用于存储系统中所有逻辑设备的信息及其属性。

其中:预定义数据库:包含所有基于系统配置的系统可支持的设备(Supported Devices)的配置数据。

定制数据库:包含当前系统中所有定义的(Defined Devices)和可用的(Available Devices)设备配置数据。

设备的类(Class):标识设备设备的子类(Subclass):标识设备如何连接至系统设备的类型(Type):标识设备的类型设备的名字(Name):标识逻辑设备名# lsdev 设备列表# lsattr 设备属性列表# chdev 更改设备属性# lscfg 显示当前系统中设备的配置信息2.5设备的配置:# mkdev –c Class –s Subclass –t Type –p Parent_Adapter –w Connection_Location–a Attribute=value-c Class:指定设备所属的类(如:tape)-s Subclass:指定设备所属的子类(如:scsi)-t Type:指定设备所属的类型(如:150mb)-p Parent_Adapter:指定设备的父卡号(如:scsi0)-w Connection_Location:指定设备连接在父卡上的位置或地址(如:5,0)-a Attribute=value:指定设备的属性(如:ret=no)2.6设备的状态:Undefined:系统中没有此设备的存在记录(设备信息存储于预定义数据库中)(Supported)Defined:系统已为此设备分配了逻辑设备名和端口,但系统当前不能访问此设备(设备信息存储于定制数据库中)(Defined)Available:设备在系统中已经定义了并且可以使用(设备信息存储于定制数据库中)(Available)# cfgmgr自动配置系统中的自适应设备(Self-Configuring Devices)三、存储管理3.1AIX中逻辑存储的限制卷组(VG) 255个/每个系统物理卷(PV)32个/每个卷组物理分区(PP)1016个/每个物理卷逻辑卷(LV)256个/每个卷组逻辑分区(LP)32512个/每个逻辑卷AIX系统逻辑卷:Paging Space:/dev/hd6,用于存储虚拟内存中信息的固定的磁盘空间Journal Log:/dev/hd8,用于记录系统中文件系统结构的改变Boot LV:/dev/hd5,用于系统启动映象的物理上连续的磁盘空间AIX系统文件系统:/(root):系统启动进程所需的重要的系统设备信息及应用程序的存储空间/usr:/dev/hd2,系统命令、信息库以及应用程序的存储空间/var:/dev/hd9var,系统的日志文件和打印数据文件的存储空间/home:/dev/hd1,系统中用户数据的存储空间/tmp:/dev/hd3,系统临时文件和用户工作的存储空间3.2LVM操作命令:# lsvg 查看系统中属于活动VG的LV的信息# lslv 查看属于指定LV的信息时,系统将给出指定LV的LP数及其拷贝数。

IBM小型机巡检维护常用命令

IBM小型机巡检维护常用命令

IBM小型机巡检常用命令Errpt 查看错误日志。

Errpt |head 查看最近产生的错误日志。

Errpt –d H |more 查看关于硬件报错的日志。

Errpt –aj查看错误详细信息,“错误的标识号”。

Errpt –a –j ****(日志ID)查看某个日志的详细内容。

Uptime 查看机器总共运行的时间。

Uname –uM 查看机器的型号。

Uname –a 列出系统ID号,系统名称,os版本等信息。

Oslevel –s 查看机器的系统版本等级。

Oslevel –r 查看补丁。

Instfix –i grep查找补丁文件。

Lscfg –vp 检查所有设备的微码。

Lsvg –o 查看系统卷组。

Ls –l/image.date 查看系统有没有备份image文件,记录备份最后日期。

Lsvg –l rootvg 查看rootvg卷的详细信息,查看又符合要求的数据备份和保护。

Syncvg 修复“stale”状态的逻辑卷。

Lsvg –p rootvg 使卷组文件同步。

Bootinfo –k 查看系统内核版本是64位还是32位。

Bootlist –m –normal –o 查看显示当前的首选启动项。

Bootlist –m –normal cd0 设置当前的首选启动项为cd0.Lslv –l datalv 和lslv –p datalv 显示逻辑卷各种信息,如包括哪些盘,是否有镜像等。

Lslv –m hd5 找出bootimage所在的硬盘,如hdisk0.Bosboot –ad /dev/hdisk0Bootlist –m normal /dev/hdisk0 重建启动顺序表。

Sysdumpdev –l系统的Dump设置,可以用来修改和查询。

Sysdumpdev P p /dev/hd6 s /dev/sysdumpnull 。

Sysdumpdev -P -cLsps –a显示所使用的分页空间。

Lsps –s 检查内存交换区(paging space)使用率是否超过70%。

IBM小型机巡检维护常用命令

IBM小型机巡检维护常用命令

IBM小型机巡检常用命令Errpt 查看错误日志。

Errpt |head 查看最近产生的错误日志。

Errpt –d H |more 查看关于硬件报错的日志。

Errpt –aj查看错误详细信息,“错误的标识号”。

Errpt –a –j ****(日志ID)查看某个日志的详细内容。

Uptime 查看机器总共运行的时间。

Uname –uM 查看机器的型号。

Uname –a 列出系统ID号,系统名称,os版本等信息。

Oslevel –s 查看机器的系统版本等级。

Oslevel –r 查看补丁。

Instfix –i grep查找补丁文件。

Lscfg –vp 检查所有设备的微码。

Lsvg –o 查看系统卷组。

Ls –l/image.date 查看系统有没有备份image文件,记录备份最后日期。

Lsvg –l rootvg 查看rootvg卷的详细信息,查看又符合要求的数据备份和保护。

Syncvg 修复“stale”状态的逻辑卷。

Lsvg –p rootvg 使卷组文件同步。

Bootinfo –k 查看系统内核版本是64位还是32位。

Bootlist –m –normal –o 查看显示当前的首选启动项。

Bootlist –m –normal cd0 设置当前的首选启动项为cd0.Lslv –l datalv 和lslv –p datalv 显示逻辑卷各种信息,如包括哪些盘,是否有镜像等。

Lslv –m hd5 找出bootimage所在的硬盘,如hdisk0.Bosboot –ad /dev/hdisk0Bootlist –m normal /dev/hdisk0 重建启动顺序表。

Sysdumpdev –l系统的Dump设置,可以用来修改和查询。

Sysdumpdev P p /dev/hd6 s /dev/sysdumpnull 。

Sysdumpdev -P -cLsps –a显示所使用的分页空间。

Lsps –s 检查内存交换区(paging space)使用率是否超过70%。

IBM-小型机日常管理和故障处理

IBM-小型机日常管理和故障处理
37
故障处理---故障的定义
弄清楚系统发生了什么问题
– 系统现在能做什么?不能做什么? – 故障什么时候发生的? – 有没有做平时不同的操作? – 故障有没有规律?定时还是不定时?发生的频率有多高? – 是一台机器出现故障还是多台机器故障?故障现象是否相同? – 最近有没有做改动?如安装了新的硬件、软件,改变了系统
Detail Data SENSE DATA 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
13
HMC的使用
14
HMC 使用
Hardware Management Console – 进行P系列小型机的硬件管理、维护,以及逻
8
系统健康检查
#lsattr –El inet0
authm
65536
Authentication Methods
True
hostname
qtsms
Host Name
True
gateway
Gateway
True
route
net,,0,172.40.10.1 Route
True
bootup_option no
Serial Optical Network Interface True
rout6
FDDI Network Interface
True
route属性是否有相应的路由信息。格式为:net,,0,172.16.23.81 如果没有缺省路由,执行命令:
#chdev –l inet0 –a route=0,172.16.23.81 其中172.16.23.81为网关 如果缺省路由不正确,则先删除路由,再增加缺省路由:

IBM小型机维护指导书V1[1]

IBM小型机维护指导书V1[1]

I B M小型机维护指导书V1[1](总42页)-CAL-FENGHAI.-(YICAI)-Company One1-CAL-本页仅作为文档封面,使用请直接删除江西建行IBM小型机日常维护第一篇:日常维护部分第二篇:故障处理部分第三篇:安图特公司技术支持电话第一篇日常维护部分目录第1章AIX系统管理日常工作(检查篇) ........................... 错误!未指定书签。

1.1 常用的命令............................................... 错误!未指定书签。

1.2 语法介绍................................................. 错误!未指定书签。

1.2.1 vmstat:检查内存、CPU、进程状态...................... 错误!未指定书签。

1.2.2 sar:检查CPU、IO ...................................... 错误!未指定书签。

1.2.3 PS:检查进程状态命令................................. 错误!未指定书签。

1.2.4 svmon:显示进程占用内存................................ 错误!未指定书签。

1.2.5 iostat:显示磁盘IO .................................... 错误!未指定书签。

1.2.6 netstat, entstat:显示网卡信息......................... 错误!未指定书签。

1.2.7 no:显示tcpip参数设置................................. 错误!未指定书签。

1.2.8 其它命令............................................. 错误!未指定书签。

银行付费小型机日常维护手册(上)

银行付费小型机日常维护手册(上)

小型机日常维护手册个人原创编写,如果有不合适,欢迎大家批评指正目 录一. 设备环境介绍 (2)二. 系统操作 (5)三. 巡检操作 (8)四. 常用操作 (13)五. 日常事务 ..................................... 错误!未定义书签。

六. 常用命令 ..................................... 错误!未定义书签。

一. 设备环境介绍设备型号:IBM P740 8205-E6C设备功能介绍:本项目为:全省操作风险管理系统工程, 小型机主要承担授权数据库与事后监督数据库稳定运行与备份的任务。

其中两台小型机采用互为备份方式:设备拓扑简介设备连接介绍:每个地市数据中心采用 2 台 IBM Power 740 小型机服务器运行数据库系 统,分别运行 HACMP 软件,配置成双机互备系统,保证系统的高可靠性。

2 台 IBM Power 740 分别通过 2 根光纤连接到 2 台存储光纤交换机,2 台磁盘阵列通过 2 根光纤连接到 2 台存储光纤交换机,如此连接即保证了可靠性,又提高了数据访问的效率。

设备磁盘管控:小型机 1 主机名为:tyxxdb1, (HMC 管理 IP 为 1.1.1.5)自身拥有 IP 10.0.31.1, 默认提供数据库名为 TYSQDB 的服务服务 IP 为 10.0.31.3 默认挂载磁盘/tysqdbdata 和 /rmansq小型机 2 主机名为:tyxxdb2, (HMC 管理 IP 为 1.1.1.6) 自身拥有 IP 10.0.31.2, 默认提供数据库名为 TYSQDB 的服务 服务 IP 为 10.0.31.4 默认挂载磁盘/tyhddbdata 和 /rmanhd挂载的磁盘/tysqdbdata 分配空间为: 750G/rmansq 分配空间为: 875G挂载的磁盘/tyhddbdata 分配空间为: 1150G/rmanhd 分配空间为: 1275G二. 系统操作系统开关机,检查硬件有无故障。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

IBM P750小型机日常维护手册一、服务器硬件运行状态检查1.当服务器处于启动和正常工作状态时,其前面板上的状态灯(与电源灯并排)和各硬盘的状态灯(一排小灯,与各硬盘位置一一对应)应显示为绿色。

2.当服务器的状态灯出现橙黄色时,说明有硬件告警,此时要检查服务器的电源、接线、硬盘等。

如果有硬件故障则需要立即进行更换和更正,如果查不出具体问题,则需要联系相关专家进一步诊断。

3.当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮,如该硬盘有读写操作,则绿灯会不规则闪烁,当硬盘损坏时,则硬盘状态灯将熄灭,或者呈闪烁状态:以1~3秒的频率有规律地、不停地闪烁。

如果发现有服务器硬件状态灯不正常的情况,请及时联系我公司工程师,以便及时进行诊断并解决故障。

二、HMC(硬件管理平台)管理与操作HMC的两种访问途径:1、在机房直接通过显示器和键盘进行管理维护等相关操作2、通过web远程访问,登录HMC web管理界面,访问地址为:1、登录HMC1.1 浏览器访问连接HMC后,首页界面如下图所示。

1.2 点击下图所示链接,进入HMC验证登录界面。

1.3 输入用户名与口令,登录HMC。

用户名:hscroot口令:1.4 成功登录到HMC管理界面如下图所示。

2、注销HMC在HMC console右上角有(hscroot | help | log off)链接,单击log off,会出现如下图所示注销界面:选择Log off,系统返回到HMC初始登录界面状态。

3、重启HMC左边导航栏中选择→ HMC Management → shut down or Restart,如下图所示,对HMC进行正常重启及关机操作。

请谨慎对HMC进行关机和重启操作!4、状态栏功能状态栏位于HMC左下角位置,如下图所示,负责监控并反映管理系统资源状态和HMC状态。

单击每个图标状态可以列出详细状态,你可以查到更详细的帮助信息::非法操作,如果任何被管理的主机执行了非法操作,这个图标将会变亮。

:黄灯警告, 如果任何被管理的主机有错误并有黄灯被点亮,这个图标也将会变亮:报错日志:日志中有报错信息,这个图标将会变亮,此项与:摘要,摘要中会将有用信息做统计并显示在工作栏中。

5、Service Management导航栏中Service Management强大的管理功能给用户日常维护提供了更简单直观的界面,如下图所示,但日平时最常用的子项是Manage Serviceable Events,如下图步骤可以对HMC所管理的设备进行日常错误及时直观的观察,以确保IBM小型机能正常工作,下图就是基本的操作方法图示:Service Management→Manage Serviceable Events6、Service Plans-分区管理与操作6.1 如何查看小型机资源配置:如上图红色标注所示,选中所需查看主机(备注:请不要同时选中多台主机及多个分区),在下拉菜单中选中“Properties”,打开参数窗口,通过“Properties”可以查看主机运行状态,CPU,内存,I/0等重要硬件系统参数,如下图所示。

同理,在分区区域中先中每分区后的Properties选项,便可以直观方便的掌握分区状态和资源配置信息。

6.2 如何开关机及激活分区:关机。

开机。

Operation项中主要包含小型机及分区开关机,及消除报警灯这两项功能,如虽要对小型机下电操作,请先将图15中的分区Deactivate(建议:最好在操作系统中按照正常流程将操作系统shutdown),最后再将主机power off。

注意:非特殊情况,无专业人员指导,严禁进行开关机操作!6.3 手动消除黄灯警告如下两图所示,Operations中LED status,及Deactivate Attention LED两项中所指,针对不同分区或主机所报出的警告黄灯,进行特定的消除黄灯操作。

6.4 如何打开控制终端(Terminal Window)在HMC上对分区操作系统进行操作,可以通过分区下拉菜单Console Window- Open Terminal Window对选中分区进行操作,如图所示,操作界面如同telnet界面。

在HMC中同一分区只允许打开一个Terminal Window,如试图打开第二个窗口,系统提示如图17所示界面。

三、AIX系统日常维护1、查看系统的错误记录很重要,应该定期查看,如发现有硬件(H)类型的报错,应该及时关注。

在系统运行时,一些系统错误会记录在errlog 中,其中有些错误还会在终端上显示。

检查错误日志可用以下命令:#errpt | more 查看系统所有的记录IDENTIFIER TIMESTAM P T C RESOURCE_NAME DESCRIPTION errdemon ERROR LOGGING TURNED ONerrdemon ERROR LOGGING TURNED OFFclstrmgr OPERATOR NOTIFICATION其中IDENTIFIER 为错误编号,当需要检查详细信息时常会用到。

TIME STAMP 为时间标签,它记录的是出错时间,其格式:月月日日时时分分年年T 为Type , 它记录的是错误类型P :为永久错误,需引起注意T :为临时错误。

C 为Class, 它记录的是错误种类,如H : HardwareS : SoftwareO : Errloger command messagesU : undeterminedRESOURCE_NAME 为错误来源DESCRIPTION 为错误描述#errpt -aj <IDENTIFIER> 查看系统详细记录内容其中IDENTIFIER为错误编号,如#errpt -aj#errpt -dH 查看系统所有的硬件出错记录2、日常检查服务器状态的项目及其相关命令2.1 运行lsdev 命令配以各种参数,所列各种设备状态都应为Available。

#lsdev –C –H –S a 列出系统中可用设备。

#lsdev –Cc processor 列出系统中的所有CPU。

#lsdev –Cc memory 列出系统中的所有内存。

#lsdev –Cc disk 列出系统中的所有硬盘。

#lsdev -Cc adapter | grep ent 列出系统中的所有网卡#lsdev -Cc adapter | grep scsi 列出系统中的所有SCSI卡。

#lsdev -Cc adapter | grep ssa 列出系统中的所有SSA卡。

2.2 lspv命令#lspv 显示系统中可用的PV。

#lspv hdiskn 显示hdiskn的具体信息。

#lsdev –Cc pdisk 显示磁盘阵列的硬盘的具体信息。

2.3 lsattr命令# lsattr –E –l mem0 列出系统中内存mem0的大小,本项目中内存有4GB。

2.4 lsvg命令#lsvg 列出系统中所有的vg。

#lsvg rootvg 列出rootvg的详细信息。

#lsvg –o 列出激活的vg2.5 oslevel命令#oslevel 显示操作系统版本信息。

2.6 netstat命令#netstat –in 显示系统中各网卡的配置。

可查看网卡的IP配置好了没有。

2.7 diag命令通过运行# diag 命令运行硬件诊断程序检测主机内所有硬件,检测结果为“No trouble found ”显示各部分工作正常。

2.8 lsps查看页面空间lsps –a 查看PAGING SPACE的使用情况,如果使用率超过70%,就需要采取措施。

2.9 查看LV(卷)状态lsvg –o | lsvg –il | grep –i stale查看有无stale的lv,如果输入该命令之后有输出结果,就需要采取措施2.10 查看mail# mail,查看有否发给root用户的错误报告(mail)。

3、检查文件系统查看有没有“满”的文件系统。

文件系统满可导致系统不能正常工作,尤其是AIX的基本文件系统。

如/ (根文件系统)满则会导致用户不能登录。

# df -k (查看AIX的基本文件系统)Filesystem 1024-blocks Free %Used Iused %Iused Mounted on/dev/hd4 24576 1452 95% 2599 22% //dev/hd2 614400 28068 96% 22967 15% /usr/dev/hd9var 8192 4540 45% 649 32% /var/dev/hd3 167936 157968 6% 89 1% /tmp/dev/hd1 16384 5332 68% 1402 35% /home除/usr文件系统,其他文件系统都不应太满,一般不超过80%。

4、性能监控与调优4.1 通过topas来观察topas能够将系统的全局信息,包括CPU、内存、磁盘、网络、文件系统、事件队列、文件等信息,排列在一个统一的界面上进行展示。

bash-4.3# topasTopas Monitor for host:localhost EVENTS/QUEUES FILE/TTYWed Feb 22 10:42:00 2017 Interval:2 Cswitch ReadchSyscall WritechCPU User% Kern% Wait% Idle% Reads RawinWrites TtyoutForks IgetsNetwork BPS I-Pkts O-Pkts B-In B-Out Execs NameiRunqueue DirblkWaitqueueDisk Busy% BPS TPS B-Read B-Writ MEMORYPAGING Real,MBFaults % CompFileSystem BPS TPS B-Read B-Writ Steals % NoncompPgspIn % ClientPgspOutName PID CPU% PgSp Owner PageIn PAGING SPACEPageOut Size,MBSios % Used% FreeNFS (calls/sec)SerV2 WPAR ActivCliV2 WPAR TotalSerV3 Press: "h"-helpCliV3 "q"-quitSerV44.2 通过命令vmstat 1 来观察.kthr memory page faults cpu----- ----------- ------------------------ ------------ -----------r b avm fre re pi po fr sr cy in sy cs us sy id wa命令解析:vmstat 命令的输出可以反映系统整体运行状况,包括cpu、内存、虚拟页面、系统进程和系统调用情况。

相关文档
最新文档