SUN 巡检命令
SUN日常维护手册
SUN日常维护手册Sun日常维护手册(v 20131108)版本说明目录目录版本说明 (2)一、机房环境检查 (6)1.机房温度 (6)2.机房湿度 (6)3.机房洁净度 (6)二、主机硬件运行情况检查 (7)1.主机状态灯检查 (7)1.1 SUN SPARC Server Front Panel LEDs (7) 1.2 SUN SPARC Server Rear Panel LEDs (8)1.3 SUN SPARC Server Disk Drive LEDs (9)2、主机硬件配置及运行状态检查 (9)2.1 CPU配置检查 (9)2.2 内存配置检查 (10)2.3 内置硬盘配置检查 (12)2.4 网卡配置检查 (13)2.5 风扇情况检查 (15)2.6 系统日志检查 (16)三、存储设备运行情况检查 (17)1.Sun StorEdge A1000系列 (17)2.Sun StorEdge 3510系列 (17) 3.Sun StorageTek 6140系列 (18) 四、Solaris操作系统运行状态检查 (21) 1.操作系统版本 (21)2.文件系统类型 (22)2.1 UFS (Unix File system) (23)2.2 VXFS (Veritas File System) (23) 2.3 ZFS (Zettabyte File System) (24) 3.卷管理和数据镜像 (25)3.1 SVM卷管理 (25)3.2 VXVM卷管理 (27)3.3 ZFS卷管理 (30)4.多路径检查 (30)4.1 多路径配置文件 (30)4.2 多路径状态检查 (31)5.系统性能运行检查 (31)5.1 CPU使用情况检查 (31)5.2 内存使用情况检查 (32)5.3 I/O使用情况检查 (34)五、双机Cluster运行状态检查 (35)1. Sun Cluster (35)2. Veritas Cluster (39)六、故障诊断信息收集 (42) 1.Power-On Self Test (POST) (42) 2.Sun Explorer (43)七、日常维护周期策略 (43)1.日维护内容 (43)1.1 机房环境 (43)1.2 硬件状态 (46)1.3 系统状态 (47)1.4 集群状态 (49)1.5 性能和安全 (49)1.6 磁盘阵列存储状态 (51)2.周维护内容 (52)2.1 机房环境 (52)2.2 硬件状态 (52)2.3 系统状态 (53)2.4 集群状态 (53)2.5 性能和安全 (53)2.6 补丁 (53)2.7 磁盘阵列存储状态 (53)3.月维护内容 (55)3.1 机房环境 (55)3.2 硬件状态 (55)3.3 系统状态 (55)3.4 集群状态 (55)3.5 性能和安全 (55)3.6 补丁 (55)3.7 磁盘阵列存储状态 (56)八、附录 (56)8.1. ILOM巡检指导v1.0 (56)8.2. XSCF 巡检操作指导v1.0 (58)8.2 SC 巡检操作指导v1.0 (64)一、机房环境检查机房的温度,湿度和洁净度是否合理,将会直接影响到设备的正常运作,如果机房的温度过高,湿度过于干燥,灰尘过多的话将会直接影响设备的使用寿命,因此平时对机房的健康和检查也是必不可少的。
sun服务器硬件巡检
sun服务器硬件巡检目录:1.引言2.硬件巡检步骤2.1.服务器电源和电缆检查2.2.内存状态检查2.3.硬盘状态检查2.4.CPU状态检查2.5.网络连接状态检查2.6.风扇状态检查2.7.控制器和适配器状态检查2.8.其他硬件部件检查3.巡检报告4.附件5.法律名词及注释6.结束语1.引言本文档旨在提供一份详细的Sun服务器硬件巡检指南,以确保服务器在正常运行状态下,并发现并解决潜在的问题。
2.硬件巡检步骤在进行硬件巡检之前,请确保您已熟悉Sun服务器的基本硬件组成和操作方式。
2.1.服务器电源和电缆检查●确保服务器的电源线连接牢固,且电源插座正常供电。
●检查电源线是否有断裂、变形或其他损坏情况。
●检查服务器各个电缆连接是否牢固、接触良好。
2.2.内存状态检查●查看服务器的内存卡插槽,确保所有内存模块安装正确。
●使用服务器管理工具检查内存模块状态,确保无错误或故障。
2.3.硬盘状态检查●检查所有硬盘驱动器是否正确插入服务器的托架中。
●使用服务器管理工具检查硬盘状态,确保无错误或故障。
●检查磁盘LED指示灯是否正常工作。
2.4.CPU状态检查●检查服务器的CPU插槽,确保CPU安装正确。
●使用服务器管理工具检查CPU状态,确保无错误或故障。
2.5.网络连接状态检查●检查服务器的网络适配器是否正确连接到网络交换机。
●使用服务器管理工具检查网络适配器状态,确保无错误或故障。
2.6.风扇状态检查●检查服务器的风扇模块是否正常工作并保持清洁。
●使用服务器管理工具检查风扇状态,确保无错误或故障。
2.7.控制器和适配器状态检查●检查服务器的控制器和适配器是否正常工作。
●使用服务器管理工具检查控制器和适配器状态,确保无错误或故障。
2.8.其他硬件部件检查●检查服务器的其他硬件部件,如电池、电路板等,是否正常工作。
●使用服务器管理工具检查这些硬件部件的状态,确保无错误或故障。
3.巡检报告完成硬件巡检后,根据检查结果撰写一份巡检报告,包括以下内容:●巡检日期和时间●检查的硬件部件和步骤●发现的问题和错误●解决方案或建议4.附件本文档涉及的附件包括:●服务器硬件规格表●服务器管理工具使用手册5.法律名词及注释本文档所涉及的法律名词及其注释如下:●无6.结束语本文档提供了一份详细的Sun服务器硬件巡检指南,通过按照指南中的步骤进行巡检,您可以确保服务器的正常运行,并及时发现和解决问题。
系统巡检命令---详解
1、查看硬盘空间#df –k ----Eg: #df –k文件系统千字节用了可用容量挂接在/dev/dsk/c1t2d0s0 8065025 5136628 2847747 65% //dev/dsk/c1t2d0s6 4032504 3779805 212374 95% /usr/proc 0 0 0 0% /procfd 0 0 0 0% /dev/fdmnttab 0 0 0 0% /etc/mnttab/dev/dsk/c1t2d0s1 3008649 394412 2554065 14% /varswap 800224 16 800208 1% /var/runswap 6402200 5601992 800208 88% /tmp/dev/dsk/c1t2d0s5 10080200 5920601 4058797 60% /opt/dev/dsk/c1t2d0s7 3581797 1191182 2354798 34% /export/home/dev/dsk/c3t1d0s0 278587934 43606265 232195790 16% /opt/informix/chk说明:如果磁盘使用量超过80%则需要注意。
使用du 查看相关文件大小。
转移到其它地方。
2、查看系统日志------系统诊断记录# dmesgEg: #dmesg2007年10月26日星期五13时33分32秒CSTSep 26 14:22:13 basedb rootnex: [ID 466748 ] root nexus = Sun Enterprise 450 (4 X UltraSPARC-II 480MHz)Sep 26 14:22:13 basedb rootnex: [ID 349649 ] pcipsy0 at root: UPA 0x1f 0x4000 Sep 26 14:22:13 basedb genunix: [ID 936769 ] pcipsy0 is /pci@1f,4000Sep 26 14:22:13 basedb rootnex: [ID 349649 ] pcipsy1 at root: UPA 0x1f 0x2000说明:查看其中警告信息和错误信息,对有硬件描述的特别关注。
巡检用到的命令
/var/spool/cron查看对时服务 crontab -l
查日志
var/adm
var/log
uptime 系统运行时间
vmstat 查看内存
prstat -a
swap -s
Solaris 10
bash
cat /etc/release 系统版本
1133 ls
ps -ef |grep java
ps -ef |grep web 查看pid文件 solaris操作系统
ps -ef |grep servername
/sbin/ifconfig -a查看网络配置
查看NFS文件共享cat /etc/exports
查看防火墙状态 service iptables status
程序必须以下面的行开始(必须方在文件的第一行):
#! /bin/sh
符号#!用来告诉系统它后面的参数是用来执行该文件的程序。在这个例子中我们使用/bin/sh来执行程序。
当编辑好脚本时,要想执行脚本,必须使脚本可以执行
下面的命令,可以使脚本可以执行
chmod +x filename 或 chmod 755 filename
一,
1,
Cmd 输入 netstat –ano
可以看到
2,
例如我查80端口被什么占用了 对应的进程id是 3600
再输入tasklist来查看 pid 3600是哪个进程什么程序在跑
3,
可以很快看到是tomcat6在用pid 3600 也即此占用了80端口
此时可以用 taskkill /pid 3600 /t /f 快速关闭此进程
SUN小型机日常巡检表
#netstat -a
#netstat –r
记录结果
巡检结论
项目经理意见
甲方代表意见
巡检人:______________厂方确认______________
日期:______________日期:____________
主机硬件检测
检查操作
参考标准
结果信息
在主机上检查整个系统状态
/usr/platform/sun4u/sbin
/prtdiag –v
检查系统中CPU风扇电源温度等各个方面状态并提示No failures found in System
检查Netra系列风扇电源状
态(根据现场情况)
lominfo fan;lominfo psu
空闲内存应大于50M
进程数检查
1、以root用户执行:
top,查看第二行
process参数;2、ps -
elf查看第二列中有无ZБайду номын сангаас
的进程
1.系统总进程数应小于200个, 2.无僵死(zombie)进程
内存交换区使用检查
以root用户执行:
swap -l
内存交换区的使用率应小于90%
CPU资源检查
以root用户执行:top
Cluster3.2中网卡状态检查
hastat | more
1、公网状态应为:
Status = OK
2、私网状态为
interconnect不为Down即
可
Cluster3.2的状态检查
执行命令 scstat
所有节点都在cluster中 所有的私网都为up 所有resoure group及resoure都为online状态
solaris巡检
2.hostname 主机名
3.df -h 使用不要超过85%
4.prtdiag -v |more 查看CPU、内存、插槽、硬盘、电源、CPU温度和风扇等信息有无报错
/usr/platform/sun4u/sbin/prtdiag -v(旧版本)
5.format 查看系统硬盘,有无unknown
more/var/adm/messages* |grep panic |more 查看系统日志报错
16./opt/SUNWexplo/bin/explorer 收集系统信息包
10.eeprom 查看OBP参数配置
11.metadb
metastat -p
metastat 查看系统软raid
12.raidctl -l 查看系统硬raid
Байду номын сангаас
13.vxdisk list
vxdg list
vxprint -ht -g rootdg VxVM(卷管理)状态
6.iostat -En 查看硬盘hard error是否过多
7.ifconfig -a
netstat -in
netstat -rn 查看系统网络配置
8.cat /etc/release
uname -a 查看系统版本
9.swap -s
swap -l 查看交换分区
14.scstat
hastat -sum 查看双机状态
15.more/var/adm/messages* |grep error |more
more/var/adm/messages* |grep failed |more
sun cluster 常用命令
pnmset
pnmset -c nafo0 -o remove qfe0
Switching active adaptor
pnmset
pnmset -c nafo0 -o switch qfe0 (Adaptor to switchto)
Check status
pnmset
pnmset -l
scrgadm -a -g my-rg -h nodeA,nodeB [ -y Pathprefix=/my-directory ]
Add resource to Group
scrgadm -a -j my-res -g my-rg -t SUNW.nfs -x ServicePaths=/my-directory
Register change to disk group
scconf
scconf -c -D name=mydg,sync
Switch device group to a node
scswitch
scswitch -z -D mydg -h nodeA (node to switchto)
Check status
1. scswitch
scswitch -S -h nodeA (switch resources)
2. shutdown
shutdown -y -g30 -i0
Rebooting a node
1. scswitch
scswitch -S -h nodeA (switch resources)
2. shutdown
Add a quorum device
scconf
scconf -a -q globaldev=d12
主机巡检指南-整理版
主机巡检机房温度机房内一般都有温度湿度计,通过温度计查看机房温度是否正常,一般保持在21到24摄氏度即可。
IBM小型机巡检命令1、查看前面板告警灯是否正常1)通过直接到机房查看机器前面板是否有黄色告警灯;2)通过命令查看:#/usr/lpp/diagnostics/bin/usysfault如果返回fault,说明有告警灯,如果返回为normal,说明无告警灯。
有告警灯说明机器在运行过程中可能出现过不正常的现象,不能说明机器有故障,是否有故障,要具体查看错误日志。
如果有告警灯,需要清除告警灯,清除方法:#/usr/lpp/diagnostics/bin/usysfault -s normal2、查看是否有错误日志#errpt该命令显示有错误的类型,如果错误为P H,就需要关注,有可能有硬件错误,还需要关注发生错误的时间,如果是很久以前的错误,有可能是以前的故障,维修完后没有清除错误日志。
每个错误前有一个错误ID,查看具体的某个错误详细信息,输入命令:#errpt -aj 错误ID如果要查看所有错误的详细信息,输入命令:#errpt -a这个命令的输出可能较多,是所有错误日志的详细信息输出。
建议在后面加上参数,使用分屏查看,命令如下:#errpt -a | more (空格键翻页) 或者#errpt -a | pg (回车键翻页)#errclear 0 清除错误日志3、查看是否有mail故障系统运行中,如果出现不正常情况,会给root用户发送mail,通过命令:#mail可以查看是否有root用户的mail,一般root用户的mail保存在/var/spool/mail/root文件中,可以通过more或者vi查看。
命令如下:#more /var/spool/mail/root 或#vi /var/spool/mail/root (退出vi,先按esc,再输入:q! 回车)4、查看文件系统是否满文件系统达到100%,不及时处理,可能引起系统宕机,查看方法:#df -k如果占用率达90%以上,需马上处理或清理垃圾文件,如果清理后还很大,需扩容文件系统来保证系统正常运行。
巡检必要命令各种解释
巡检必要命令配置与软件1. show running-config2. show versionCPU与内存3. show process cpu4. show process memory风扇、电源5. show environment alarm #查看设备环境告警#6. show environment temperatures #查看各插槽热点温度#7. show environment cooling al #查看风扇数量、状态、转速(cfm)#8. show power #查看电源数量、各板卡消耗功率#模块、SN号9. show module #查看引擎/线路卡/子卡的状态#10. show inventory #查看机箱中各模块名称、SN号#11. show hw-module subslot all oir #查看子模块是否工作正常#日志信息12. show logging巡检可选命令CASE排障1. show tech-support接口控制器状态2. show controllers pos #查看POS接口低层信息,包括光衰减#接口状态3. showip interface [brief]4. show interfacesVLAN信息5. showvlan brief6. showip interfaces brief | iVlan冗余性7. show redundancy #查看引擎的主备统计信息、使用的冗余模式等#show redundancy switchover history #查看主备切换历史记录#文件系统8. show file systems #查看文件系统结构,带*的为默认FS#9. show disk0:#查看特定文件系统中的内容#10. show bootvar #查看引导变量#11. dir、pwd、cd等Unix命令系统崩溃(crash)信息12. show context #查看crash历史信息#13. dir /all bootflash: #查看是否有名为crashinfo 的崩溃信息文件#14. show file information bootflash:crashinfo #查看崩溃信息文件内容# Debug信息15. show debug时钟信息16. show clock detail。
SUN小型机信息查看命令集
下面是查看SUN小型机的信息的命令集:1、查看机型:SUn的小型机的机型都在面板上写着有,如NETRA T 1125,还有比如utra 5,utra 10等等。
2、查看cpu个数 (错误,不正确,因为sun中的top命令不能完全看到所有的cpu情况,与HP用法也不一样)#topCPU states: 99.3% idle, 0.1% user, 0.6% kernel, 0.0% iowait, 0.0% swap表示只有一个cpu正确方法:用dmesg |grep cpu便可以看到正确的 cpu个数了。
3、查看内存#dmesg |grep memmem = 2097152K (0x80000000)avail mem = 20877393924、查看磁盘的个数#vxdisk listDEVICE TYPE DISK GROUP STATUSc0t0d0s2 sliced - - errorc0t0d0s7 simple c0t0d0s7 rootdg onlinec1t0d0s2 sliced - - onlinec1t1d0s2 sliced smpdg2 smpdg onlinec1t2d0s2 sliced smpdbdg1 smpdbdg onlinec2t0d0s2 sliced - - onlinec2t1d0s2 sliced smpdg1 smpdg onlinec2t2d0s2 sliced smpdbdg2 smpdbdg online5、如何查看文件系统#df -kFilesystem kbytes used avail capacity Mounted on/dev/dsk/c0t0d0s0 4032142 1050675 2941146 27% //proc 0 0 0 0% /procfd 0 0 0 0% /dev/fd/dev/dsk/c0t0d0s6 7304977 29 7231899 1% /home/dev/dsk/c0t0d0s5 4032142 402929 3588892 11% /optswap 3418392 32 3418360 1% /tmp/vol/dev/dsk/c0t6d0/informix201730 201730 0 100% /cdrom/informix/dev/vx/dsk/smpdg/smpdg-stat1055 9 941 1% /smpwork/dev/vx/dsk/smpdg/lv_smp17336570 128079 17035126 1% /sms6、查看卷组、逻辑卷的位置#cd /dev/vx/dsk/比如smpdg等等都在该目录下了,然后再进入某个卷组目录就可以看到该卷组下面的逻辑卷了。
SUN常用命令
Solaris 8及SUN硬件常用的系统检测维护命令* OBP命令* ok probe-scsi-all用于检测系统SCSI设备的连接状况* ok printenv显示系统OBP参数设置* ok setenv ........修改指定的OBP参数设置* ok reset-allRESET系统硬件,使得setenv操作有效* ok boot使用默认引导设备(boot-device变量定义的设备)引导系统* ok boot -s使用默认引导设备(boot-device变量定义的设备)引导系统到“单用户维护状态”进行系统维护* ok boot cdrom -s用操作系统光盘引导系统(安装系统或修复故障)* ok banner用于显示系统基本配置信息,CPU / MEM / EtherNet add / Hostid / OBP版本等* 操作系统命令* # /usr/pl*/sunu/sbin/prtdiag -v用于检测系统的硬件配置和环境参数,可以诊断部分硬件故障。
★★* # df -k检查当前文件系统使用状况,相关文件/etc/vfstab,系统启动时控制挂接文件系统的系统文件。
* #more /var/adm/messages显示系统引导检测关闭是的信息,同时也是记录系统故障信息的文件。
★★★* # format系统硬盘操作命令,用来查看和修改系统硬盘分区信息。
(在操作有数据的硬盘时小心使用)* # ifconfig -a显示系统网络配置情况和参数,相关文件/etc/hosts ; /etc/hostname.eri0 /etc/hostname.hme0 ..... /etc/netmasks * # netstat -rn显示系统网络路由配置情况和参数,相关文件/etc/defaulerouter相关命令:route [add][del]........* # ps -ef |grep xxxx搜索当前系统中运行的特定进程,主要用于:1. 找到死锁进程,将其结束,2. 查看某特定进程是否启动,3. 修改配置参数后重新启动特定进程以* # iostat -xn 5查看当前系统硬盘I/O工作状态。
SUN小型机信息查看命令集
下面是查看SUN小型机的信息的命令集:1、查看机型:SUn的小型机的机型都在面板上写着有,如NETRA T 1125,还有比如utra 5,utra 10等等。
2、查看cpu个数 (错误,不正确,因为sun中的top命令不能完全看到所有的cpu情况,与HP用法也不一样)#topCPU states: 99.3% idle, 0.1% user, 0.6% kernel, 0.0% iowait, 0.0% swap表示只有一个cpu正确方法:用dmesg |grep cpu便可以看到正确的 cpu个数了。
3、查看内存#dmesg |grep memmem = 2097152K (0x80000000)avail mem = 20877393924、查看磁盘的个数#vxdisk listDEVICE TYPE DISK GROUP STATUSc0t0d0s2 sliced - - errorc0t0d0s7 simple c0t0d0s7 rootdg onlinec1t0d0s2 sliced - - onlinec1t1d0s2 sliced smpdg2 smpdg onlinec1t2d0s2 sliced smpdbdg1 smpdbdg onlinec2t0d0s2 sliced - - onlinec2t1d0s2 sliced smpdg1 smpdg onlinec2t2d0s2 sliced smpdbdg2 smpdbdg online5、如何查看文件系统#df -kFilesystem kbytes used avail capacity Mounted on/dev/dsk/c0t0d0s0 4032142 1050675 2941146 27% //proc 0 0 0 0% /procfd 0 0 0 0% /dev/fd/dev/dsk/c0t0d0s6 7304977 29 7231899 1% /home/dev/dsk/c0t0d0s5 4032142 402929 3588892 11% /optswap 3418392 32 3418360 1% /tmp/vol/dev/dsk/c0t6d0/informix201730 201730 0 100% /cdrom/informix/dev/vx/dsk/smpdg/smpdg-stat1055 9 941 1% /smpwork/dev/vx/dsk/smpdg/lv_smp17336570 128079 17035126 1% /sms6、查看卷组、逻辑卷的位置#cd /dev/vx/dsk/比如smpdg等等都在该目录下了,然后再进入某个卷组目录就可以看到该卷组下面的逻辑卷了。
sun服务器巡检报告
sun服务器巡检报告Sun服务器巡检报告正文:1、介绍本次巡检报告旨在对Sun服务器进行全面的检查和评估,以确保其正常运行和高效性能。
本报告将包括服务器硬件和软件配置的详细信息、问题和建议,以及建议的解决方案。
2、硬件巡检2.1 服务器机箱- 检查机箱是否存在物理损坏或变形。
- 检查风扇是否正常工作,有无噪音或异常振动。
2.2 电源- 检查电源的供电情况,是否稳定。
- 检查电源线路是否正常连接,有无短路或松动现象。
2.3 内存- 检查内存模块是否正确安装,有无脱落或松动。
- 检查内存使用情况,是否存在内存泄漏或过高的内存占用。
2.4 存储设备- 检查硬盘驱动器是否正常工作,有无错误或损坏。
- 检查RD配置,确保数据冗余和有效性。
2.5 网络连接- 检查网络接口卡是否正常工作,有无连接问题或速度受限。
- 检查网络连接是否安全,有无未授权访问或异常流量。
3、软件配置巡检3.1 操作系统- 检查操作系统版本及补丁情况,确保安全更新和修复。
- 检查操作系统配置,包括网络设置、用户权限和防火墙配置。
3.2 应用程序- 检查已安装的应用程序和版本。
- 检查应用程序配置,包括数据库连接、日志设置和安全设置。
3.3 日志和监测- 检查系统日志和监测工具,以便及时发现和解决问题。
- 检查日志文件的大小和保留策略,防止磁盘空间不足。
4、问题和建议4.1 问题列表- 列出发现的问题,并描述其严重性和影响。
- 为每个问题提供解决方案或建议的下一步操作。
4.2 优化建议- 提供服务器性能和安全性的优化建议。
- 包括硬件和软件方面的改进建议。
附件:附件A:巡检报告原始数据文件附件B:服务器配置清单法律名词及注释:1、附件:附加在文件末尾的其他相关文件或信息。
2、全文:指整个文档的内容。
sun服务器硬件巡检
输出的Status列,所有值正常情况下是” ONLINE”或” STAND-BY”,其它的值都是不正常的;
#sccli> show logical-drives
输出的Status列,其值正常情况下是” Good”,其它的值都是不正常的;
#sccli>show enclosure-status
prtdiag -v
dmesg | more
uptime
date
磁盘阵列管理
#sccli
sccli: selected device /dev/rdsk/c2t0d0s2 [SUN StorEdge yyyy SN#08472F]
#sccli> show disks
输出的Status是不正常的;
#sccli>show FRUs
输出的FRU Status行,所有值正常情况下是”OK”, 其它的值都是不正常的;
#sccli> show peripheral-device-status
prtvtoc /dev/dsk/c0t0d0s0
more /etc/vfstab
more /etc/system
metadb 查看卷信息 SVM
metastat -p
metastat
vmstat 2 5
VXVM管理
1、df -k 检查文件系统
2、prtdiag -v|more 检查设备
3、vxprlnt 检查物理卷
4、swap -s 检查交换分区
5、prtconf 检查配置
6、pkginfo -l 检查软件
9、uname -a 主机名
10、date 时间
sun服务器硬件巡检
sun服务器硬件巡检Sun服务器硬件巡检1、概述本文档涵盖了Sun服务器硬件巡检的详细内容,旨在确保服务器的正常运行。
通过对硬件组件的检查和测试,可以准确评估服务器的健康状况,及时发现和解决潜在的问题。
2、巡检流程2.1 服务器开机检查- 检查服务器开机时的启动信息和状态- 观察服务器是否正常启动,是否有异常报警或错误信息2.2 外观检查- 检查服务器外壳是否完好无损- 检查指示灯是否正常工作,是否有异常闪烁2.3 电源检查- 检查电源线连接是否牢固- 观察电源指示灯,确保电源工作正常- 检查电源风扇是否正常运转,无异常声音或振动 2.4 CPU检查- 检查CPU散热器是否干净,无灰尘或杂物堵塞- 检查CPU温度是否在正常范围内- 使用诊断工具进行CPU性能测试2.5 内存检查- 检查内存条是否插紧,无松动现象- 检查内存容量是否与服务器配置一致- 运行内存测试工具,检测内存是否工作正常2.6 硬盘检查- 检查硬盘连接线是否牢固- 检查磁盘状态和容量是否正常- 运行磁盘检测工具,检查磁盘是否存在坏道或错误 2.7 网络接口检查- 检查网线连接是否牢固- 检查网络接口是否正常工作- 执行网络连通性测试,确保网络功能正常2.8其他硬件检查- 检查扩展卡和插槽是否插紧,无松动现象- 检查风扇是否工作正常,无异响或振动- 检查服务器电池状态,确保备份电源持续供电2.9日志检查- 检查服务器系统日志和硬件日志,查找任何错误或异常记录- 分析日志信息,及时处理发现的问题2.10 硬件替换和维修- 如发现硬件故障,根据服务器的维护手册进行硬件更换和维修3、附件本文档无附件。
4、法律名词及注释- 服务器:一种用于存储、管理和传递数据的计算机设备,是网络服务的基础。
- 巡检:对设备或系统进行定期检查,以维持其正常运行和可靠性。
- 硬件组件:计算机系统中的物理设备,包括处理器、内存、硬盘、电源等。
- 散热器:用于散热的设备,能够将热量从硬件组件中传递到周围环境。
SunOS常用操作命令
SunOS常用操作命令SunOS 常用操作命令1. 系统# passwd:修改口令# exit:退出系统2. 文件# cp:复制文件或目录,参数:-a递归目录,-i覆盖确认# mv:改名移动# rm:删除,参数:-r递归删除3. 目录# mkdir:创建目录# rmdir:删除空目录# cd:改变工作目录# pwd:查看当前路径# ls:列目录,参数:-a所有文件,-c按时间排序,-l详细信息--没有ll4. 文本# sort:排序# uniq:删除重复行5. 备份压缩# tar:档案,参数:-c创建新档案,-r追加到末尾,-t列出档案内容,-u更新文件,-x释放文件,-f使用档案文件或设备,-M多卷,-v详细报告,-w每步确认。
例tar cvf text.tar *.txt++++++++++++++++++++++++++++++++在Linux 的环境里tar是新的,符合GUN,因此可以在tar的參數加上z 会自动呼叫gzip但如果在某些unix 如sunos 其tar就无法呼叫gzip,因此如果同样一个abc.tar.gz 压缩文档,要分二次解。
gzip -d abc.tar.gz 解开 .gz 会产生abc.tar 再执行tar vxf abc.tar 就会再解开abc.tar全部了。
++++++++++++++++++++++++++++++++# gzip:压缩解压缩,参数:-d解压,-r递归压缩# unzip:解压缩,参数:-d目录,-x解压缩6. 权限# chmod:改变权限,r可读,w可写,x可执行。
0表示没有权限,1表示可执行权限,2表示可写权限,4表示可读权限,然后将其相加。
例如,如果想让某个文件的属主有“读/写”二种权限,需要把4(可读)+2(可写)=6(读/写)。
# chgrp:改变所属用户组# chown:改变属主7. 管理# wall:发送信息到全部登录用户# write:向某个用户发送信息# mesg y:设定允许别人给自己发送信息# sync:缓存同步校验# shutdown:关机,参数:-r重启,-h关机不重启,-f快速关机,-c取消关机# free:查看内存# uptime:显示系统运行时间# df:磁盘占用空间,参数:-a显示所有文件系统# du:磁盘使用情况# dd:拷贝并格式转换# fdformat:低格软盘# echo:显示文字# cal:日历# date:系统日期和时间# clear:清屏8. 我的回忆by tom2sun# who:查看当前用户# finger:查看其他用户信息# rlogin:远程登录# rcp:远程复制# netstat:网络状态# cat:一次完全显示# more:分屏显示# file:列出文件类型# grep:查找内容# find:查找文件# ps:当前运行程序,参数-a显示所有进程# at:时间,命令,Ctrl+D结束# lp:打印# nice:指定优先级# renice:调整优先级# kill:终止进程# man:获取命令帮助# touch:改变时间记录# ln:链接# mount -t vfat /dev/hda1 /mnt/dos:挂载Dos分区(不适用于Unix-Center) 9. FTP# ftp:启动FTP程序ftp>open:打开close:关闭bye:离开get:下载put:上传mget/mput:多个文件下载/上传reget:恢复下载binary:二进制传送文件ascii:ASCII码传送cd:改变远程目录lcd:改变本地目录mkdir:建目录rmdir:删除目录delete:删除文件mdelete:一次删除多个rename:重命名status:显示状态prompt:交互式hash:每传送1024字节显示#(hash)size:显示文件大小reset:重置10. via,i:进入输入状态ESC:返回命令状态:命令模式Q!:退出11. 快键及其他Alt+F1~F6:访问多个虚拟控制台(不适用于Unix-Center) Tab:命令补全末尾&:后台进程----------------------------------------硬件系统:1、如何查看cpu的状态?# psrinfo -v# mpstat 可以列出多cpu负载的状态2、如何查看内存?# prtconf | grep 'Memory' 可以查看内存的多少.# /usr/platform/sun4u/sbin/prtdiag3、如何动态添加swap分区?# $su -root ----- 成为超级用户# mkfile 100m /home/swapfile ----- 创建100m的Swap文件# /usr/sbin/swap -a /path/filename ----- 激活Swap文件# /usr/sbin/swap -l ----- 验证swap文件# /usr/sbin/swap -d /path/filename ----- 取消swap文件# rm -rf /home/swapfile ----- 删除swap文件4、如何查看当前网卡是以何种速率起来的?# dmesg |grep Link5、如何调整x-window的分辨率和刷新频率?字符界面登陆,运行:#/kdmconfig6、如何使用光、软驱?一般情况下用:# /etc/init.d/volmgt start# volcheck以上方法不行,用:# /etc/init.d/volmgt stop# mount -F hsfs -o ro /dev/dsk/c0t6d0s0 /cdrom --挂接光驱# mount -F pcfs /dev/diskette0 /floppy --挂接软驱solaris定义系统磁盘文件系统说明:ufs – UNIX文件系统。
sun服务器巡检报告
sun服务器巡检报告sun服务器巡检报告一、概述本报告旨在对sun服务器进行巡检,并记录服务器硬件、操作系统、网络、安全性等方面的情况,以及发现的问题和建议解决方案。
二、服务器硬件巡检1·机箱和电源●检查机箱外观是否完好,有无变形、损坏或脱落等情况。
●检查电源工作状态,包括电源指示灯是否亮起、电源风扇是否正常运转等。
2·CPU和内存●检查CPU温度,确保在正常工作范围内。
●检查内存使用情况,确保没有过度使用或不足的情况。
3·硬盘和RD阵列●检查硬盘工作状态,包括读写速度、响应时间和SMART信息等。
●检查RD阵列是否正常运行,包括RD卡状态、磁盘健康状态和容量分配等。
4·网络适配器和交换机●检查网络适配器连接状态,包括网络灯状态、链路速度和双工模式等。
●检查交换机配置,确保与服务器配套使用,并检查交换机端口状态。
三、操作系统巡检1·系统基本信息●记录操作系统版本、内核版本、处理器架构、系统启动时间等。
2·软件包和补丁管理●检查安装的软件包列表,确保包管理器使用规范。
●检查系统是否应用了最新的补丁,并记录补丁版本。
3·系统服务和进程●检查系统服务和进程运行状态,记录异常或停止的服务。
●检查系统资源使用情况,包括CPU利用率、内存使用情况和磁盘空间占用率等。
4·日志和监控●检查系统日志,包括系统日志、应用程序日志和安全日志等。
●检查监控工具的配置和运行情况,记录异常和告警信息。
四、网络巡检1·网络拓扑●绘制服务器所在的网络拓扑图,并标明服务器与其他设备的连接方式。
2·IP地质和网络配置●检查服务器的IP地质是否与网络规划一致,确保网络配置正确。
3·网络连接和带宽●检查网络连接状态,记录是否有异常断连或延时丢包等情况。
●检查带宽使用情况,包括网络流量和网络负载等。
4·防火墙和安全策略●检查防火墙配置,确保合理开放和封闭指定的端口和服务。
SUN双机常用命令
SUN双机常用命令SUN双机常用命令scswitch -e -n scp_rg(资源组名)将资源由online状态转变为offlinescswitch -e -j smp_rg(资源组名) 将资源由offline转变为online 状态查看cluster3.0状态使用scstat命令format查看磁盘状态(这个命令不能轻易用)将smpdg包在smcp02机上enable:scswitch -z –D smpdg -h smcp02 scswitch -z -g scp_rg -h smcp01双机应用切换切换时采用stoptellin -h scpwork或stoptellin -h smpwork(停应用)在/opt/SUNWcluster/scpdg/util下执行(spy.sh.在bin目录下)看双机状态 scstat查看DG空间:vxdg free启动双机脚本请以root用户执行/opt/SUNWcluster/ha/scu/util/starttellin -h smcp01.主机名,例如:/opt/SUNWcluster/ha/scu/util/starttellin -h share_ip(浮动ip地址) 启动双机脚本执行scstat查看scp_rg资源组是否运行正常。
停止双机脚本请以root用户执行/opt/SUNWcluster/ha/scu/util/stoptellin -h浮动IP对应的主机名,例如:/opt/SUNWcluster/ha/scu/util/stoptellin -h share_ip停止双机脚本执行scstat查看scp_rg资源组是否运行正常。
双机切换强行手工切换,请以root用户执行scswitch -z -g scp_rg -h smcp1 将主机应用切到指定的节点上,如果当前主机应用就是运行在该指定的节点上,就不作任何动作直接返回;反之,成功地将IP和应用切到指定节点上。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
# ./explorer
检查近期系统的core dump文件 运行命令# ls -l /var/crash/hostname
系统日志检查 以root用户用more查看/var/adm/message*及/var/log/syslog*
系统进程检查 运行命令# ps –elf
内存交换区使用检查 运行命令# swap –l
检查内置磁盘状态 执行format命令 没有磁盘的状态为
type unknown
SVM元数据检查 metadb 两个内置磁盘s7分区正常
SDS(SVM)镜像检查 Metastat 没有处于需要维护状态
Cluster状态检查 Scstat 在指定节点上online
操作系统版本 运行命令# uname –a
对主机的telnet情况 在其它机器上telnet到主机上 观察能否正常连接到主机
文件系统大小 执行 df –k 是否有文件系统超过75%
检查近期系统的core dump文件 cd /var/crash/hostname
ls –l 没有近期的core dump文件存在。
检查系统中是否存在core文件以及产生时间,并删除。 find / -name core
# more /etc/release
检查整个系统状态Байду номын сангаас运行命令# prtdiag –v
检查系统firmware 运行命令# prtconf –v
检查磁盘状态 运行命令# format
检查本地镜像是否ok 运行命令# raidctl -l
文件系统大小 运行命令# df –h
检查网络状态 运行命令# ifconfig –a
ls –l core 系统中有无core文件存在。
在主机上检查整个系统状态 /usr/platform/sun4u/sbin/prtdiag –v 检查系统中CPU风扇、电源、温度等各个方面状态并提示
系统日志检查 以root用户用more查看 /var/adm/message* 及
/var/log/syslog* 日志中无warning,error,fail,panic等异常提示,没有系统进程重起的提示。