Linux操作系统监控手册
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
TurboLinux 监控手册
目录
1 系统维护操作方法 (2)
1.1 系统维护内容 (2)
1.2 系统维护操作方法 (2)
2 查看CPU信息及相关命令 (4)
2.1.1 查看CPU类型,数量 (4)
2.1.2 显示CPU使用情况 (5)
2.2 查看内存信息及相关命令 (6)
2.3 查看进程信息及相关命令 (7)
2.4 查看磁盘使用信息及相关命令 (8)
2.5 文件系统管理及相关命令 (10)
2.6 IO带宽及相关命令 (11)
2.7 其他 (12)
1系统维护操作方法
1.1 系统维护内容
操作系统是否正常运转主要通过系统资源的使用情况来判断。
因此,对系统资源的监测是系统管理的关键所在。
系统日常维护主要从以下几个方面着手:
查看cpu使用情况
查看内存使用情况
查看磁盘使用情况
辅助监测项目包括查看进程,IO等
1.2 系统维护操作方法
使用客户端登录到服务器主机,然后执行系统命令进行检查。
可以使用Telnet或ssh方式登录。
建议使用ssh方式登录服务器,可以使用putty,SecureCRT等工具。
一般设置情况下,系统不允许root用户直接远程登录到服务器,登录时可以使用普通用户,如: oracle。
普通用户登录后,可以执行:$ su –
输入root用户密码
#
即可获得root权限。
注意:root用户具有很高的操作权限,执行命令时应特别小心。
root用户的误操作有可能造成系统损坏!
执行完检查操作后,应执行两次exit命令退出远程登录状态。
最好不要采用直接关闭连接窗口的方式。
# exit
$ exit
即可关闭远程连接。
2查看CPU信息及相关命令
2.1.1查看CPU类型,数量
# cat /proc/cpuinfo
查看cpu类型,数量
# cat /proc/cpuinfo
processor : 0
vendor_id : GenuineIntel
cpu family : 6
model : 5
model name : Pentium II (Deschutes)
stepping : 0
cpu MHz : 334.151
cache size : 512 KB
fdiv_bug : no
hlt_bug : no
f00f_bug : no
coma_bug : no
fpu : yes
fpu_exception : yes
cpuid level : 2
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 mtrr pge mca cmov pat pse36 mmx fxsr
bogomips : 668.78
2.1.2显示CPU使用情况
top 显示cpu使用情况
[命令]SHELL# top
CPU states: cpu user nice system irq softirq iowait idle
total 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 100.0%
Mem: 481412k av, 76892k used, 404520k free, 0k shrd, 6880k buff 56588k active, 6484k inactive
Swap: 2666740k av, 0k used, 2666740k free 37588k cached
[说明] cpu状态显示的信息有:user –用户应用占用的cpu ;nice 优先进程占用的cpu; system 系统使用;irq 中断占用;
softirq 软中断占用;iowait idle 空闲cpu。
top命令不加任何参数,默认显示的所有进程按照cpu的使用率排序。
若服务器cpu的空闲率(idle)低于30%,应当引起管理员的注意,对服务器进行检查。
进入top状态后
输入M让进程根据内存使用量排序
输入P让进程根据CPU使用量排序
2.2 查看内存信息及相关命令
[命令]SHELL # free
total used free shared buffers cached
Mem: 481412 81424 399988 0 8100 39324
-/+ buffers/cache: 34000 447412
Swap: 2666740 0 2666740
[说明]
第一行是当前物理内存的使用情况。
其中,cache是缓存器,是内存中对磁盘设备的映射,比如读入一个文件,这种内存页面在磁盘上能找到对应的部分。
而buffer是在磁盘上找不到对应空间的内存,比如程序运行中数据段中的内容。
剩下固定的部分就是内核占用的内存。
第二行显示的两个数据分别是:used-buffers-cached 和free+buffers+cached。
这意味着,buffers和cached占用的空间仍然是可以利用的,当内存空间不够的时候,这两个占用的空间可以腾出来作新的用途。
因此判断内存可用空间要以第二行数据为准。
当物理内存使用到一定程度时,系统会自动启用swap分区作为扩展内存。
如果swap分区占用了一半,应当引起系统管理员的注意,因为这时候服务器的性能会受到很大的影响。
2.3 查看进程信息及相关命令
[命令] ps –ef [ | grep 进程名]
UID PID PPID C STIME TTY TIME CMD
admin 1 0 0 14:49 ? 00:00:04 init
admin 2 1 0 14:49 ? 00:00:00 [keventd]
admin 3 1 0 14:49 ? 00:00:00 [kapmd]
admin 879 1 0 14:49 tty2 00:00:00 /sbin/mingetty vc/2
[说明] 显示系统中的全部进程,得到进程所属用户id, 进程id, 父进程id, 进程启动时间,进程对应终端,启动进程的命令
等信息。
[命令] kill [-9] 进程号
[说明] 中止一个进程
2.4 查看磁盘使用信息及相关命令
[命令] df -h
Filesystem 1K-blocks Used Available Use% Mounted on
/dev/hda2 10080520 6747532 2820920 71% /
/dev/hda1 46633 7795 36430 18% /boot
/dev/hda5 46311240 37902792 6017980 87% /data
[说明] 分别以K,M,G为单位显示磁盘使用情况。
磁盘使用到70%-80%要引起注意。
尤其在应用程序会导致磁盘用量迅速增长的情况下。
[命令] du filename(path)
# du -sh /root
428K /root
[说明] 查看某个目录,文件占用磁盘情况
du -s 只列出总量(多用于查看目录)
-h 以K,M,G为单位列出占用量
[命令]fdisk
# fdisk -l
Disk /dev/hda: 60.0 GB, 60022480896 bytes
255 heads, 63 sectors/track, 7297 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Device Boot Start End Blocks Id System
/dev/hda1 * 1 6 48163+ 83 Linux
/dev/hda2 7 1281 10241437+ 83 Linux
/dev/hda3 1282 1345 514080 82 Linux swap
/dev/hda4 1346 7297 47809440 5 Extended
/dev/hda5 1346 7297 47809408+ 83 Linux
# fdisk /dev/hda
The number of cylinders for this disk is set to 4865.
There is nothing wrong with that, but this is larger than 1024,
and could in certain setups cause problems with:
1) software that runs at boot time (e.g., old versions of LILO)
2) booting and partitioning software from other OSs
(e.g., DOS FDISK, OS/2 FDISK)
Command (m for help): m
[说明] fdisk 磁盘分区工具
fdisk -l 显示系统所有能认到的磁盘分区
fdisk /dev/sda 操作磁盘/dev/sda的分区
2.5 文件系统管理及相关命令
[命令] mkfs.type 磁盘分区标识
# mkfs.ext3 /dev/sda1
[说明] 将分区格式化成type类型的系统
[命令] mount 磁盘分区标识挂载点
# mount /dev/sdb1 /mnt/usb
[说明]用mount将分区挂载
[命令] fsck.type 磁盘分区标识
# fsck /dev/sda1
[说明] 修复type类型的文件系统
fsck是一个非常有用的命令。
操作系统很多故障是由于文件系统被损坏,此时,只要对文件系统进行修复,系统就能够重新正常使用了。
注意: 分区要先umount才能修复, 否则可能会损害文件系统。
2.6 IO带宽及相关命令
[命令] iostat
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
dev3-0 0.60 7.06 5.06 78373 56192
dev3-1 0.01 0.07 0.00 817 0
[说明] device 显示设备名,格式为devm-n ,m表示主设备号,n表示此设备号。
tps 每秒向设备发出的IO请求数。
Blk_read /s 每秒读取的block数
Blk_wrtn/s 每秒写入的block数
Blk_read 读入的block总数
Blk_wrtn 写入的block总数
注意:2.4kernel及以后的版本中,block大小是512 K
io 带宽主要是由硬件性能来决定的,从系统中来看,io大可以从cpu 使用率中看出来
2.7 其他
[命令] uname –a
# uname -a
Linux m1 2.6.9-8.11 #1 Thu Aug 3 13:52:36 CST 2006 i686 i686 i386 GNU/Linux
[说明] 查看系统内核版本
[命令] lspci
# lspci
00:00.0 Host bridge: Intel Corporation 440BX/ZX/DX - 82443BX/ZX/DX Host bridge (rev 03) 00:01.0 PCI bridge: Intel Corporation 440BX/ZX/DX - 82443BX/ZX/DX AGP bridge (rev 03) 00:04.0 ISA bridge: Intel Corporation 82371AB/EB/MB PIIX4 ISA (rev 02)
00:04.1 IDE interface: Intel Corporation 82371AB/EB/MB PIIX4 IDE (rev 01)
00:04.2 USB Controller: Intel Corporation 82371AB/EB/MB PIIX4 USB (rev 01)
00:04.3 Bridge: Intel Corporation 82371AB/EB/MB PIIX4 ACPI (rev 02)
00:09.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8139/8139C/8139C+ (rev 10) 00:0a.0 Ethernet controller: VIA Technologies, Inc. VT6102 [Rhine-II] (rev 42)
00:0b.0 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 50) 00:0b.1 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 50) 00:0b.2 USB Controller: VIA Technologies, Inc. USB 2.0 (rev 51)
01:00.0 VGA compatible controller: ATI Technologies Inc 3D Rage IIC AGP (rev 3a)
[说明] 查看系统硬件信息(网卡,scsi 卡,raid卡)
[命令] lspci –n
# lspci -n
00:00.0 Class 0600: 8086:7190 (rev 03)
00:01.0 Class 0604: 8086:7191 (rev 03)
00:04.0 Class 0601: 8086:7110 (rev 02)
00:04.1 Class 0101: 8086:7111 (rev 01)
00:04.2 Class 0c03: 8086:7112 (rev 01)
00:04.3 Class 0680: 8086:7113 (rev 02)
00:09.0 Class 0200: 10ec:8139 (rev 10)
00:0a.0 Class 0200: 1106:3065 (rev 42) 00:0b.0 Class 0c03: 1106:3038 (rev 50) 00:0b.1 Class 0c03: 1106:3038 (rev 50) 00:0b.2 Class 0c03: 1106:3104 (rev 51) 01:00.0 Class 0300: 1002:475a (rev 3a)
[说明] 显示硬件ID号。