UNIX操作系统监控及分析_培训
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
监视pagespces使用率 lsps –a
用来检测系统中所有页空间的分布配置和使用情况,包括页空间的容量使 用率等。 %used > 70% 内存将成瓶颈
UNIX操作系统监控及分析
监视I/O使用情况:iostat
•% tm_act:表示某个磁盘处于active状态的百分比 •tps : 表示每秒某个硬盘有多少个数据传输次数 •Kb_read /Kb_wrtn — 分别显示从开机到运行iostat这个命令这段时间内对硬盘的read和 write的总数据量,单位kb
UNIX操作系统监控及分析
Nmon收集数据
操作步骤: 1. 写nmon.sh脚本 nmon -f -s 60 -c 30(每60s收集一次数据,共收集30次) 2. Nmon.sh赋予执行权限 3. 执行nmon.sh 4. 使用分析工具nmon analyser.xls 打开*.nmon
UNIX操作系统监控及分析
UNIX操作系统监控及分析
topas从整体监控: CPU项的Wait%: 如果Idle%数值很高而且Wait%数值也很高(Wait%大于25),
这个说明系统存在内存或者硬盘I/O瓶颈。
高数值的Wait%可能发生的原因: 1、内存不够而引起频繁的swap空间的数据交换,导致数据存取存在 交换空间的I/O瓶颈。 2、硬盘上面数据不合理的分布。 3、应用程序存在过于频繁的I/O操作。
2、负载压力过大,内存资源不足,需增加内存个数。
UNIX操作系统监控及分析
监控工具:Nmon
Nmon安装
1. 将 NmonXXX.tar.gz 文件复制到计算机。如果使用 FTP,请记住 使用二进制模式 2. 解压该文件,运行运行 gzip -d nmonXXX.tar.gz 3. 提取该文件,运行tar xvf nmonXXX.tar Nmon部署 1. 解压nmon后运行chomd +x nmon 2. 设置环境变量 3. 进入nmon安装目录运行nmon
UNIX操作系统监控及分析
监视I/O使用情况:sar -d
device: sar命令正在监视的块设备的名字。 %busy: 设备忙时,传送请求所占时间的百分比。 avque: 队列站满时,未完成请求数量的平均值。 r+w/s: 每秒传送到设备或从设备传出的数据量。 blks/s: 每秒传送的块数,每块512字节。 avwait: 队列占满时传送请求等待队列空闲的平均时间。 avserv: 完成传送请求所需平均时间(毫秒)。
是一次I/O请求
•KB-Read: 每秒钟从物理磁盘读出的K字节数 •KB-Write:每秒钟向物理磁盘写入的K字节数
UNIX操作系统监控及分析
topas从整体监控: Process相关项 •NAME:可执行程序的名称 •Process ID:进程的ID号 •CPU%:进程的CPU平均使用率 •Paging Space Used:分配给进程的分页空间大小 •Process Owner: 拥有这个进程的用户名
• Wait%:表示CPU等待I/O所花费时间的百分数
• Idle%:表示CPU空闲时间的百分数
UNIX操作系统监控及分析
topas从整体监控:
Memory 相关项
• %Comp:表示当前分配给计算分页片断的内存占实际 内存的百分比 • %Noncomp:表示当前分配非计算分页片断的内存占实际 内存的百分比 • %Client:表示当前分配给用来缓冲远程挂载文件的内存 占实际内存的百分比
UNIX操作系统监控及分析
监视进程占用I/O情况:topas -P
topas 可以查看每个进程所占的IO
UNIX操作系统监控及分析
topas从整体监控:
UNIX操作系统监控及分析
topas从整体监控:
CPU相关项
• Kerne%:表示内核程序占用CPU的百分数 • User%:表示用户程序占用CPU的百分数
po = 从内存调入paging space的页面数
fr = 被释放的页面数 sr = 页面替换算法扫描的页面数
UNIX操作系统监控及分析
监视内存使用情况:svmon
-G 显示整个系统中实际内存和分页使用情况 -U 查看用户的内存使用情况 -C 统计命令的内存使用情况
-P 统计进程使用的内存情况。加[PID]可以查看单个进程的内存使用情况
HP-UX监控分析工具 Top vmstat
swapinfo
Iostat Glance
UNIX操作系统监控及分析
监视CPU使用情况:top
UNIX操作系统监控及分析
监视CPU使用情况:sar
%usr:CPU执行应用(user)进程的时间百分比 %sys:CPU 执行内核(system)进程的时间百分比 %idle:CPU 空闲百分比 %wio:CPU等待是 I/O百分比 %usr + %sys应小于 85%,大于表明可能是CPU性能问题。 %wio应小于30%,大于表明可能是 I/O 性能问题。
UNIX操作系统监控及分析
监视进程占用内存情况:svmon
查看前三个占用内存的进程
svmon -Pt 3 查看进程所使用的文件 svmon –pP [PID] 使用交换区最多的三个进程 svmon -gP -t 3|grep -p Pid|grep '^.*[0-9] '
UNIX操作系统监控及分析
UNIX操作系统监控及分析
topas从整体监控: PAING SPACE相关项 •Size,MB:表示系统里所有分页空间大小,以MB为单位
•%Used: 表示当前使用的分页空间占总空间的百分比
•%Free: 表示当前空闲的分页空间占总空间的百分比 PAING相关项
•PageIn: 在监控期间每秒钟读取的4k分页数
2. 写glance.sh脚本
glance -j 10 -adviser_only -bootup -iterations 60 -syntawk.baidu.com adviser.syntax>> `hostname`_glance_`date +%Y%m%d`.log
3. 4.
glance.sh赋予执行权限
Chmod+x glance.sh
UNIX操作系统监控及分析
topas从整体监控: CPU项的Kernel%和User%:
如果Kernel%和User%项的数值之和大于85%,特别是User%
的数值很高,表示系统CPU使用率太高,存在CPU资源瓶颈。 高数值的Kernel%和User%可能发生的原因:
应用程序存在耗用CPU过高的进程,需优化解决。
UNIX操作系统监控及分析
监视CPU使用情况:sar
可以监控每个CPU的资源使用情况
%usr: CPU执行应用(user)进程的时间百分比 %sys:CPU 执行内核(system)进程的时间百分比 %idle:CPU 空闲百分比 %wio:CPU等待 I/O百分比
UNIX操作系统监控及分析
•PageOut:在监控期间每秒钟写入的4k分页数
UNIX操作系统监控及分析
topas从整体监控: Disk相关项 •Disk: •KBPS: •TPS: 物理磁盘的名称
•Busy%: 指明物理磁盘在活动状态的时间百分比
在监控期间每秒钟读写的K字节总数 每秒钟物理磁盘的数据传输量,一次传输指的
专题培训
UNIX操作系统监控 及分析
UNIX操作系统监控及分析
UNIX主机资源监控及分析
操作系统( IBM-AIX、HP-UX、LINUX ) 监控分析工具 资源瓶颈典型症状
UNIX操作系统监控
一般性能分析过程
Topas Nmon glance vmstat sar Y CPU瓶颈? N Y 内存瓶颈? N I/O瓶颈? N Y iostat lslv filemon fileplace
UNIX操作系统监控及分析
Glance实时监控
UNIX操作系统监控及分析
Glance实时监控
Glance运行时键盘输入命令
UNIX操作系统监控及分析
Glance收集数据
操作步骤: 1. 把需要监控的指标写到一个控制脚本adviser.syntax中,如:
PRINT GBL_STATDATE," ",GBL_STATTIME, ―CPU_UTIL‖," ",GBL_CPU_TOTAL_UTIL, " CPU_RUN_QUEUE", " ", GBL_RUN_QUEUE, " ACTIVE_CPU"," ", GBL_ACTIVE_CPU
负载压力过大,CPU资源不足,需增加CPU个数。
UNIX操作系统监控及分析
topas从整体监控: PAING项的PageIn和PageOut: 如果PageIn和PageOut项的数值持续大于0,并且数值较高,
表示系统换页过于频繁,系统内存不足,存在内存资源瓶颈。
高数值的PageIn和PageOut项可能发生的原因: 1、应用程序存在耗用内存过高的进程,需优化解决。
UNIX操作系统监控及分析
监视内存使用情况:swapinfo
reserve 保留的分页空间 memory 内存分页区
UNIX操作系统监控及分析
监视I/O使用情况:iostat
device: iostat统计的设备名称。 bps: 每秒该设备传输的K字节数。 sps: 每秒检索该设备次数。 msps: 平均每次检索所花费的时间,单位毫秒。
Topas Nmon glance vmstat lsps svmon
netstat nfsstat
nfso no ifconfig netpmon Y 网络瓶颈? N More test
UNIX操作系统监控及分析
IBM-AIX性能监控工具
CPU vmstat, iostat topas/nmon ps 内存 vmstat topas/nmon ps 磁盘 iostat topas/nmon lvmstat,iostat -d
后台运行nohup ./glance.sh &
UNIX操作系统监控及分析
LINUX监控分析工具 Top vmstat
free
Iostat Nmon
UNIX操作系统监控及分析
CPU 成为瓶颈典型症状: 系统响应时间较慢 CPU空闲率较少 过高的用户占用CPU时间 过高的系统占用CPU时间 长时间有很长的运行队列
UNIX操作系统监控及分析
监控工具:nmon
Nmon 实时监控
UNIX操作系统监控及分析
监控工具:Nmon
Nmon实时监控
在nmon显示页面,依次输入c,m,d
UNIX操作系统监控及分析
Nmon实时监控 Nmon 运行时键盘输入命令
命令 c m d t P k
说明
提供关于物理CPU使用的详细信息 提供内存使用的详细信息:系统(内核)和进程,活动虚拟内 存 提供关于磁盘,磁盘类型大小,可用空间,卷组,适配器等更 详细的信息 当前进程详细情况 Paging space 使用情况 显示内核信息
UNIX操作系统监控及分析
监视I/O使用情况:iostat
如果%idle数值都很高而且%iowait数值也很高,大于25,这个说明系
统存在I/O或 则硬盘瓶颈 高数值的%iowait有可能下面几个原因: 1. 内存不够而引起频繁的swap空间的数据交换,导致数据存取存在 交换空间的 I/O瓶颈 2. 3. 硬盘上面数据不合理的分布 数据的fragment不合理
sar time/timex
netpmon trace,trcrpt
svmon lsps
filemon trace,trcrpttrace,trcrpt
lvmstat lsps
filemon
UNIX操作系统监控及分析
监视CPU使用情况:vmstat
r :运行队列中的内核线程数 b :等待队列中(等待系统资源、等待I/O)的内核线程数
监视进程占用CPU情况 查看前三位占用CPU的进程 ps -aux | head -4
%CPU :表示进程使用cpu时间的百分比 %MEM :表示进程使用实际内存的百分比
UNIX操作系统监控及分析
监视内存使用情况:vmstat
avm = 活动的虚拟页面 fre = 空闲的页面 pi = 从paging space调入内存的页面数
用来检测系统中所有页空间的分布配置和使用情况,包括页空间的容量使 用率等。 %used > 70% 内存将成瓶颈
UNIX操作系统监控及分析
监视I/O使用情况:iostat
•% tm_act:表示某个磁盘处于active状态的百分比 •tps : 表示每秒某个硬盘有多少个数据传输次数 •Kb_read /Kb_wrtn — 分别显示从开机到运行iostat这个命令这段时间内对硬盘的read和 write的总数据量,单位kb
UNIX操作系统监控及分析
Nmon收集数据
操作步骤: 1. 写nmon.sh脚本 nmon -f -s 60 -c 30(每60s收集一次数据,共收集30次) 2. Nmon.sh赋予执行权限 3. 执行nmon.sh 4. 使用分析工具nmon analyser.xls 打开*.nmon
UNIX操作系统监控及分析
UNIX操作系统监控及分析
topas从整体监控: CPU项的Wait%: 如果Idle%数值很高而且Wait%数值也很高(Wait%大于25),
这个说明系统存在内存或者硬盘I/O瓶颈。
高数值的Wait%可能发生的原因: 1、内存不够而引起频繁的swap空间的数据交换,导致数据存取存在 交换空间的I/O瓶颈。 2、硬盘上面数据不合理的分布。 3、应用程序存在过于频繁的I/O操作。
2、负载压力过大,内存资源不足,需增加内存个数。
UNIX操作系统监控及分析
监控工具:Nmon
Nmon安装
1. 将 NmonXXX.tar.gz 文件复制到计算机。如果使用 FTP,请记住 使用二进制模式 2. 解压该文件,运行运行 gzip -d nmonXXX.tar.gz 3. 提取该文件,运行tar xvf nmonXXX.tar Nmon部署 1. 解压nmon后运行chomd +x nmon 2. 设置环境变量 3. 进入nmon安装目录运行nmon
UNIX操作系统监控及分析
监视I/O使用情况:sar -d
device: sar命令正在监视的块设备的名字。 %busy: 设备忙时,传送请求所占时间的百分比。 avque: 队列站满时,未完成请求数量的平均值。 r+w/s: 每秒传送到设备或从设备传出的数据量。 blks/s: 每秒传送的块数,每块512字节。 avwait: 队列占满时传送请求等待队列空闲的平均时间。 avserv: 完成传送请求所需平均时间(毫秒)。
是一次I/O请求
•KB-Read: 每秒钟从物理磁盘读出的K字节数 •KB-Write:每秒钟向物理磁盘写入的K字节数
UNIX操作系统监控及分析
topas从整体监控: Process相关项 •NAME:可执行程序的名称 •Process ID:进程的ID号 •CPU%:进程的CPU平均使用率 •Paging Space Used:分配给进程的分页空间大小 •Process Owner: 拥有这个进程的用户名
• Wait%:表示CPU等待I/O所花费时间的百分数
• Idle%:表示CPU空闲时间的百分数
UNIX操作系统监控及分析
topas从整体监控:
Memory 相关项
• %Comp:表示当前分配给计算分页片断的内存占实际 内存的百分比 • %Noncomp:表示当前分配非计算分页片断的内存占实际 内存的百分比 • %Client:表示当前分配给用来缓冲远程挂载文件的内存 占实际内存的百分比
UNIX操作系统监控及分析
监视进程占用I/O情况:topas -P
topas 可以查看每个进程所占的IO
UNIX操作系统监控及分析
topas从整体监控:
UNIX操作系统监控及分析
topas从整体监控:
CPU相关项
• Kerne%:表示内核程序占用CPU的百分数 • User%:表示用户程序占用CPU的百分数
po = 从内存调入paging space的页面数
fr = 被释放的页面数 sr = 页面替换算法扫描的页面数
UNIX操作系统监控及分析
监视内存使用情况:svmon
-G 显示整个系统中实际内存和分页使用情况 -U 查看用户的内存使用情况 -C 统计命令的内存使用情况
-P 统计进程使用的内存情况。加[PID]可以查看单个进程的内存使用情况
HP-UX监控分析工具 Top vmstat
swapinfo
Iostat Glance
UNIX操作系统监控及分析
监视CPU使用情况:top
UNIX操作系统监控及分析
监视CPU使用情况:sar
%usr:CPU执行应用(user)进程的时间百分比 %sys:CPU 执行内核(system)进程的时间百分比 %idle:CPU 空闲百分比 %wio:CPU等待是 I/O百分比 %usr + %sys应小于 85%,大于表明可能是CPU性能问题。 %wio应小于30%,大于表明可能是 I/O 性能问题。
UNIX操作系统监控及分析
监视进程占用内存情况:svmon
查看前三个占用内存的进程
svmon -Pt 3 查看进程所使用的文件 svmon –pP [PID] 使用交换区最多的三个进程 svmon -gP -t 3|grep -p Pid|grep '^.*[0-9] '
UNIX操作系统监控及分析
UNIX操作系统监控及分析
topas从整体监控: PAING SPACE相关项 •Size,MB:表示系统里所有分页空间大小,以MB为单位
•%Used: 表示当前使用的分页空间占总空间的百分比
•%Free: 表示当前空闲的分页空间占总空间的百分比 PAING相关项
•PageIn: 在监控期间每秒钟读取的4k分页数
2. 写glance.sh脚本
glance -j 10 -adviser_only -bootup -iterations 60 -syntawk.baidu.com adviser.syntax>> `hostname`_glance_`date +%Y%m%d`.log
3. 4.
glance.sh赋予执行权限
Chmod+x glance.sh
UNIX操作系统监控及分析
topas从整体监控: CPU项的Kernel%和User%:
如果Kernel%和User%项的数值之和大于85%,特别是User%
的数值很高,表示系统CPU使用率太高,存在CPU资源瓶颈。 高数值的Kernel%和User%可能发生的原因:
应用程序存在耗用CPU过高的进程,需优化解决。
UNIX操作系统监控及分析
监视CPU使用情况:sar
可以监控每个CPU的资源使用情况
%usr: CPU执行应用(user)进程的时间百分比 %sys:CPU 执行内核(system)进程的时间百分比 %idle:CPU 空闲百分比 %wio:CPU等待 I/O百分比
UNIX操作系统监控及分析
•PageOut:在监控期间每秒钟写入的4k分页数
UNIX操作系统监控及分析
topas从整体监控: Disk相关项 •Disk: •KBPS: •TPS: 物理磁盘的名称
•Busy%: 指明物理磁盘在活动状态的时间百分比
在监控期间每秒钟读写的K字节总数 每秒钟物理磁盘的数据传输量,一次传输指的
专题培训
UNIX操作系统监控 及分析
UNIX操作系统监控及分析
UNIX主机资源监控及分析
操作系统( IBM-AIX、HP-UX、LINUX ) 监控分析工具 资源瓶颈典型症状
UNIX操作系统监控
一般性能分析过程
Topas Nmon glance vmstat sar Y CPU瓶颈? N Y 内存瓶颈? N I/O瓶颈? N Y iostat lslv filemon fileplace
UNIX操作系统监控及分析
Glance实时监控
UNIX操作系统监控及分析
Glance实时监控
Glance运行时键盘输入命令
UNIX操作系统监控及分析
Glance收集数据
操作步骤: 1. 把需要监控的指标写到一个控制脚本adviser.syntax中,如:
PRINT GBL_STATDATE," ",GBL_STATTIME, ―CPU_UTIL‖," ",GBL_CPU_TOTAL_UTIL, " CPU_RUN_QUEUE", " ", GBL_RUN_QUEUE, " ACTIVE_CPU"," ", GBL_ACTIVE_CPU
负载压力过大,CPU资源不足,需增加CPU个数。
UNIX操作系统监控及分析
topas从整体监控: PAING项的PageIn和PageOut: 如果PageIn和PageOut项的数值持续大于0,并且数值较高,
表示系统换页过于频繁,系统内存不足,存在内存资源瓶颈。
高数值的PageIn和PageOut项可能发生的原因: 1、应用程序存在耗用内存过高的进程,需优化解决。
UNIX操作系统监控及分析
监视内存使用情况:swapinfo
reserve 保留的分页空间 memory 内存分页区
UNIX操作系统监控及分析
监视I/O使用情况:iostat
device: iostat统计的设备名称。 bps: 每秒该设备传输的K字节数。 sps: 每秒检索该设备次数。 msps: 平均每次检索所花费的时间,单位毫秒。
Topas Nmon glance vmstat lsps svmon
netstat nfsstat
nfso no ifconfig netpmon Y 网络瓶颈? N More test
UNIX操作系统监控及分析
IBM-AIX性能监控工具
CPU vmstat, iostat topas/nmon ps 内存 vmstat topas/nmon ps 磁盘 iostat topas/nmon lvmstat,iostat -d
后台运行nohup ./glance.sh &
UNIX操作系统监控及分析
LINUX监控分析工具 Top vmstat
free
Iostat Nmon
UNIX操作系统监控及分析
CPU 成为瓶颈典型症状: 系统响应时间较慢 CPU空闲率较少 过高的用户占用CPU时间 过高的系统占用CPU时间 长时间有很长的运行队列
UNIX操作系统监控及分析
监控工具:nmon
Nmon 实时监控
UNIX操作系统监控及分析
监控工具:Nmon
Nmon实时监控
在nmon显示页面,依次输入c,m,d
UNIX操作系统监控及分析
Nmon实时监控 Nmon 运行时键盘输入命令
命令 c m d t P k
说明
提供关于物理CPU使用的详细信息 提供内存使用的详细信息:系统(内核)和进程,活动虚拟内 存 提供关于磁盘,磁盘类型大小,可用空间,卷组,适配器等更 详细的信息 当前进程详细情况 Paging space 使用情况 显示内核信息
UNIX操作系统监控及分析
监视I/O使用情况:iostat
如果%idle数值都很高而且%iowait数值也很高,大于25,这个说明系
统存在I/O或 则硬盘瓶颈 高数值的%iowait有可能下面几个原因: 1. 内存不够而引起频繁的swap空间的数据交换,导致数据存取存在 交换空间的 I/O瓶颈 2. 3. 硬盘上面数据不合理的分布 数据的fragment不合理
sar time/timex
netpmon trace,trcrpt
svmon lsps
filemon trace,trcrpttrace,trcrpt
lvmstat lsps
filemon
UNIX操作系统监控及分析
监视CPU使用情况:vmstat
r :运行队列中的内核线程数 b :等待队列中(等待系统资源、等待I/O)的内核线程数
监视进程占用CPU情况 查看前三位占用CPU的进程 ps -aux | head -4
%CPU :表示进程使用cpu时间的百分比 %MEM :表示进程使用实际内存的百分比
UNIX操作系统监控及分析
监视内存使用情况:vmstat
avm = 活动的虚拟页面 fre = 空闲的页面 pi = 从paging space调入内存的页面数