solaris性能监控详细解释
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Solaris 资源监控详细解释
因为经常需要在Solaris系统上分析资源使用状况,而网上或者书籍中资源监控命令总是零零碎碎的分散在各处,故将这个内容整理一下。
Ø RSS:进程常驻大小。表示映射到进程的物理内存总量,包括共享给其他进程的物理内存。
Ø TIME:进程累计执行时间。
Ø CPU:当前进程CPU使用时间的百分比;
Ø PROCESS/NLWP:进程名(执行文件名)以及进程的线程数。
Ø PID:进程ID号;
Ø USERNAME:实际的用户名(登陆名)或者用户ID。
Ø PRI:进程优先级,数字越大则优先级越高。
Ø NICE:用于优先级计算的精确数字。
在实际的性能问题分析过程中,需要关注的参数主要是Size,RSS,TIME,CPU,NLWP。在一些极端的情况下,TIME和CPU两项内容能表示系统出现了异常,比如TIME显示的数值非常大,明显不合常理,或者某个应用此时CPU使用率远比正常情况要大的多。
其次,在最后一行,prstat还给出了当前系统的进程数和线程数,以及系统在当前时刻,5分钟内,15分钟内的系统平均负载情况:
Total: 44 processes, 861 lwps,load averages: 2.09, 2.08, 2.07
这些数据都有助于我们了解系统的整体情况,后面会对平均负载的含义做详细说明。
在使用prstat获得一个对所有进程运行的整体印象后,可以进一步通过一些参数来观测某个具体应用进程的详细情况。
root@t139 #prstat -mLp 3411
PID USERNAME USR SYS TRP TFL DFL LCK SLP LATVCX ICX SCL SIG PROCESS/LWPID
3411 root 21 0.0 0.0 0.0 0.0 79 0.0 0.0 4 18 7 0java/10
3411 root 2.1 0.2 0.0 0.0 0.0 92 5.7 0.0285 7 939 0 java/3560
3411 root 0.5 0.0 0.0 0.0 0.0 99 0.50.0 37 0 143 0 java/4308
3411 root 0.0 0.0 0.0 0.0 0.0 14 86 0.0 2 0 8 0 java/120
……
Total: 1processes, 176 lwps, load averages: 0.05, 0.10, 0.16
-L:显示进程的线程信息;
-m:显示进程的微态;微态以时间基准来表示,并且以百分比形式分散到每个线程。
-p:指定观测的进程;
Ø LCK:进程花费在等待用户锁上的时间百分比;
Ø SLP:进程花费在休眠上的时间百分比;
Ø DFL: 显示花费在等待被服务的数据错误的时间百分比。如果该值较高,显示内存不足。
Ø LAT:进程花费在等待CPU上的时间。
Ø VCX The number of voluntary contextswitches.
Ø ICX The number of involuntary contextswitches.
Ø SCL The number of system calls.
Ø SIG The number of signals received.
可以使用USR和SYS的状态来查看一个进程消耗的CPU百分比,LAT列显示等待CPU时间的百分比。查看TFL和DFL决定一个进程是否或者怎样去等待内存页面调度,DFL栏显示花费在等待被服务的数据错误的时间百分比。如果该值过大,显示系统运行内存不足(后面还会介绍多种方法,用于分析系统内存不足)。有关重要事件的提示,比如磁盘或者网络等待,连同其他内核事件都绑定到SLP状态。因为SLP列包含磁盘读写,其他类型的调度也会影响到SLP状态显示花费的时间。比如,内核锁或者条件变量同样也会累积实际,并显示在此状态中。
二CPU和内存监控:vmstat
-bash-3.00$ vmstat 3
kthr memory page disk faults cpu
r bw swap free re mf pi po fr de sr s1 sdsd -- in sy cs ussy id
0 00 2001848 541208 23 233 71 19 37 2600 220 0 25 0 1185 25241464 2 1 97
0 00 1667384 140408 1 9 0 0 0 1904 0 0 0 4 0 507 476 908 0 0 99
0 00 1667384 140408 0 0 0 0 0 1232 0 0 0 3 0 484 565 922 0 1 99
0 00 1667376 140400 0 1 0 0 0 752 0 0 0 2 0 4811636 925 1 0 99
0 00 1667376 140384 0 0 0 0 0 272 0 0 0 3 0 521 651 880 0 0 99
0 00 1667376 140384 0 0 0 0 0 0 0 0 0 2 0 499 494 840 0 0 99
0 00 1667376 140344 50 177 8 0 0 0 0 0 0 4 0 1948 2746 2205 2 1 97
第一行是自启动以来的摘要信息,紧接着是每隔3秒钟一个示例。
参数说明:
Kthr:处于各种状态中的内核线程数量,包括:
Ø r:在运行队列中的内核线程数;
Ø b:在等待IO资源、分页等被阻塞得内核线程数;
Ø w:正在等待处理资源结束的被交换处的轻量级线程的数量。Memory:
Ø Swap:可用的交换空间(KB);
Ø Free: 剩余的物理内存(KB);
Page;显示页故障和分页活动性,以每秒为单位。
Ø Re:页要求归还(page reclaims);
Ø Mf:最小故障;
Ø Pi:页入(KB);
Ø Po:页出(KB);
Ø Fr:剩余页页出(KB);
Ø De:预计的短期内内存不足页出(KB);
Ø Sr:时钟算法扫描的页;
Disk:每秒磁盘操作数。S表示SCSI磁盘;
Faults:报告自陷/中断率;
Ø In:中断;
Ø Sy:系统调用;
Ø Cs:CPU上下文切换。