solaris性能监控详细解释

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Solaris 资源监控详细解释

因为经常需要在Solaris系统上分析资源使用状况，而网上或者书籍中资源监控命令总是零零碎碎的分散在各处，故将这个内容整理一下。

Ø RSS：进程常驻大小。表示映射到进程的物理内存总量，包括共享给其他进程的物理内存。

Ø TIME：进程累计执行时间。

Ø CPU：当前进程CPU使用时间的百分比；

Ø PROCESS/NLWP：进程名（执行文件名）以及进程的线程数。

Ø PID：进程ID号；

Ø USERNAME：实际的用户名（登陆名）或者用户ID。

Ø PRI：进程优先级，数字越大则优先级越高。

Ø NICE：用于优先级计算的精确数字。

在实际的性能问题分析过程中，需要关注的参数主要是Size，RSS，TIME，CPU，NLWP。在一些极端的情况下，TIME和CPU两项内容能表示系统出现了异常，比如TIME显示的数值非常大，明显不合常理，或者某个应用此时CPU使用率远比正常情况要大的多。

其次，在最后一行，prstat还给出了当前系统的进程数和线程数，以及系统在当前时刻，5分钟内，15分钟内的系统平均负载情况：

Total: 44 processes, 861 lwps,load averages: 2.09, 2.08, 2.07

这些数据都有助于我们了解系统的整体情况，后面会对平均负载的含义做详细说明。

在使用prstat获得一个对所有进程运行的整体印象后，可以进一步通过一些参数来观测某个具体应用进程的详细情况。

root@t139 #prstat -mLp 3411

PID USERNAME USR SYS TRP TFL DFL LCK SLP LATVCX ICX SCL SIG PROCESS/LWPID

3411 root 21 0.0 0.0 0.0 0.0 79 0.0 0.0 4 18 7 0java/10

3411 root 2.1 0.2 0.0 0.0 0.0 92 5.7 0.0285 7 939 0 java/3560

3411 root 0.5 0.0 0.0 0.0 0.0 99 0.50.0 37 0 143 0 java/4308

3411 root 0.0 0.0 0.0 0.0 0.0 14 86 0.0 2 0 8 0 java/120

……

Total: 1processes, 176 lwps, load averages: 0.05, 0.10, 0.16

-L：显示进程的线程信息；

-m：显示进程的微态；微态以时间基准来表示，并且以百分比形式分散到每个线程。

-p：指定观测的进程；

Ø LCK：进程花费在等待用户锁上的时间百分比；

Ø SLP：进程花费在休眠上的时间百分比；

Ø DFL: 显示花费在等待被服务的数据错误的时间百分比。如果该值较高，显示内存不足。

Ø LAT：进程花费在等待CPU上的时间。

Ø VCX The number of voluntary contextswitches.

Ø ICX The number of involuntary contextswitches.

Ø SCL The number of system calls.

Ø SIG The number of signals received.

可以使用USR和SYS的状态来查看一个进程消耗的CPU百分比，LAT列显示等待CPU时间的百分比。查看TFL和DFL决定一个进程是否或者怎样去等待内存页面调度，DFL栏显示花费在等待被服务的数据错误的时间百分比。如果该值过大，显示系统运行内存不足（后面还会介绍多种方法，用于分析系统内存不足）。有关重要事件的提示，比如磁盘或者网络等待，连同其他内核事件都绑定到SLP状态。因为SLP列包含磁盘读写，其他类型的调度也会影响到SLP状态显示花费的时间。比如，内核锁或者条件变量同样也会累积实际，并显示在此状态中。

二CPU和内存监控：vmstat

-bash-3.00$ vmstat 3

kthr memory page disk faults cpu

r bw swap free re mf pi po fr de sr s1 sdsd -- in sy cs ussy id

0 00 2001848 541208 23 233 71 19 37 2600 220 0 25 0 1185 25241464 2 1 97

0 00 1667384 140408 1 9 0 0 0 1904 0 0 0 4 0 507 476 908 0 0 99

0 00 1667384 140408 0 0 0 0 0 1232 0 0 0 3 0 484 565 922 0 1 99

0 00 1667376 140400 0 1 0 0 0 752 0 0 0 2 0 4811636 925 1 0 99

0 00 1667376 140384 0 0 0 0 0 272 0 0 0 3 0 521 651 880 0 0 99

0 00 1667376 140384 0 0 0 0 0 0 0 0 0 2 0 499 494 840 0 0 99

0 00 1667376 140344 50 177 8 0 0 0 0 0 0 4 0 1948 2746 2205 2 1 97

第一行是自启动以来的摘要信息，紧接着是每隔3秒钟一个示例。

参数说明：

Kthr：处于各种状态中的内核线程数量，包括：

Ø r：在运行队列中的内核线程数；

Ø b：在等待IO资源、分页等被阻塞得内核线程数；

Ø w：正在等待处理资源结束的被交换处的轻量级线程的数量。Memory:

Ø Swap:可用的交换空间（KB）；

Ø Free: 剩余的物理内存（KB）；

Page；显示页故障和分页活动性，以每秒为单位。

Ø Re：页要求归还(page reclaims);

Ø Mf：最小故障；

Ø Pi：页入（KB）；

Ø Po：页出（KB）；

Ø Fr：剩余页页出（KB）；

Ø De：预计的短期内内存不足页出（KB）；

Ø Sr：时钟算法扫描的页；

Disk：每秒磁盘操作数。S表示SCSI磁盘；

Faults：报告自陷/中断率；

Ø In：中断；

Ø Sy：系统调用；

Ø Cs：CPU上下文切换。