Linux服务器性能评估与优
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、影响Linux服务器性能的因素
1. 操作系统级
CPU
内存
磁盘I/O带宽
网络I/O带宽
2.程序应用级
二、系统性能评估标准
影响性能因
素
评判标准
好坏糟糕
CPU
user% + sys%<
70%
user% + sys%= 85%user% + sys% >=90%
内存Swap In(si)=0
Per CPU with 10
page/s More Swap In & Swap Out
Swap Out(so)=0
磁盘iowait % < 20%iowait % =35%iowait % >= 50%
其中:
%user:表示CPU处在用户模式下的时间百分比。
%sys:表示CPU处在系统模式下的时间百分比。
%iowait:表示CPU等待输入输出完成时间的百分比。
swap in:即si,表示虚拟内存的页导入,即从SWAP DISK交换到RAM
swap out:即so,表示虚拟内存的页导出,即从RAM交换到SWAP DISK。
三、系统性能分析工具
1.常用系统命令
Vmstat、sar、iostat、netstat、free、ps、top等
2.常用组合方式
•用vmstat、sar、iostat检测是否是CPU瓶颈
•用free、vmstat检测是否是内存瓶颈
•用iostat检测是否是磁盘I/O瓶颈
•用netstat检测是否是网络带宽瓶颈
四、Linux性能评估与优化
1. 系统整体性能评估(uptime命令)
[root@web1 ~]# uptime
16:38:00 up 118 days, 3:01, 5 users, load average: 1.22, 1.02, 0.91
这里需要注意的是:load average这个输出值,这三个值的大小一般不能大于系统CPU 的个数,例如,本输出中系统有8个CPU,如果load average的三个值长期大于8时,说明CPU很繁忙,负载很高,可能会影响系统性能,但是偶尔大于8时,倒不用担心,一般不会影响系统性能。相反,如果load average的输出值小于CPU的个数,则表示CPU还有空闲的时间片,比如本例中的输出,CPU是非常空闲的。
2. CPU性能评估
(1)利用vmstat命令监控系统CPU
该命令可以显示关于系统各种资源之间相关性能的简要信息,这里我们主要用它来看
CPU一个负载情况。
下面是vmstat命令在某个系统的输出结果:
[root@node1 ~]# vmstat 2 3
procs -----------memory---------- ---swap-- -----io---- --system--
-----cpu------
r b swpd free buff cache si so bi bo in
cs us sy id wa st
0 0 0 162240 8304 67032 0 0 13 21 1007
23 0 1 98 0 0
0 0 0 162240 8304 67032 0 0 1 0 1010
20 0 1 100 0 0
0 0 0 162240 8304 67032 0 0 1 1 1009
18 0 1 99 0 0
●Procs
r列表示运行和等待cpu时间片的进程数,这个值如果长期大于系统CPU的个数,说明CPU不足,需要增加CPU。
b列表示在等待资源的进程数,比如正在等待I/O、或者内存交换等。
●Cpu
us列显示了用户进程消耗的CPU 时间百分比。us的值比较高时,说明用户进程消耗
的cpu时间多,但是如果长期大于50%,就需要考虑优化程序或算法。
sy列显示了内核进程消耗的CPU时间百分比。Sy的值较高时,说明内核消耗的CPU 资源很多。
根据经验,us+sy的参考值为80%,如果us+sy大于80%说明可能存在CPU资源不足。
(2)利用sar命令监控系统CPU
sar功能很强大,可以对系统的每个方面进行单独的统计,但是使用sar命令会增加系统开销,不过这些开销是可以评估的,对系统的统计结果不会有很大影响。
下面是sar命令对某个系统的CPU统计输出:
[root@webserver ~]# sar -u 3 5
Linux 2.6.9-42.ELsmp (webserver) 11/28/2008 _i686_ (8 CPU) 11:41:24 AM
CPU %user %nice %system %iowait %steal %idle
11:41:27 AM all 0.88 0.00 0.29 0.00 0.00 98.83
11:41:30 AM all 0.13 0.00 0.17 0.21 0.00 99.50
11:41:33 AM all 0.04 0.00 0.04 0.00 0.00
99.92
11:41:36 AM all 90.08 0.00 0.13 0.16
0.00 9.63
11:41:39 AM all 0.38 0.00 0.17 0.04 0.00 99.41
Average: all 0.34 0.00 0.16 0.05 0.00 99.45
对上面每项的输出解释如下:
●%user列显示了用户进程消耗的CPU 时间百分比。
●%nice列显示了运行正常进程所消耗的CPU 时间百分比。
●%system列显示了系统进程消耗的CPU时间百分比。
●%iowait列显示了IO等待所占用的CPU时间百分比
●%steal列显示了在内存相对紧张的环境下pagein强制对不同的页面进行的steal操作。
●%idle列显示了CPU处在空闲状态的时间百分比。
问题
1.你是否遇到过系统CPU整体利用率不高,而应用缓慢的现象?
在一个多CPU的系统中,如果程序使用了单线程,会出现这么一个现象,CPU的