AIX 5L 内存性能优化
AIX性能下降检查解决案例
AIX性能下降检查解决案例(客户名称、时间、问题关键字)【处理时间】2016年8月1日【客户名称】华夏信用卡【主机信息】要有详细的硬件描述、数据库版本描述主机:IBM 、8205-E6D 四个Lpar分区操作系统:AIX 7100-03-05数据库:【业务系统】业务系统名称、有版本信息更好【关键字】Lpar、CPU折叠功能、性能优化。
关键字3个【处理人员】系统集成--刘党旗【问题说明】现象:对于使用共享CPU的AIX分区,当系统负载偏低时,基于JAVA的应用程序可能会被延迟执行,交易执行时间变长。
事件分析主要原因是在分区负载偏低时,AIX操作系统的CPU折叠功能只开启一个虚拟CPU,所有线程均被调度到该CPU 的第一个线程中。
解决方案可以通过HMC/ASMI设置,关闭操作系统的CPU折叠功能**折叠功能对系统的影响** 关闭CPUfolding的影响:关闭了系统内核对微分区环境的自动调度优化;所有的VP都会被调度到hypervisor,不管这些VP上是否有实际负载;更高的hypervisor延时,物理资源亲和度也可能受到影响。
** 关闭CPU folding的好处:对于分区sizing非常完美的情形下,比如EC:VP始终控制在不低于1:2,而且处理器池资源从未受限,这时关闭folding可能获得一定的性能收益(主要是通过减少VPM管理开销,以及避免unfold展开CPU 延迟)后续跟踪性能优化明显**折叠功能介绍虚拟处理器管理(VirtualProcessorManagement),也称之为处理器折叠技术(CPUFolding),是一项Power虚拟化特性,用于控制一个LPAR处理使用的VP(VirtualProcessor)数量。
按目前AIX的设置,默认对微分区(即共享处理器分区)开启了处理器折叠功能;而专有处理器分区(dedicatedLPAR)则默认关闭此功能。
处理器折叠技术的作用主要体现在两个方面:1)节能,如果一个物理核心对应的所有VP都处于被折叠状态PowerVMhypervisor可以将这颗核心置于低能耗状态。
IBM_UNIXLinux-AIX_5L系统管理技术
IBM_UNIXLinux-AIX_5L系统管理技术《IBM UNIX&Linux-AIX 5L系统管理技术》读后感读完《IBM UNIX&Linux-AIX 5L系统管理技术》这本书,明白了AIX操作系统的特点,与windows系统的差异,同时掌握了AIX操作系统的一些命令,具体如下:一、与windows系统的差异1.相对于Windows,linux系统是非图形界面;2.安装前需要各种参数的设置;3.设置后安装过程大概2个小时;4.安装完重启后自动显示配置向导:Installation Assistant,包括日期、时间,root密码等。
二、数据对象管理ODM的认知ODM:Object Data Manager,数据对象管理;AIX自带的一个小型关系型数据库,包括对象(ODM Object),对象类(ODM Object Class),数据库(ODM Database);AIX呈现给SA的管理接口是SMIT,而对内的接口则是一组操作ODM数据库的系统级命令和脚本,ODM命令仅在使用SMIT无效时使用,属于低级操作;ODM的几个命令:odmcreate:创建空的对象类,产生.c(源)和.h(包含)文件;odmadd:添加对象到创建的对象类中;odmchange:更改指定对象类中选定的对象;odmdelete:从指定对象类中删除选定的对象;odmdrop:删除一个对象类;odmshow:在屏幕上显示对象类定义;odmget:从指定对象类中检索对象到odmadd命令的输入文件;三、SMIT工具应用相当于sco unix的scoadmin;SMIT:System Management Interface Tool,系统管理界面工具;SMIT有全屏幕文本模式和图形X Windows模式;管理包括:安装与维护设置,软件license管理,进程及子系统管理,存储管理,设备管理,网络管理,用户及安全管理,打印服务管理,应用软件管理,等等;运行SMIT工具,系统会自动生成三个文件:smit.cript,smit.log,smit.transaction;smit.cript:记录所有通过SMIT菜单执行的AIX命令;smit.log:记录系统所访问的菜单、对话内容、所执行的命令及输出结果、错误信息;smit.transaction:记录所有通过SMIT执行的AIX命令及命令的说明;通scoadmin一样,SMIT也有许多快捷路径命令;如:smit chuer:smit—>Security&Users—>Users—>Change/Show Characteristics ofa User;四、用户、组及安全管理同sco unix一样,进入root用户,属于单用户模式;root角色:root用户,普通真实用户,虚拟用户,虚拟用户不具有登录系统的能力,但却是系统不可或缺的用户,如:bin、daemon、adm、mail等;用户与组的对应关系可以有:一对一、一对多、多对一、多对多;用户管理文件:/etc/passwd,包括7个字段:Username:Password:UID:GID:GECOS(用户信息说明):Directory(用户宿主目录):Shell(用户所用Shell);组管理文件:/etc/group,包括4个字段:Groupname:Password:GID:User-list;显示用户账号:smit lsuser;创建用户账号:useradd;更改用户账号:usermod;删除用户账号:userdel;验证用户账号:usrck创建组:smitty mkgroup;更改组:smitty chgroup;删除组:smitty rmgroup;显示ID状态:id,显示用户信息:who,切换用户:su五、安全管理/etc/security/passwd:用户账号及密码;passwd:创建用户密码;pwdadm:创建用户密码并管理;pwdck:验证用户信息的正确性;/etc/security/user:用户账号参数信息;/etc/security/group:组扩展信息;/etc/security/login.cfg:登录验证配置信息;/etc/security/limits:限制用户使用系统资源的信息;/etc/security/lastlog:上次登录信息;/ect/motd:公告文件,登录时显示的信息;六、进程管理三类进程:交互进程、批处理进程、守护进程,守护进程是系统启动时自动启动或root 用户启动,在后台运行,可以在/ect/inittab 中看到系统启动的守护进程;程序权限:r、w、x,改变命令:chmod;查看进程命令:ps监控进程、cpu、硬盘、网络等设备状态:topas,输出结果有固定部分和可变部分,cup 使用率,网络接口,物理硬盘,工作负载等为可变部分;查看AIX版本命令:oslevelctrl+z:挂起正在执行的进程作业;jobs查看进程作业状态,挂起的显示为:stopped;jobs -l:查看所有被挂起的进程作业;fg,bg:对挂起的进程作业进行前台或后台运行;bg %3:对3号挂起进程后台运行;nohup:进程后台运行,即使当前会话关闭,也不影响进程的后台执行;终止进程:kill,killall;进程优先级:调整命令:nice,renice/proc文件系统:伪文件系统,用于AIX操作进程;proccred:显示进程凭证,主要是UID,GID;procfiles:显示进程打开的所有文件信息;procflags:显示进程的跟踪标志,暂挂和挂起信号;procldd:显示进程装入的对象;procmap:显示进程的地址空间映射;procsig:显示进程定义的信号的操作;procstack:显示进程中所有线程的十六进制地址和符号名称;proctree:显示包含指定进程标示或用户的进程树;procwait:等待指定进程的终止;procwdx:显示进程的当前工作目录;七、设备管理管理:增删改查应用程序与逻辑设备交互,操作系统通过设备驱动程序处理逻辑设备与物理设备之间的交互;ls /dev,显示dev下的设备文件(逻辑设备);lsdev:显示系统中的设备列表;lsattr:显示系统中设备的属性;lscfg:显示设备的配置;prtconf:显示系统的整个配置;设备配置命令:cfgmgr;添加新的物理设备配置:mkdev,root权限;更改设备属性:chdev;删除设备:rmdev;使用SMIT进行设备管理更方便;使用命令进行设备管理有助于理解设备管理的概念;其实SMIT也是调用的设备管理命令;八、存储管理物理卷(PV,Physical Volume),物理磁盘;卷组(VG,Volume Group),一个物理卷组包括多个物理卷;物理分区(PP,Physical Partition),磁盘空间分配的最小单位,1-256M(若大于1M,必须是4M的整数倍)的一块连续磁盘空间,一个物理卷最多有1016个物理分区;逻辑卷(LV,Logical Volume),若干个逻辑分区组成(不超过35512),在逻辑卷上,我们建立文件系统,也可用于Pagine Space、JFSLOG或作为裸设备供数据库使用;逻辑分区(LP),一般与物理分区一一对应,但对LP做了镜像时,一个LP可以对应2-3个PP;卷组描述区(VGDA,Volume Group Description Area),存放于每一个物理卷的开始处,用于描述相关信息;物理卷属性显示:lspv,也可smit lspv;物理卷属性更改:chpv,smit chpv;物理卷数据迁移:migratepv,smitty migratepv,将一个已分配的物理分区从一个物理卷移动到另一个或多个其他物理卷;卷组属性显示:lsvg;卷组的创建:mkvg;卷组属性更改:chvg;向卷组添加物理卷:extendvg;从卷组删除物理卷:reducevg;激活卷组:varyonvg;关闭卷组:varyoffvg,与激活卷组相反操作;导出卷组:exportvg,先关闭再导出;导入卷组:importvg;重组卷组物理分区:reorgvg,在卷组内重组分配的物理分区的布局;重新定义卷组:redefinevg,读取物理卷的保留区域,检查一致性;创建卷组镜像:mirrorvg;删除卷组镜像:unmirrotvg;卷组数据同步:syncvg,同步卷组中逻辑卷副本(镜像);逻辑卷属性显示:lslv;逻辑卷创建:mklv;逻辑卷属性更改:chlv;逻辑卷删除:rmlv;增加逻辑卷容量:extendlv;复制逻辑卷:cplv,将一个逻辑卷内容复制到一个新的逻辑卷;创建逻辑卷副本:mklvcopy,镜像;删除逻辑卷副本:rmlvcopy;分离逻辑卷副本:splitlvcopy,分割一个逻辑卷的副本并从它们创建新的逻辑卷;同步逻辑卷ODM库信息:synclvodm;九、文件系统管理文件系统显示:lsfs;文件系统创建:mkfs,crfs,mkfs是在已有逻辑卷基础上创建,crfs是在卷组中创建,并且自动创建逻辑卷;文件系统更改:chfs;文件系统挂载:mount,文件系统创建后必须挂载才能使用;文件系统卸载:unmount;文件系统删除:rmfs;文件系统验证:fsck,检查文件系统的一致性,并以交换方式修复文件系统;文件系统监控:df,显示文件系统的总空间和可用空间信息;碎片整理:defragfs;rootvg根文件系统:/etc:系统配置文件,一般用于系统管理;/bin:指向/usr/sbin目录的符号链接;/sbin:包含安装引导计算机和安装/usr文件系统时所需的文件;/dev:包含设备节点和本地设备的特殊文件;/tmp:存放临时文件;/var:/var文件系统安装挂载点,随着系统运行自动增加;/home:/home文件系统安装挂载点,保存用户的数据文件和目录,位于/dev/hd1逻辑卷上;/usr:/usr文件系统安装挂载点,包含许多只读的命令、程序库和数据;/lib:指向/usr/lib目录的符号链接;/opt:/opt文件系统安装挂载点,存放安装附件或第三方软件,位于/dev/hd10opt逻辑卷上;/usr文件系统:/usr/bin:二进制命令和shell脚本;/usr/ccs:二进制开发包;/usr/include:c语言的include文件/usr/lbin:命令后端的可执行文件;/usr/lib:系统中独立的程序库;/usr/lpp:已经安装的可选软件产品的软件包;/usr/sbin:用于系统管理的工具,如smit工具命令等;/usr/share:被共享的文本文件;/usr/adm:指向/var/adm目录的符号链接;/usr/mail:指向/var/spool/mail目录的符号链接;/usr/news:指向/var/news目录的符号链接;/usr/preserve:指向/var/preserve目录的符号链接;/usr/spool:指向/var/spool目录的符号链接;/usr/tmp:指向/var/tmp目录的符号链接;/var文件系统:保存系统的日志文件,自动增大,存在在/dev/hd9var逻辑卷上;/var/adm:系统的日志文件和记账文件;/var/news:系统新闻;/var/preserve:保存由编辑器(如vi)正在处理的文件,保护这些数据不会被中断破坏;/var/spool:存放电子邮件、打印机脱机程序等;/var/tmp:临时文件;十、页空间管理页空间(Paging Space)是在硬盘上存储内存信息的区域,也叫交换空间(Swap Space);系统安装时会默认在hdisk0上创建一个默认页逻辑卷(hd6);显示页空间信息:lsps;创建页空间:mkps;激活页空间:swapon;关闭页空间:swapoff;修改页空间:chps;删除页空间:rmps;十一、网络管理ifconfig命令:配置或显示TCP/IP网络的网络接口参数;ping命令:netstat命令:显示网络状态类同linux网络命令;smitty mktcpip:smitty mkhostname:smitty route:十二、备份与恢复磁带设备控制命令:tctl:磁带控制命令;mt:功能类同tctl;tcopy:磁带复制,从一个磁带复制到另一个磁带,但最常用的是查看当前磁带的内容;显示备份系统:lsmksysb,smitty lsmksysb;备份系统:mksysb,smitty mksysb;系统恢复:重新启动—>SMS Menu—>Multiboot—>Select Boot Devices(磁带:2 SCSI Tape)—>Install Operating System (磁带:2 SCSI Tape)—>Installation and Maintenance(3 Start Maintenance Mode for System Recovery)—>Maintenance(6 Install from a System Backup)—>Choose mksysb Device—>System Backup Installation and Settings 非rootvg卷组备份显示:lssavevg;非rootvg卷组备份:savavg;非rootvg卷组恢复:restvg;文件与文件系统备份:backup;文件与文件系统恢复:restore;tar:归档或解包;cpio:归档、解包;pax:归档、解包(对于当个文件大于2G时使用)通过对学习,初步对AIX系统有了系统的了解,对系统组成以及设计结构有了较为清晰的认知,特别是安全管理方面有了较深入了解,对系统运维有了手段进一步提升。
AIX 5L系统管理 培训资料
理 3. 页空间的管理
1.基本概念及相互关系
PP (物理分区) (1) 磁盘存储的最小(基本)存储单元 (2)缺省为4MB
PV (物理卷) (1)实际的物理磁盘 (2)当pv加入系统后,产生/dev/hdisk* (3)pv只有加入到卷组中才是可用的 (4)pv只能属于一个卷组 (5)每个pv最多包含1016个pp
fs (文件系统) (1) 数据的存储方式 (2) 文件系统得类型 jfs jfs2 cdrfs nfs (3)文件系统与lv的关系是一一对应的
2.卷组,物理卷,逻辑卷,文件系 统的管理
卷组的管理 (1) rootvg 操作系统所在VG,包含操作系统启动所 需的基本LV # lsvg rootvg # lsvg –l rootvg
AIX 5L系统管理
北京深思软件股份有限公司
一.系统简介
1.pSeries服务器简介 2.AIX5L的新特性 3.POWER处理器 4.AIX5L内核
1.pSeries服务器简介
入门级/部门级服务器 pSeries 610 (6C1/6E1) pSeries 620 (6F0,6F1) pSeries 630 (6C4/6E4) pSeries 640 (B80) 中端服务器 pSeries 660 (6H0,6H1,6M1) pSeries 670 企业级服务器 pSeries 680 pSeries 690
删除软件 # smitty 软件的升级 (1)操作系统的升级 # smitty update_all # oslevel –r # instfix –i |grep ML (2)软件的升级 根据不同软件有不同的方法
三.逻辑卷管理器
1. 基本概念及相互关系 2. 卷组,物理卷,逻辑卷,文件系统的管
AIX系统参数配置
AIX系统参数配置AI某内核属于动态内核,核心参数基本上可以自动调整,因此当系统安装完毕后,应考虑修改的参数一般如下:一、单机环境1、系统用户的最大登录数ma某loginma某login的具体大小可根据用户数设定,可以通过mittychlicene 命令修改,该参数记录于/etc/ecurity/login.cfg文件,修改在系统重新启动后生效。
2、系统用户的limit参数这些参数位于/etc/ecurity/limit文件中,可以把这些参数设为-1,即无限制,可以用vi修改/etc/ecurity/limit文件,所有修改在用户重新登录后生效。
default:fize=2097151----》改为-1core=2097151cpu=-1data=262144----》改为-1r=65536tack=65536nofile=20003、PagingSpace检查pagingpace的大小,在物理内存<2G时,应至少设定为物理内存的1.5倍,若物理内存>2G,可作适当调整。
同时在创建pagingpace时,应尽量分配在不同的硬盘上,提高其性能。
利用mittychp修改原有pagingpace的大小或mittymkp增加一块pagingpace。
4、系统核心参数配置利用lattr-Ely0检查ma某uproc,minpout,ma某pout等参数的大小。
ma某uproc为每个用户的最大进程数,通常如果系统运行DB2或ORACLE是应将ma某uproc调整,Default:128、调整到500,ma某uproc增加可以马上起作用,降低需要AI某重起。
当应用涉及大量的顺序读写而影响前台程序响应时间时,可考虑将ma某pout设为33,minpout设为16,利用mittychgy来设置。
5、文件系统空间的设定一般来说,系统的文件系统/、/ur、/var、/tmp的使用率不要超过80%,/tmp建议至少为300M,文件系统满可导致系统不能正常工作,尤其是AI某的基本文件系统,如/(根文件系统)满则会导致用户不能登录。
浅议AIX操作系统下应用系统的维护与性能优化
浅议AIX操作系统下应用系统的维护与性能优化摘要:AIX操作系统作为一种高可靠、高性能的操作系统,被广泛应用于金融、电信、制造等行业的服务器系统上。
本文将针对在AIX操作系统下应用系统的维护与性能优化进行论述。
首先,介绍了AIX操作系统的特点以及应用程序在其中的调度方式,并探讨了应用程序在AIX操作系统下的常见问题。
然后,从操作系统级别、网络级别以及应用程序级别三个方面着手对AIX操作系统下应用系统的维护进行了深入阐述。
最后,针对AIX操作系统下应用系统的性能优化,提出了基于硬件、操作系统和应用程序三个方面的优化措施。
关键词:AIX操作系统、应用系统维护、性能优化、调度方式、优化措施正文:一、AIX操作系统的特点及应用程序的调度方式AIX操作系统是IBM公司推出的一种商业级别的UNIX操作系统。
它具有高可靠性、高性能、高伸缩性、高安全性等特点,被广泛应用于金融、电信、制造等行业的服务器系统上。
在AIX操作系统下,应用程序的调度方式是通过进程、线程进行的。
进程是AIX操作系统中的一种资源分配单位,而线程是进程中最小的调度单位。
应用程序启动后,操作系统会为其分配进程和线程资源,并通过在进程和线程之间的切换,协调应用程序的运行。
在AIX操作系统下,应用程序存在着一些常见问题,如进程、线程崩溃、进程池资源泄露以及线程饥饿等。
这些问题通常是由于操作系统或应用程序自身的问题引起的,因此,对于AIX操作系统下的应用系统,维护和优化至关重要。
二、AIX操作系统下应用系统的维护(一)操作系统级别的维护在AIX操作系统下,进行操作系统级别的维护是确保应用系统稳定、高效运行的关键。
操作系统级别的维护主要包括以下方面:1、定期扫描安全漏洞,防范恶意攻击;2、定期进行操作系统补丁更新,确保操作系统处于最新状态;3、定期清理系统日志和垃圾文件,释放系统资源;4、定期备份系统数据和应用程序,确保数据安全;5、定期进行系统性能分析和优化,寻找存在的性能瓶颈并及时解决。
aix网络参数调整
64 84 2418 0 0 44 720 0
128 103 881463 0 0 313 360 17
。。。
使用下述方法之一调整网络内存:
a. 如果是32位核心,并且内存小于2GB,增大系统内存。
b. 使用chdev 命令来修改参数,如:
#chdev –l en0 –a tcp_recvspace=65536 –a tcp_space=65536
会修改ODM中的内容,所以在重新开机后参数也会生效。
4.网络适配器 (network adapter) 发送/接收队列的调整
在AIX 中,网络性能的优化可从以下几方面进行:
网络内存(network memory)的调整
socket 缓冲区 (socket buffer) 的调整
网络接口(network interface)参数的调整
网络适配器 (network adapter) 上发送/接收队列的调整
使用 chdev 或 smit 来调整相应队列的值,如:
# chdev -l entx -a tx_que_sz=16384
5. 名字解析(name resolution) 的查找顺序
在AIX中缺省名字解析的顺序是DNS àNIS à/etc/hosts。
可以使用 /etc/netsvc.conf文件或 NSORDER环境变量来改变缺省的名字解析顺序,以提高名字解析的速度,若/etc/netsvc.conf文件和 NSORDER环境变量同时存在,则NSORDER起作用。
b. 如果是64位核心,并且内存小于65GB,增大系统内存。
c. 如果可能,将32位核心改成64位核心,增大系统内存。
d. 检查socket 的发送/接收缓存区的大小,以确定是否可将其减小。
泛微e-cology常见_问题解决及性能调优
常见问题之安装问题
3. License无法提交,提示License信息错误
用户环境: Windows、AIX、Linux
问题原因: 有些系统的文件编码并非GBK,导致文件上传后无法识别License文件信息。
解决方法: Windows: 1) 卸载Resin服务,使用命令 httpd.exe -remove 2) 重新安装Resin服务,使用命令重新安装Resin服务
应用并重启数据库使配置生效此操作具有一定危险性请配置前备份数据库最好由客户dba来配置常见问题之性能调优2优化oracle系统参数如果系统使用人数非常多需要调整下oracle的处理进程数
e-cology常见问题解 决及性能调优
常见问题及解决方法
安装问题
常见问题之安装问题
1.迁移、恢复Ecology系统后,License无法提交
常见问题之性能调优
Linux: 修改/usr/weaver/resin-2.1.14/bin/startresin.sh文件 /usr/weaver/resin-2.1.14/bin/httpd.sh -Xms1024M –Xmx1800M -Xss150k &
Linux下检查JDK
JDK版本号
Linux系统不同 支持的JDK大小 各有差异,要得 到最优配置就使
SQL脚本如下:
/usr/weaver/resin-2.1.14/bin/httpd.sh –Xms1024M -Xmx1800M -Dfile.encoding=GBK -Xss150k &
常见问题之安装问题
4. Linux环境下登录系统后所有页面显示乱码
用户环境: Linux、AIX
问题原因: 系统未安装GBK语言包,或者当前非GBK环境。
AIX5L系统管理培训教程
04
AIX5L系统进程管理
进程概念及类型
进程定义
进程是操作系统中进行资源分配 和调度的基本单位,是程序的执
行过程。
进程类型
根据进程的性质和作用,可分为系 统进程、用户进程和守护进程等。
进程状态
进程在执行过程中,会呈现不同的 状态,如运行、就绪、阻塞等。
查看进程状态
ps命令
用于显示当前系统中进程 的状态信息,如进程ID、 父进程ID、进程状态等。
根据数据价值和存储空间,设定合理的备份保留期限 。
常用备份工具介绍
AIX5L系统自带备份工具
如`tar`、`cpio`等,可实现基本的数据备份 功能。
第三方备份软件
如Veritas NetBackup、IBM Tivoli Storage Manager等,提供更强大的备份和恢复功能。
网络备份设备
常见选项
-r(递归删除目录及其内容)、-f(强制删除,不提示确认)
用户和组管理
useradd:添加用户 用法:`useradd [选项] 用户名`
常见选项:`-d`(指定用户主目录)、`-g`(指定用户所属组)
用户和组管理
userdel:删除用户 用法:`userdel [选项] 用户名` 常见选项:`-r`(同时删除用户主目录和邮件池)
学习如何创建文件系统,包括选择合适的文件系统类型、设置文件系统
参数等。
03
文件系统挂载与卸载
掌握如何挂载和卸载文件系统,以及如何在系统启动时自动挂载文件系
统。
磁盘配额管理
磁盘配额概念
了解磁盘配额的概念和作用,以及它在AIX5L系统中的实 现方式。
磁盘配额设置
学习如何设置磁盘配额,包括对用户和组设置磁盘使用限 制、设置配额宽限期等。
AIX性能调优-牛新庄-
AIX性能调优系统资源(物理资源,逻辑资源)系统瓶颈性能概念一个程序执行步骤性能调整流程Instructor GuideFigure 1-6. Program Execution Hierarchy AU187.0 Notes:IntroductionIn the graphic above, the left side represents hardware entities that are loosely matched to the appropriate operating system entity on the right side. A program must go from the lowest level of being stored on disk, to the highest level being the processor running program instructions.Hardware hierarchy overviewWhen a program runs, it makes its way up the hardware and operating systemhierarchies, more or less in parallel. Each level on the hardware side is scarcer and more expensive than the one below it. There is contention for resources amongprograms and time spent in transitional from one level to the next. Usually, the time required to move from one hardware level to another consists primarily of the latency of the lower level, that is, the time from the issuing of a request to the receipt of the first data.1-18 AIX 5L System Administration III© Copyright IBM Corp. 2000, 2006Course materials may not be reproduced in whole or in partInstructor Guide Disks are the slowest hardware operationBy far the slowest operation that a running program does (other than waiting on a human keystroke) is to obtain code or data from a disk. Disk operations are necessary for read or write requests for programs. System tuning activities frequently turn out to be hunts for unnecessary disk I/O or searching for disk bottlenecks since disk operations are the slowest operations. For example, can the system be tuned to reduce paging? Is one disk too busy causing higher seek times because it has multiple filesystems which have a lot of activity?Real memoryRandom Access Memory (RAM) access is fast compared to disk, but much moreexpensive per byte. Operating systems try to keep program code and data that are in use in RAM. When the operating system begins to run out of free RAM, it needs to make decisions about what types of pages to write out to disk. Virtual memory is the ability of a system to use disk space as an extension of RAM to allow for more efficient use of RAM.Paging and page faultsIf the operating system needs to bring a page into RAM that has been written to disk or has not been brought in yet, a page fault occurs, and the execution of the program is suspended until the page has been read in from disk. Paging is a normal part of the operation of a multi-processing system. Paging becomes a performance issue when free RAM is short and pages which are in memory are paged-out and then paged back in again causing process threads to wait for slower disk operations. How virtual memory works will be covered in another unit of this course.Translation Lookaside Buffers (TLBs)One of the ways that programmers are insulated from the physical limitations of the system is the implementation of virtual memory. The programmer designs and codes the program as though the memory were very large, and the system takes responsibility for translating the program's virtual addresses for instructions and data into realaddresses that are needed to get the instructions and data from RAM. Since thisaddress-translation process is time-consuming, the system keeps the real addresses of recently accessed virtual memory pages in a cache called the Translation Lookaside Buffer (TLB).As long as the running program continues to access a small set of program and data pages, the full virtual-to-real page-address translation does not need to be redone for each RAM access. When the program tries to access a virtual-memory page that does not have a TLB entry, called a TLB miss, dozens of processor cycles, called theTLB-miss latency are required to perform the address translation.© Copyright IBM Corp. 2000, 2006Unit 1. Performance Analysis and Tuning Overview1-19Course materials may not be reproduced in whole or in partInstructor GuideCachesTo minimize the number of times the program has to experience the RAM latency, systems incorporate caches for instructions and data. If the required instruction or data is already in the cache (a cache hit), it is available to the processor on the next cycle (that is, no delay occurs); otherwise, a cache miss occurs. If a given access is both a TLB miss and a cache miss, both delays occur consecutively.Depending on the hardware architecture, there are two or three levels of cache, usually called L1, L2, and L3. If a particular storage reference results in an L1 miss, then L2 is checked. If L2 generates a miss, then the reference goes to the next level, either L3, if it is present, or RAM.Pipeline and registersA pipelined, superscalar architecture allows for the simultaneous processing of multipleinstructions, under certain circumstances. Large sets of general-purpose registers and floating-point registers make it possible to keep considerable amounts of the program's data in registers, rather than continually storing and reloading the data.Operating system hierarchy overviewThe operating system works on a thread level. When a user requests the execution of a program, AIX performs a number of operations to transform the executable program on disk to a running program. First, the directories in the user's current PATH must be scanned to find the correct copy of the program. Then the system loader (not to be confused with ld, the binder) must resolve any external references from the program to shared libraries. Finally, the system branches to the entry point of the program and the resulting page fault causes the program page that contains the entry point to be brought into RAM.Interrupt handlersThe mechanism for notifying the operating system that an external event has taken place is to interrupt the currently running thread and transfer control to an interrupt handler (FLIH or SLIH). Before the interrupt handler can run, enough of thegeneral-purpose registers must be saved to ensure that the system can restore the context of the running thread after interrupt handling is complete.ThreadsA thread is the current execution state of a single instance of a program. In AIX, accessto the processor and other resources is allocated on a thread basis, rather than a process basis. Multiple threads can be created within a process by the application program. Those threads share the resources owned by the process within which they are running.1-20 AIX 5L System Administration III© Copyright IBM Corp. 2000, 2006Course materials may not be reproduced in whole or in partWaiting threadsWhenever an executing thread makes a request that cannot be satisfied immediately, such as an I/O operation (either explicit or as the result of a page fault) or the granting ofa lock, it is put in a Wait state until that request is complete. Normally, this results inanother set of TLB and cache latencies, in addition to the time required for the request itself. However, it also allows other threads which are ready to run to gain access to the CPU.When a thread is replaced by another thread on a CPU, this is a context switch. A context switch can also occur when a thread finishes its timeslice or, as stated above, it must wait for a resource. Whenever a context switch occurs, there may be additional latencies due to cache misses. Context switches are a normal function of amulti-processing system, but an abnormally high rate of context switches could be a symptom of a performance problem.Dispatchable threadsWhen a thread is dispatchable, but not actually running, it is put in a run queue to run on an available CPU. If a CPU is available, it will run right away, otherwise it must wait. Currently dispatched threadThe scheduler chooses the thread that has the strongest claim to use the processor.When the thread is dispatched, the logical state of the processor is restored to what was in effect when the thread was last interrupted.Effect of the use of cache, RAM, and paging space on program performanceAccess time for the various components increase exponentially as you move away from the processor. For example, a one second access time for a 1 GHz CPU would be the equivalent of 100 seconds for a L3 cache access, 6 minutes for a RAM access, and 115 days for a local disk access! As you can see, the closer you are to the core, the faster the access is. Understanding how to reduce more expensive (performance-wise)bottlenecks is key to performance management.© Copyright IBM Corp. 2000, 2006Unit 1. Performance Analysis and Tuning Overview1-21Course materials may not be reproduced in whole or in partFigure 1-8. Performance Analysis Flowchart AU187.0 Notes:Tuning is a processThe flowchart in the visual above can be used for performance analysis and it illustrates that tuning is an iterative process. We will be following this flowchart throughout our course.The starting point for this flowchart is the Normal Operations box. The first piece of data you need is a performance goal. Only by having a goal, or a set of goals, can you tell if there is a performance problem. The goals may be something like a specific response time for an interactive application or a specific length of time in which a batch job needs to complete. Tuning without a specific goal could in fact lead to the degradation of system performance.Once you decide there is a performance problem and you analyze and tune the system, you must then go back to the performance goals to evaluate whether more tuning needs to occur.© Copyright IBM Corp. 2000, 2006Unit 1. Performance Analysis and Tuning Overview1-27Course materials may not be reproduced in whole or in partAdditional testsThe additional tests that you perform at the bottom right of the flowchart relate to the four previous categories of resource contention. If the specific bottleneck is well hidden, or you missed something, then you must keep testing to figure out what is wrong. Even when you think you’ve found a bottleneck, it’s a good idea to do additional tests to identify more detail or to make sure one bottleneck is not masquerading as another. For example, you may find a disk bottleneck, but in reality it’s a memory bottleneck causing excessive paging.1-28 AIX 5L System Administration III© Copyright IBM Corp. 2000, 2006Course materials may not be reproduced in whole or in partFigure 1-9. Performance Analysis Tools AU187.0 Notes:CPU analysis toolsCPU metrics analysis tools include:-vmstat, iostat, sar, lparstat and mpstat which are packaged with bos.acct -ps which is in bos.rte.control-cpupstat which is part of mands-gprof and prof which are in bos.adt.prof-time (built into the various shells) or timex which is part of bos.acct-emstat and alstat are emulation and alignment tools from bos.perf.tools-netpmon, tprof, locktrace, curt, splat, and topas are in bos.perf.tools-trace and trcrpt which are part of bos.sysmgt.trace-truss is in bos.sysmgt.ser_aids1-30 AIX 5L System Administration III© Copyright IBM Corp. 2000, 2006Course materials may not be reproduced in whole or in partInstructor Guide-smtctl is in bos.rte.methods-Performance toolbox tools such as xmperf, 3dmon which are part of perfmgr Memory subsystem analysis toolsSome of the memory metric analysis tools are:-vmstat which is packaged with bos.acct-lsps which is part of bos.rte.lvm-topas, svmon and filemon are part of bos.perf.tools-Performance toolbox tools such as xmperf, 3dmon which are part of perfmgr-trace and trcrpt which are part of bos.sysmgt.trace-lparstat is part of bos.acctI/O subsystem analysis toolsI/O metric analysis tools include:-iostat and vmstat are packaged with bos.acct-lsps, lspv, lsvg, lslv and lvmstat are in bos.rte.lvm-lsattr and lsdev are in bos.rte.methods-topas, filemon, and fileplace are in bos.perf.tools-Performance toolbox tools such as xmperf, 3dmon which are part of perfmgr-trace and trcrpt which are part of bos.sysmgt.traceNetwork subsystem analysis toolsNetwork metric analysis tools include:-lsattr and netstat which are part of .tcp.client-nfsstat and nfs4cl as part of .nfs.client-topas and netpmon are part of bos.perf.tools-ifconfig as part of .tcp.client-iptrace and ipreport are part of .tcp.server-tcpdump which is part of .tcp.server-Performance toolbox tools such as xmperf, 3dmon which are part of perfmgr-trace and trcrpt which are part of bos.sysmgt.trace© Copyright IBM Corp. 2000, 2006Unit 1. Performance Analysis and Tuning Overview1-31Course materials may not be reproduced in whole or in partInstructor GuideAIX 5L V5.3 enhancements to analysis toolsSeveral changes were made in AIX 5L V5.3 to the analysis tools. Changes were made at different maintenance levels for V5.3.The tprof command has new -E option to enable event based profiling and the new -f option allows you to set the sampling frequency for event-based profiling. There were updates to PMAPI including updates to pmlist and there are two new commands for hardware analysis: hpmcount and hpmstat. These are not covered in this course.The topas command has a new -D panel for disk analysis.There are new commands for obtaining statistics specific to a logical partition. These give statistics for POWER Hypervisor activity or for tracking real CPU utilization in a simultaneous multi-threading or shared processor (Micro-Partition) environment. A new register was added called the Processor Utilization Resource Register (PURR) to track logical and virtual processor activity. Commands such as sar and topas willautomatically use the new PURR statistics when in a simultaneous multi-threading or shared processor (Micro-Partition) environment and you will see new columns reporting partition statistics in those environments. Trace-based commands now have new hooks for viewing PURR data. Some commands such as lparstat, mpstat, and smtctl are new for AIX 5L V5.3 and work in a partitioned environment.The AIX 5L Virtualization Performance Management course covers all differences in performance analysis and tuning in a partitioned environment.1-32 AIX 5L System Administration III© Copyright IBM Corp. 2000, 2006Course materials may not be reproduced in whole or in partInstructor GuideFigure 1-10. Performance Tuning Process AU187.0 Notes:OverviewPerformance tuning is one aspect of performance management. The definition ofperformance tuning sounds simple and straight forward, but it’s actually a complex process.Performance tuning involves managing your resources. Resources could be logical (queues, buffers, etc.) or physical (real memory, disks, CPUs, network adapters, etc.).Resource management involves the various tasks listed here. We will examine each of these tasks later.Tuning always must be done based on performance analysis. While there arerecommendations as to where to look for performance problems, what tools to use, and what parameters to change, what works on one system may not work on another. So there is no cookbook approach available for performance tuning that will work for all systems.The wheel graphic in the visual above represents the phases of a more formal tuning project. Experiences with tuning may range from the informal to the very formal where reports and reviews are done prior to changes being made. Even for informal tuning actions, it is essential to plan, gather data, develop a recommendation, implement, and document.Figure 1-11. Performance Tuning Tools AU187.0 Notes:CPU tuning toolsCPU tuning tools include:-nice, renice, and setpri modify priorities.nice and renice are in the bos.rte.control fileset.setpri is a command available with the perfpmr package.-schedo (schedtune in AIX 5L V5.1) modifies scheduler algorithms (in the bos.perf.tune fileset).-bindprocessor binds processes to CPUs (in the bos.mp fileset).-chdev modifies certain system tunables (in the bos.rte.methods fileset).-bindintcpu can bind an adapter interrupt to a specific CPU (in thedevices.chrp.base.rte fileset).-procmon is in bos.perf.gtools.Instructor GuideMemory tuning toolsMemory tuning tools include:-vmo and ioo (vmtune in AIX 5L V5.1) for various VMM, file system, and LVM parameters (in bos.perf.tune fileset)-chps and mkps modify paging space attributes (in bos.rte.lvm fileset)-fdpr rearranges basic blocks in an executable so that memory footprints become smaller and cache misses are reduced (in perfagent.tools fileset) -chdev modifies certain system tunables (in bos.rte.methods fileset)I/O tuning toolsI/O tuning tools include:-vmo and ioo modify certain file system and LVM parameters (in bos.perf.tune fileset) (Use vmtune prior to AIX 5L V5.2.)-chdev modifies system tunables such as disk and disk adapter attributes (in bos.rte.methods fileset)-migratepv moves logical volumes from one disk to another (in bos.rte.lvm fileset) -lvmo displays or sets pbuf tuning parameters (in bos.rte.lvm fileset)-chlv modifies logical volume attributes (in bos.rte.lvm fileset)-reorgvg moves logical volumes around on a disk (in bos.rte.lvm fileset)Network tuning toolsNetwork tuning tools include:-no modifies network options (in .tcp.client fileset)-nfso modifies NFS options (in .nfs.client fileset)-chdev modifies network adapter attributes (in bos.rte.methods fileset)-ifconfig modifies network interface attributes (in .tcp.client fileset)CPU在定位CPU性能问题时,从监视 CPU 使用率的统计数据入手。
基于AIX操作系统性能优化研究
基于AIX操作系统性能优化的研究摘要:本文对基于aix操作系统性能优化的分析研究,主要以某金融企业应用系统的优化实施为例,通过对该金融企业应用系统中潜在的问题以及完善与解决方案进行分析论述,以提高金融企业应用系统运行的可靠性与稳定性,避免应用系统潜在问题对系统的正常运行造成干扰和损坏,使金融企业的应用系统实现最大可用性。
关键词:应用系统;aix;操作系统;潜在问题;完善;解决方案;分析中图分类号:tp316随着现代信息技术的不断发展进步以及在实际中的越来越广泛的应用,企业信息系统的建立与完善在企业的发展中起到越来越重要的作用。
本文以金融企业运营发展中信息系统的建设为例,说明信息系统不仅对金融企业的正常运营以及管理发展有着非常重要的影响和作用,也逐渐成为提升金融企业市场竞争力的重要影响因素。
尤其是随着市场竞争的不断扩大加强,金融企业运营业务不断增加的同时,如果与金融企业运营业务相关的信息系统及其生产应用系统,一旦出现问题,或是出现操作系统性能下降等情况,对金融企业的业务运营以及发展都有着十分不利的影响。
通常情况下,对金融企业生产应用系统运行性能影响因素的分析与控制的管理实现,需要结合金融企业生产应用系统的实际情况,在详细分析的基础上,才能进行确认并且完善与改进优化实施。
下文主要以某金融企业的生产应用系统为例,对其基于aix操作系统性能优化进行分析论述,以提高金融企业生产应用系统的运行性能,提升金融企业的发展竞争力,促进金融企业运营发展。
1基于aix操作系统性能优化方案分析进行基于aix操作系统性能优化的分析,首先,需要对金融企业应用系统的性能优化方案进行分析认识。
如下图1所示,为某金融企业应用系统的性能优化方案结构框架示意图。
在该系统性能优化方案结构示意图中,可以看出,该金融企业在进行应用系统性能的优化实现中,主要通过对金融企业生产应用系统实际存在的问题,以及影响系统运行性能完善提高的瓶颈详细分析的基础上,进行aix操作系统性能的分析与优化,最终实现金融企业生产应用系统的安全稳定可靠运行,提高金融企业应用系统运行的稳定性。
Aix性能分析及优化
aix性能分析一、分析CPU。
检查usr% + sys%是否大于90% 。
可使用Nmon,vmstat ,topas,sar命令,以nmon工具为例系统输入nmon命令,如下输入h 进入主菜单输入C (c = CPU by processor), 查看CPU运行状态如上图,这里我们可以清晰看到user% ,sys% 所占用的CPU资源。
上图为测试机,没有运行任何应用,状态良好。
如果CPU有IO wait ,说明内存或IO 存在瓶颈,下面内存分析部分,和IO分析部分会讲到。
Tips:如CPU资源占用较高,可以用topas命令(user% ,sys%也可以用该命令直接查看)查看CPU的进程,检查哪个进程占用CPU资源较高,分析是否合理,为业务所用。
然后得出结论然后再决定是否需要进行参数调试其它参数,扩充CPU等方案。
二、分析内存。
根据实际情况判断内存占用是否合理。
判断系统是否有计算页面调入现象,判断换页空间是否持续增高。
nmon主菜单输入m (m = Memory & Paging),查看内存运行状态在观察一段时间后,上图内存大小为7072MB (8G), 可以空间% Free 为78.2% 比较充裕。
Paging Space In 为0 ,PageSpace %used 为1.6% ,无持续增高现象。
检查是否有内存泄漏,使用命令svmon –P 进程ID ,记录“work process private”项对应的值。
间隔一会重复运行上面的命令,比较“work process private ” 的值是否明显增大,如有则可能有内存泄漏问题。
接下来找出对应的应用,进行更新或安装补丁解决。
如依旧无法解决,联系应用厂商咨询解决。
Tips:如内存占用较高,可以用svmon -Pns 命令详细查看占用内存资源较大、异常的进程,分析是否合理,是否需要扩充物理内存三、I O 分析。
a. 判断系统是否有I O wait ,如果有系统有可能有I O性能问题。
优化AIX7内存性能第一部分内存概述和内存参数的调优(精)
优化AIX 7 内存性能第 1 部分内存概述和内存参数的调优简介作为系统管理员,您应该已经对内存的基本知识非常熟悉了,如物理内存和虚拟内存之间的区别。
您可能还不很清楚 AIX® 7 中的虚拟内存管理器(VMM是如何工作的,以及它与性能调优之间的关系如何。
在 AIX 7 中,还有必要考虑虚拟内存的影响以及在工作负载分区(WPAR中如何使用和应用它。
本文将介绍一些可以用来优化系统的监视工具,概述一些比较重要的 AIX 7 内存管理功能,包括虚拟内存管理器是如何工作的以及动态可变的页面大小的影响。
通过将这些增强功能的实现应用于系统环境,可以在系统中优化内存性能。
尽管您可能会发现,与其他子系统相比,内存的调优更为困难,但是收到的效果往往更加显著。
根据所运行的系统的类型,可能还有一些应该在系统中采用的特定的调优建议。
为了帮助说明这些内容,我将使用一个特定的示例并讨论设置这些参数的一些最佳实践。
在某些情况下,动态地调整一两个参数可能会使系统的总体性能产生显著的变化。
无论要对哪个子系统进行调优,有一个方面是相同的,即始终应该将系统调优看作一个正在进行的过程。
开始对系统进行监视的最佳时间是在首次将系统应用到生产环境中并正常运行时(而不是等到用户抱怨系统性能非常糟糕的时候。
必须在系统正常运行的时候建立系统运行状态的基准,这样在系统可能不正常时才能确认是否真的有问题。
另外,应该一次仅进行一项更改,应该在更改之后尽快捕捉并分析数据,以便判断更改的影响(如果有影响的话。
内存概述本节概述与 AIX 7 有关的内存知识。
我们将介绍 AIX 7 如何使用虚拟内存来寻址比系统物理内存更大的内存。
还将解释 VMM 的工作方式以及它如何处理各种请求。
任何有关内存和 AIX 7 的讨论都必须先介绍 VMM。
有时候,令 AIX 新手感到吃惊的是 VMM 处理系统的所有内存请求,而不仅仅是虚拟内存本身。
在访问 RAM 时,VMM 需要分配空间,即使是在系统中有足够的物理内存的情况下。
AIX 5L 磁盘性能优化之iostat、lvmstat、lslv、lspv 和 lsvg
AIX 5L 磁盘性能优化之iostat、lvmstat、lslv、lspv 和lsvg引言与其他子系统的优化工作不同,实际上在构建系统的体系结构设计阶段就应该开始进行磁盘I/O 优化。
尽管存在一些I/O 优化参数的虚拟内存等价项(ioo和lvmo),但是提高磁盘I/O 性能的最佳方法是正确地配置您的系统,而不是优化相关的参数。
与虚拟内存优化不同,在创建了逻辑卷并开始运行之后,要更改它们的组织结构会变得更加复杂,所以您通常只有一次机会正确地完成这项任务。
本文讨论了配置逻辑卷的方式,以及相对于物理磁盘应该将它们布置于何处,本文还介绍了用于监视您的逻辑卷的工具。
其中,大多数工具并不适合于长期趋势研究,并且是AIX 特定的工具,它们可以提供相关信息以便了解如何配置逻辑卷,以及是否针对您的环境对它们进行了优化。
本系列文章的第 1 部分介绍了iostat,但其中仅介绍了使用该工具来查看异步I/O 服务器。
第2 部分使用iostat 来监视您的磁盘,并向您介绍了它能够完成哪些工作以帮助您快速地确定I/O 瓶颈。
尽管iostat是通用的UNIX® 实用工具之一,并且它不是专门为AIX 而开发的,但实际上,对于快速地确定系统的运行情况,它是非常有用的。
更特定的AIX 逻辑卷命令可以帮助您更深入地研究逻辑卷,以帮助您真正地分析实际问题(如果存在任何问题)。
在使用这些工具之前,您必须清楚地了解您需要哪些信息,这一点是很重要的。
本文描述了相关的工具,并向您介绍了如何分析它们的输出,这将帮助您分析磁盘I/O 子系统。
逻辑卷和磁盘布置概述这个部分定义了逻辑卷管理器(Logical Volume Manager,LVM),并介绍了它的一些特性。
让我们深入地研究逻辑卷的概念,分析它们与提高磁盘I/O 使用率之间的关系,并通过定义和讨论intra-policy 和inter-policy 磁盘实践,从物理磁盘的角度介绍有关逻辑卷的布置。
AIX虚拟内存管理机制
* 计算型分页(Computational pages)
* 非计算型分页(Non-computational pages)
首先,所有的工作存储分页都是计算型分页,也就是说,Oracle的 PGA/SGA等都是属于计算型分页的。而永久存储分页,则根据缓存的文件的类型,如果是可执行文件,则对应的分页是计算型的,如果是数据文件,则是非计算型的,同一个文件对应的页面,要么全部是计算型,要么全部是非计算型的。显然的,为了提供Oracle等应用的性能,假如需要淘汰页面,优先应当交换非计算型页面。
* 当非计算性分页的数目大于或者等于 maxperm 的时候,AIX 分页替换守护进程严格地选择非计算性分页进行操作。
* 当非计算性分页的数目小于或者等于 minperm 的时候,AIX 分页替换守护进程将选择计算性分页和非计算性分页进行操作。在这种情况下,AIX 将扫描两类分页,并且回收近来较少使用的分页。
可以通过设置一些内核参数,来影响AIX对于页面的淘汰算法。这些参数都可以通过vmo命令进行调节(AIX5.2 TL6版本以上)。
minperm%(minperm)和maxperm%(maxperm)是最基本的两个参数,分别表示用于缓存非计算型页面的最小和最大内存比例(页数),但maxperm不是严格限制参数,在系统还有空闲内存的时候,非计算型内存的使用是可以突破maxperm的设置的。另外有个参数strict_maxperm可以指定是否严格限制(默认0表示不是严格限制),但是最好不要使用严格限制,在我们的测试中,可能导致os挂起。minperm和maxperm主要是影响淘汰算法:
AIX将所有的内存页面分成两大类型:
* 工作存储分页(Working storage pages)
AIX系统的运行性能优化研究
企业 在 信息 化建 设 实施 之初 ,往 往只 关 注企 业业 务 流程 的 再 设计 和 系统 功 能 的实现 ,而忽 略 系统 平 台性 能 的优 化 问题 。…系 统开 机后 ,数据 不 断装载 ,系统 的性 能会 出现各 种 问题 ,不 利 于 系统 的 正常 工作 ,严 重 时可 导致 系统 崩溃 。
度 ,利 用缩 短连 结 线增 加 内部 空 间。 二 、A 运 行 系统 下应 用系 统 性能 优化 探讨 l x ( )CU性 能优 化方 法思 考 一 P
统 。计算 机 的发展 离 不 开 A X 行 系统 的技 术 改善 ,对 A X的应 I运 I 用 要 求 的提 出从 客观 上 促进 了计 算机 的发展 。人 们对 服 务器 的性
A bsr c : I t a tA X o rtn s se i t e pe aig y tm n h CPU a d n m e oy s bs se ,u yse i t e ik / m r u y t m s bs tm n h d s IO s bs tm s r pete u yse p o ri s m an e a c Sd sus e it n n ei ic s d. Ke w o dsAI p r t g s se ; p iai yse ; ro m a c t em an e nc y r : X o e ai y tm Ap lc t s tm Pe f r n eof itna e n on h
关键 词 :A X 运行 系统 ;应 用 系统 ;性 能的优 化 I
中图分类号 :T 368 P 1 1
文献标识码 :A
文章编号 :10 — 59 ( 00 1— 0 8 0 0799 2 1 ) 0 0 9— 1
漫谈AIX 5L对于错误日志处理的增强功能
------------------------------------------------------------------------
LABEL:JFS_FS_FULL
Date/Time:Thu Jun 10 15:33:40 BEID
Type:INFO
Resource Name:SYSPFS
# errpt -a-j 369D049B
------------------------------------------------------------------------LABEL:JFS_FS_FULL
IDENTIFIER:369D049B
Date/Time:Thu Jun 10 15:33:40 BEID
Description
UNABLE TO ALLOCATE SPACE IN FILE SYSTEM
Detail Data
MAJOR/MINOR DEVICE NUMBER
002B 0001
FILE SYSTEM DEVICE AND MOUNT POINT
/dev/dblv01, /home/db2data
system shutdown,3)Power supply failure.
除此之外,AIX 5.2还提供了errresume服务。
例如,从上面这个例子看到,在系统电源切换到后备电池时发生了故障。在这时候,AIX电源监控接口内核代码调用errsave纪录电源故障。故障内容将被保留在NVRAM中(由于没有更多的错误要记录,NVRAM记录不会被覆盖),直到boot启动。但是此时如果在机器完全掉电前电源正常了,系统将会返回到正常操作状态。然而,由于前面调用了errsave,将停止记录错误日志。AIX 5.2新增的errresume服务可以让系统调用errsave后仍能够返回到正常纪录错误日志状态。Errresume通过检查错误日志子系统是否是活动的,以及是否已被errsave停止。如果错误日志子系统已经被停止,Errresume将返回到当时的标记,唤醒errdaemon读线索。
AIX性能调优
管理作业的方法
-前台运行的作业通过: - batch - nice - /etc/security/limits -后台运行的作业通过: - renice
基本的性能分析
查看CPU 查看运行 队列长度 高队列长度 否 高数据页交换 是 是 可能是CPU限制 可能是内存限制 是 是 高CPU 使用率 否 查看内存 否 查看磁盘 磁盘间平衡 否
性能调优的限制
-性能的度量经常是不确定的 -调优方法并不总是可靠的 -没有标准的途径或详尽的说明书 -相互冲突的需求 -不可预测的使用 -复杂的系统相互作用 -敏感的资源要求
明确工作量
分类: -工作站 -多用户环境 -服务器 -需求的类型和等级 -软件包 -内部的应用 -真实世界的度量 -没有基准
05:08:11 05:08:11 9.03 0.22 05:08:5005:08:57 7773.12 52.83
Tue May 23 05:22:00 1999 Tue May 23 05:08:00 1999
基本的性能分析
查看CPU sar -u 查看运行 队列长度 sar -q 高队列长度 否 高数据页交换 是 是 可能是CPU限制 可能是内存限制 是 是 高CPU 使用率ห้องสมุดไป่ตู้否 查看内存vmstat 否 查看磁盘 iostat 磁盘间平衡 否
平衡磁 盘负载
可能是磁盘/SCSI限制
CPU的使用情况(sar –u)
这条命令的语法是: # sar [options] interval number 例如: # sar –u 60 3 AIX NODE 2 3 00000211 07/06/99 %usr %sys %wio %idle 08:25:11 48 52 0 0 08:26:10 63 37 0 0 08:27:12 59 41 0 0 . . Average 56 44 0 0
aix系统命令
aix系统命令AIX(Advanced Interactive eXecutive)是 IBM开发的一套 UNIX 操作系统。
而AIX 命令是对AIX系统进行管理和操作的命令。
下面就让店铺给大家分享一些aix的常用命令和进阶命令吧。
aix常用命令查看交换区信息:lsps -a 显示交换区的分布信息lsps -s 显示交换区的使用信息slibclean 清除处理程序遗留的旧分页信息smit mkps 建立交换区空间信息swapon -a 启动所有的分页空间/etc/swapspaces 存放分页空间表格信息显示卷信息:lsvg 显示卷的名称lsvg -l rootvg 显示rootvg卷的详细信息mount卷的方法:varyonvg datavg 加载datavg卷mount /dev/data1 加载datavg下的一个data1卷mount光盘mount -rv cdrfs /dev/cd0 /cdrom裸设备类型:raw,jfs jfs可以转变成文件系统,而raw则不行smit快速路径名称:(smit:图形方式,smitty:字符方式)dev 设备管理diag 诊断jfs 定期档案管理系统lvm 逻辑卷册系统管理员管理nfs NFS管理sinstallp 软件安装及维护spooler 列印队列管理system 系统管理tcpip TCP/IP管理USER 使用者管理clstart,clstop:启动和停止clusterlssrc -g cluser:查看cluser的状态查看已安装的软件信息:ls -aF /usr/lpp (lpp:Licensed Program Products)查看安装媒体内容:installp -q -d /dev/cdrom -l查看操作系统补丁instfix -a查看错误日志信息:errpt -a有关TCP/IP的命令网路卡:smit chgenet,chgtok,chgfddi,opschange,mktty:adptr架构快速路径smit mkinet,ppp:slip与ppp快速路径ifconfig:config界面位址:/etc/hosts 静态主机表/etc/resolv.conf 位址解析的名称服务器/etc/named.boot 名称服务器架构/etc/named. c a 根名称服务器快取 (去掉空格)/etc/named.data 位址列表/etc/named.rev 反转指标列表nslookup 查询名称服务器资讯网络路由:route 管理路由netstat -rn 列出定义的路由routed 路由(daekmin rip)gated 路由(daekmin rip、egp、hello) /etc/gateways 已知网关/etc/networks 已知网路服务:/etc/services/etc/inetd.confTCP/IP群组子系统:/etc/rc.n e t (去掉空格)startsrc -g tcpip 启动全部的tcpip子系统startsrc -s inetd 启动主要internet除错:iptrace 启动封包追踪ipreport 追踪结果格式化输出netstat 网络统计ping 检查是否可以到达查看HACMP,外部硬盘信息:lscfg -vlsdev -Cc adapter对等机器信息:/etc/.rhosts/etc/hosts.equiv/etc/hosts查看内存/etc/lsattr -El mem0显示以 KB 为单位的实际内存bootinfo -r或lsattr -El sys0 -a realmem查看SWAP空间lsps -l查看操作系统文件系统lslpp -l [fileset_name]查看系统内核,进程,硬盘等性能前几位topas要显示内核启用的是 32 位还是 64 位:bootinfo -K显示硬件 32 位还是 64 位:bootinfo -y显示系统上的处理器数量lscfg | grep proc显示系统上的硬盘数量,可输入以下命令:lspv系统的详细配置lscfgaxi进阶命令如何知道自己在运行单处理器还是多处理器内核?/unix 是指向已启动内核的符号链接。
将对数据库共享内存区域启用大页内存
DB2_KEEP_AS_AND_DMS_ CONTAINERS_OPEN操作系统:所有操作系统缺省值:NO,值:YES 或NO如果将此变量设置为ON,那么每个DMS 表空间容器都将打开一个文件句柄,直到数据库被取消激活为止。
因为免除了打开容器时所需进行的处理,所以查询性能可能会提高。
仅应在纯DMS 环境中使用此注册表,否则针对SMS 表空间的查询的性能可能会受到负面影响。
DB2_KEEPTABLELOCK操作系统:所有操作系统缺省值:OFF,值:ON、TRANSACTION、OFF 或CONNECTION如果将此变量设置为ON 或TRANSACTION,那么此变量允许DB2 数据库系统在“未落实的读”或“游标稳定性”隔离级别处于关闭状态期间维护表锁定。
事务结束时将释放所保留的表锁定,就像为“读稳定性”和“可重复读”扫描释放表锁定一样。
如果将此变量设置为CONNECTION,那么将为应用程序释放一个表锁定,直到该应用程序回滚事务或者连接被重置为止。
在落实之间,表锁定将继续挂起,删除表锁定的应用程序请求将被数据库忽略。
表锁定仍然被分配给该应用程序。
因此,当应用程序重新请求表锁定时,锁定已经处于可用状态。
对于可利用此优化的应用程序工作负载,性能应该会有所提高。
然而,并行运行的其他应用程序的工作负载可能会受到影响。
其他应用程序可能无法访问给定表,从而使得并行性过低。
DB2 SQL 目录表不受此设置影响。
CONNECTION 设置还具有上面描述的ON 或TRANSACTION设置所具有的行为。
在进行语句编译或绑定时将检查此注册表变量。
DB2_LARGE_PAGE_MEM操作系统:AIX、Linux 和Windows Server 2003缺省值:NULL,值:*(表示所有应该使用大页内存的适用内存区域)或者应该使用大页内存的特定内存区域的列表(各个内存区域之间以逗号分隔)。
可用区域根据操作系统有所变化。
在AIX 上,可以指定下列区域:DB、DBMS、FCM、APPL 或PRIV A TE。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
AIX 5L 内存性能优化内容提要:AIX 5L 内存性能优化说明:什么是交换(分页)空间?它是与VMM 有关的。
VMM 使用交换(分页)空间存储没有使用活动RAM 的进程。
正是因为这个目的,交换空间是系统整体性能的关键组件。
作为一名管理员,您需要了解如何监视和优化您的分页参数。
分页空间本身是一个特殊的逻辑卷,它存储了当前不访问的信息。
您必须确保您的系统拥有足够的分页空间。
如果分页空间过小,整个进程可能会丢失,并且当所有的空间都占满后,系统可能会崩溃。
尽管值得再次说明,分页空间是VMM 中的一部分,但是更重要的是真正地理解内核如何将进程调入到RAM 中,过多的分页肯定会对性能造成影响。
AIX 通过将内核与VMM 紧密集成在一起,实现了一种称为请求分页的方法。
事实上,内核本身的大部分都驻留在虚拟内存中,这样可以帮助释放它的片段空间以用于其他进程。
>> 请求分页大多数管理员都认为分页是一件很麻烦的事情。
实际上,分页是AIX 所完成的任务中非常必要的一部分,这是由于AIX 内核与VMM 及其请求分页的实现进行了紧密的集成。
请求分页的工作原理是,内核一次仅加载部分页面到实际内存中。
当CPU 需要另一个页面时,它会到RAM 中查找。
如果无法在RAM 中找到这个页面,则出现一次缺页,然后向内核发出信号以便从磁盘中加载更多的页面到RAM。
请求分页的一个优点是,分页空间不需要非常大,因为数据总是在分页空间和RAM 之间不断地交换。
在较早的UNIX? 系统中,将分页预先分配到磁盘,无论使用还是不使用它们。
这使得所分配的磁盘空间可能永远不会被使用。
从本质上说,请求分页可以避免盲目地分配磁盘空间。
应该使得进程的交换最少,因为许多任务可能存储在RAM 中。
的确如此,因为进程(页面)只有一部分存储在RAM 中。
交换指的是什么呢?尽管分页和交换通常可以互换使用,但它们之间存在细微的区别。
如前所述,在进行分页时,进程的部分内容将在磁盘和RAM 之间来回移动。
当发生交换时,会将整个进程来回移动。
为了支持这种情况,在将进程移动到分页空间之前,AIX 会挂起整个进程。
只有在将进程交换回RAM 之后,才能够继续执行它。
出现这样的情况并不是很好,您应该尽量防止交换的发生,交换可能会导致另一种称为颠簸的情况(稍后将介绍这个内容)发生。
作为一名UNIX 管理员,您可能对分页和交换的一些概念已经非常熟悉。
AIX 提供了三种不同模式的分页空间分配策略:延迟的页面空间分配(deferred pa ge space allocation)、晚页面空间分配(late page space allocation)、早页面空间分配(early page space allocation)。
AIX 的缺省策略是延迟的页面空间分配。
这样可以确保将分页空间的分配延迟到必须调出页面的时候进行,从而确保不会浪费分页空间。
事实上,当您拥有很大的RAM 时,您甚至不需要使用任何分页空间.# lsps -aPage Space Physical Volume Volume Group Size %Used Active Au to Typehd6 hdisk0 rootvg 4096MB 1 yes yes lv# vmo -a | grep defdefps = 1以上的命令说明使用了这种缺省的方法(延迟的页面空间分配)。
要禁用这个策略,您需要将参数设置为0。
这将使得系统使用晚分页空间分配策略。
晚分页空间分配策略会在RAM 中相应的页面被修改时才分配分页磁盘块。
这种方法通常用于那些性能比可靠性更加重要的环境。
在本文所介绍的场景中,程序可能会因为缺少内存而运行失败。
那么早页面空间分配又如何呢?如果您希望确保进程不会因为较低的分页情况而终止,通常可以使用这种策略。
早页面空间分配策略可以预先分配分页空间。
这是与晚分页空间分配策略截然相反的。
对于可靠性要求很高的环境,可以使用这种策略。
启用这种策略的方法是将PSALLOC 环境变量设置为early (PSALLOC=early)。
您还应该了解在AIX Version 5.3 中首次引入的垃圾回收特性。
这个特性允许您释放分页空间磁盘块,从而允许您配置比通常所需要的更少的分页空间。
这种特性只能用于缺省的延迟页面空间分配策略。
>> 监视和配置分页空间要确定系统中分页空间的使用量,最简单的方法是运行lsps 命令# lsps -sTotal Paging Space Percent Used4096MB 1%使用vmstat# vmstat 1 5System Configuration: lcpu=2 mem=4096MBkthr memory page faults cpu----- ----------- ------------------------ ------------ -----------r b avm fre re pi po fr sr cy in sy cs us sy id wa1 0 166512 627 0 0 1 0 92 0 277 3260 2783 1 96 01 0 166512 623 0 0 1 0 40 0 253 2260 108 2 1 96 11 0 166512 627 0 0 0 0 0 0 248 3343 91 0 1 96 21 0 166512 627 0 0 0 0 2 0 247 3164 84 0 1 99 01 0 166512 627 0 1 0 0 0 0 277 3260 83 2 1 97 0其中,最重要的列包括:avm——这一列表示您所使用的活动虚拟内存量(单位为4k 大小的页面),不包括文件页面。
fre ——这一列表示内存空闲列表的大小。
在大多数情况下,我并不担心这个值什么时候变得很小,因为AIX 总是会充分地使用内存,并且不会像您希望的那样尽早地释放内存。
这个设置由vmo 命令的minfree 参数来确定。
归根结底,分页的信息更加重要。
pi——这一列表示从分页空间调入的页面数。
po——这一列表示调出到分页空间的页面数。
可能存在颠簸的系统# vmstat 2 3System Configuration: lcpu=4 mem=4096MBkthr memory page faults cpu----- ----------- ------------------------ ------------ -----------r b avm fre re pi po fr sr cy in sy cs us sy id wa1 2 166512 7 0 57 127 0 929 0 2779 3260 1278 3 30 50 0 201 5 166512 12 0 39 129 0 409 0 2538 2260 1108 2 10 30 10 5 01 6 166512 110 0 8 212 0 480 0 2487 3343 991 0 27 33 20 30凭什么能够得出这个结论呢?首先,请看po 列。
该列的值表示页面不断地在磁盘和RAM 之间来回移动。
您还应该发现系统中存在瓶颈,因为阻塞进程和等待时间都高得离谱。
而且空闲列表的值也比正常情况要低一些。
您可以使用vmo 命令来查看空闲列表,其值为120。
这意味着,空闲列表的值不应该低于120。
一般情况下,我认为空闲列表的值较低并不能说明问题,但是在这个示例中,它比正常值还要低。
当出现这种情况时,通常表示系统中发生了颠簸现象。
颠簸现象的典型标志是,当操作系统试图释放资源时,首先警告进程以释放分页空间,然后终止整个进程。
在优化vmo 参数的过程中,您可以帮助设置颠簸开始时的阈值。
您还可以使用topas 或者nmon 来查看内存的使用情况。
使用swap 命令# swap -ldevice maj,min total free/dev/hd6 10, 2 4096MB 4093MB其结果说明,系统中定义了一个交换分区。
您还将注意到,其中只使用了3MB 的空间。
耗尽了分页空间# lsps -aPage Space Physical Volume Volume Group Size %Used Active Au to Typehd6 hdisk0 rootvg 4096MB 78 yes yes lv在这个示例中,您的分页空间变得很低,以至于可能出现危险。
您的系统从启动到现在可能已经很长时间了。
如果您运行数据库(如Oracle),那么直到您清空数据库缓存,才会释放虚拟内存。
让我们来查看一下您的系统启动了多长时间了使用uptime 命令# uptime11:58AM up 9 days, 15:50, 23 users, load average: 0.00, 0.03, 0.04这个系统才启动了9 天。
如果在这么短的时间内,分页空间利用率就增加到百分之七十八,那么您应该考虑添加更多的分页空间。
如果您的系统中还有足够的空间,可以添加另一个分区。
一个最佳实践是,请记住保持分页空间的大小相同。
在这个示例中,我会添加另一个4GB 的分页空间到rootvg 卷。
您可以使用系统管理工具(SMIT) 来完成这项任务,并使用smit mkps 和smit swapon 命令以激活分页空间。
或者,您可以从命令行使用swapon(包括 swapoff)命令。
如果可以,请使用最少被分页区域所使用的磁盘。
另外,可以尝试不要为每个物理磁盘分配多个分页逻辑卷。
尽管有些管理员并不介意将分页空间放到外部存储中,但是我个人并不推崇这种做法。
如果您采取了这种方式,并且外部存储直到重新启动之后才可用,那么您的系统可能会出现崩溃(这取决于所分配的分页空间的大小)。
如果可以,请将它们分散到多个磁盘,并且使用lsps -a 命令确保它们是联机的。
您的系统究竟需要多大的分页空间呢?其基本原则是什么呢?首先,从提供应用程序的组织开始。
DB2? 或者Oracle 团队应该可以告诉您,从数据库的角度来看,系统究竟需要分配多大的分页空间。
如果是一家小型的公司,您就不得不自己研究确定。
请多加小心。
数据库管理员通常会提出最大的需求,并且告诉您将分页空间的大小设置为您的RAM 的两倍(以前的基本原则)。
通常来说,如果我的系统拥有超过4GB 的内存,我会按照RAM 的大小来创建分页空间。
在投入运行后,要经常监视您的系统。
如果您看到分页空间的利用率从来都没有接近过百分之五十,那么就不需要添加额外的空间。
您可以查看最近Oracle 为AIX 提供的文档,以证实这个基本原则。
其中说明了,分页空间的推荐初始设置为RAM 大小的一半加上4GB,但是上限为32GB。