系统垃圾的清理-培训课件

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

系统垃圾的清理

系统工程部

余广宏

§了解项目日常问题处理的流程方法

§学会由磁盘空间问题引发的故障问题的处理方法

发现问题

程序应用

提交客服跟踪

异常

1.能够清楚描述问题出现的症状

2.分析问题引发的根源(程序、网络、主机或数据库)

3.寻求解决问题的方法或思路

4.第三方软硬件问题?本地无法及时解决,寻求远程技术支持或经验集

在公司内网请访问:http://192.168.2.50:8080

在联通专网请访问:http://10.1.41.30:8080

在Internet网请访问:http://203.86.86.137:8080

5.咨询主机或网络服务台,寻求快速解决方案

§垃圾对象定义范畴

§UNIX系统垃圾对象处理方法

§ORACLE数据库垃圾对象处理方法§系统日常运行管理注意事项

§Q&A

§系统垃圾的定义

系统垃圾就是会占用系统资源,包括磁盘空间、CPU、内存等,阻碍系统应用的正常运行。

§系统垃圾有什么危害

1、垃圾文件会占用大量的磁盘空间,包括占用磁盘空间和i节点

2、会占用内存和CPU资源

3、影响系统性能,使得系统慢如蜗牛

§系统垃圾对象来源的分类OS Space Problem

T e m p f i l e Database

Small file

Log File Application

Process Crash file

发现系统目录空间问题导致故障,需要判定产生空间问题的分区和目录,根据目录规划判定可能产生问题的来源

表1 常见操作系统目录检查方法dmesg

df -k

LINUX df

-g SOLARIS

cat /var/adm/syslog/syslog.log

HP-UX

AIX

案例一Case ID:1324

现象描述:某直辖市C网网管项目/usr2目录使用率达到94%,现场删除了一些文件,但是还是92%,所以提交客服系统处理

解决方法:技术支持人员反馈通过du-sk* 找到占用大空间那个目录,然后去检查该目录,并将情况反馈给研发部门找程序中可以删除的目录文件。

现场反馈:通过研发部门的协助,找到可以删除的程序文件,空间下降,问题解决案例二Case ID:207

现象描述:某省C网管主机系统的/var目录空间不到3天达到95%,提交客服系统要求检查系统是否有异常

解决方法:跟踪人员发现,该问题主要是UNICOM用户运行的snmp2db进程所致,删除了mail日志信息后,发现该文件很快又会增长,最终和研发定位到原因是

crontab调用的时候命令有错误,然后产生mail,改正命令后就解决

在以上处理过程中我们发现,维护人员最基本的要求:

1、熟悉应用程序的的目录结构,特别是应用的运行log信息

2、能够分析定位空间异常增长的目录

3、需要良好的书写习惯,创建公共文件或私有文件最好能够分类,并提供易于理解的

文件名

案例三case id:2182

现象描述:某省C网采集服务器的目录到达100%无法写入文件

CDMA% df-k

文件系统千字节用了可用容量挂接在

/dev/md/dsk/d8 20174761 8691554 11281460 44% /

/dev/md/dsk/d10 10086988 1588753 8397366 16% /usr

/dev/dsk/c1t3d0s2 70592505 69792182 94398 100% /usr2

/dev/dsk/c1t2d0s2 70592505 43235476 26651104 62% /u01

但实际上,在/usr2下面执行du-sk* 发现实际并未使用如此多的空间

解决方法:技术支持人员给出解决方法,

用prstat命令检查进程发现如下信息:

CDMA% prstat

PID USERNAME SIZE RSS STATE PRI NICE TIME CPU PROCESS/NLWP

3771 unicom48M 43M cpu3 0 0 112:04.05 18% file2dbv2.pl/1

3780 unicom27M 22M cpu1 0 0 112:02.28 18% file2dbv2.pl/1

以上两个进程已经运行了112个小时,按照采集流程不可能这么久,说明已经挂死,把这两个进程杀掉:CDMA% kill -9 3771

CDMA% kill -9 3780

目录/usr2一会就降到了66%

CDMA% df-k

文件系统千字节用了可用容量挂接在

/dev/md/dsk/d8 20174761 8691584 11281430 44% /

/dev/md/dsk/d10 10086988 1588753 8397366 16% /usr

/dev/dsk/c1t3d0s2 70592505 46030194 23856386 66% /usr2

案例四参见客服经验集33

现象描述:数据库服务器ORACLE软件安装目录硬盘空间被迅速占满

处理思路:通过前面的表1的各平台检查方法,检查系统空间情况及日志,得到空间占满的信息通常oracle可能引起问题的几个目录:

$ORACLE_BASE/admin/ORACLE_SID

$ORACLE_HOME/network/log

某省传输网管项目bdf发现:

/dev/vg00/oracle 8404992 8238286 166706 100% /oracle

删除$ORACLE_BASE/admin/ORACLE_SID/udump文件夹下trace文件后空间空闲不明显,最后检查发现监听日志文件占用空间过大

$ ls-l

-rw-rw-rw- 1 oracle dba4961855945 4月22日13:29 listener.log

-rw-rw-r-- 1 oracle dba466944 4月14日15:46 sqlnet.log

$ cat /dev/null>listener.log

$ ls-l

-rw-rw-rw- 1 oracle dba1791 4月22日13:29 listener.log

-rw-rw-r-- 1 oracle dba466944 4月14日15:46 sqlnet.log

最终剩余空间为/dev/vg00/oracle 8404992 3392260 4864472 41% /oracle

相关文档
最新文档