服务器巡检 常规检查项

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

服务器巡检
项目经理需要定期对硬件、软件及数据库环境进行检查
常规检查项如下:
1.服务器部分:
●服务器前面板有无故障灯闪烁,或者面板有无提示报警信息。

●服务器电源,查看电源模块指示灯是否长亮。

●服务器硬盘每个硬盘指示灯是否有报警灯闪烁。

●服务器主机序列号确认,再电话报修原厂商或者对口供货商技术支持人员。

2.存储部分:
●存储系统指示灯是否有报警灯或者错误灯常亮。

●存储每个硬盘指示灯是否有报警或者损坏的颜色灯亮。

●存储序列号确认,再电话报修原厂商或者对口供货商技术支持人员。

3.网络部分:
●网络交换机和光纤交换机指示灯是否有报警灯或者错误灯常亮。

●网络交换机和光纤交换机序列号确认,再电话报修原厂商或者对口供货商技
术支持人员。

IBM 4008101818
HP 4006102058
DELL 4008845177 4008868616
HDS 4006786793
ORACLE 8008100365
4.操作系统部分:
●查看系统日志
Windows系统:利用事件查询器导出系统日志,应用日志,注意日志数量,避免因日志容量限制仅存在日期不足的日志;发现错误日志,尤其连续错误为严重问题应进行排查解决。

LINUX系统:查看cat /var/log/messages系统日志,有无报错信息。

●查看磁盘空间
Windows下查看业务磁盘空间,与历史规律比较有无异常增加查看业务数据所使用的临时目录是否存在大量未处理的文件,如果存在应与排除。

集群模式下,查看仲裁盘是否有业务数据占用,应禁止除操作系统之外任何业务数据使用。

在软件更新过后或业务扩大使用范围后,应重新评估建立新的数据量使用规律,以指定下次检查时间。

LINUX下查看业务磁盘空间查看命令 df -h
●时间校准
检查所有服务器时间应与标准时间差异在30秒以内。

Windows查看右下角日期时间部分,如果有差异请调整。

Linux 查看命令 date,如果有差异用date –s hh:mm:ss更新时间
对于oracle RAC的集群环境,请先关闭CRS和一个instance实例再同步系统时
间,否则会导致节点重启。

5.数据库部分:
●查看数据库alterlog;
/u01/app/oracle/diag/rdbms/emr/emr1/trace/alter{sid}.log
查看RAC集群的CRS状态:
crs_stat -t
Name Type Target State Host
------------------------------------------------------------
ora.DATA.dg ora....up.type ONLINE ONLINE rac1
ora....ER.lsnr ora....er.type ONLINE ONLINE rac1
ora....N1.lsnr ora....er.type ONLINE ONLINE rac2
ora.OCR.dg ora....up.type ONLINE ONLINE rac1
ora.asm ora.asm.type ONLINE ONLINE rac1
ora.eh.db ora....se.type ONLINE ONLINE rac1
ora.emr.db ora....se.type ONLINE ONLINE rac1 work ora....rk.type ONLINE ONLINE rac1 ora....SM1.asm application ONLINE ONLINE rac1
ora....C1.lsnr application ONLINE ONLINE rac1
ora.rac1.vip ora....t1.type ONLINE ONLINE rac1
ora....SM2.asm application ONLINE ONLINE rac2
ora....C2.lsnr application ONLINE ONLINE rac2 ora.rac2.vip ora....t1.type ONLINE ONLINE rac2
ora.scan1.vip ora....ip.type ONLINE ONLINE rac2
●查看表空间使用大小及自动增长
SelectFILE_NAME,TABLESPACE_NAME,BYTES/1024/1024,USER_BYTES/1024/1024, AUTOEXTENSIBLE as AUT from dba_data_files;
●查看数据库归档路径
使用命令archive log list;
然后再根据归档路径查看归档空间大小。

删除5天前的归档日志
rman target /
Delete noprompt archivelog all completed before 'sysdate - 5';
●查看DATAGuard
使用命令查看归档间隙
Select * from v$archive_gap;
使用命令查看归档日志应用恢复状态
SELECT SEQUENCE#,APPLIED, FIRST_TIME, NEXT_TIME FROM V$ARCHIVED_LOG ORDER By SEQUENCE#;
●查看归档日志归档路径
Archive log list;
●查看归档文件夹大小
df –h
删除已经应用恢复的归档日志
Rman target /
delete noprompt archivelog all completed before 'sysdate’;
或使用系统命令直接删除归档日志文件
rm –rf xxx.dbf。

相关文档
最新文档