DBA数据库日常维护

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1日常维护

1.1Oracle警告日志文件监控

Oracle在运行过程中,会在警告日志文件(alert_SID.log)中记录数据库的一些运行情况:

●数据库的启动、关闭,启动时的非缺省参数。

●数据库的重做日志切换情况,记录每次切换的时间,及如果因为检查点

(checkpoint)操作没有执行完成造成不能切换,会记录不能切换的原因。

●对数据库进行的某些操作,如创建或删除表空间、增加数据文件。

●数据库发生的错误,如表空间不够、出现坏块、数据库内部错误(ORA-600)。

1.2数据库表空间使用情况监控(字典管理表空间)

数据库运行了一段时间后,由于不断的在表空间上创建和删除对象,会在表空间上产生大量的碎片,DBA应该及时了解表空间的碎片和可用空间情况,以决定是否要对碎片进行整理或为表空间增加数据文件。其中,CHUNKS列表示表空间中有多少可用的空闲块(每个空闲块是由一些连续的Oracle数据块组成),如果这样的空闲块过多,比如平均到每个数据文件上超过了100个,那么该表空间的碎片状况就比较严重了,这时候需要对表空间进行清理。

然后再执行查看表空间碎片的SQL语句,看表空间的碎片有没有减少。如果没有效果,并且表空间的碎片已经严重影响到了数据库的运行,则考虑对该表空间进行重建。 MAX_CHUNK列的结果是表空间上最大的可用块大小,如果该表空间上的对象所需分配的空间(NEXT值)大于可用块的大小的话,就会提示ORA-1652、ORA-1653、ORA-1654的错误信息,DBA应该及时对表空间的空间进行扩充,以避免这些错误发生。

1.3查看数据库的连接情况

DBA要定时对数据库的连接情况进行检查,看与数据库建立的会话数目是不是正常,如果建立了过多的连接,会消耗数据库的资源。同时,对一些“挂死”的连接,可能会需要DBA手工进行清理。

1.4控制文件的备份

在数据库结构发生变化时,如增加了表空间,增加了数据文件或重做日志文

件这些操作,都会造成Oracle数据库控制文件的变化,DBA应及进行控制文件的备份。

1.5检查数据库文件的状态

DBA要及时查看数据库中数据文件的状态(如被误删除),根据实际情况决定如何进行处理。如果数据文件的STATUS列不是AVAILABLE,那么就要采取相应的措施,如对该数据文件进行恢复操作,或重建该数据文件所在的表空间。

1.6检查数据库定时作业的完成情况

如果数据库使用了Oracle的JOB来完成一些定时作业,要对这些JOB的运行情况进行检查。如果FAILURES列是一个大于0的数的话,说明JOB运行失败,要进一步的检查。

1.7数据库坏块的处理

当Oracle数据库出现坏块时,Oracle会在警告日志文件(alert_SID.log)中记录坏块的信息:

● ORA-01578: ORACLE data block corrupted (file # 7, block # )

● ORA-01110: data file :

'/oracle1/oradata/V920/oradata/V816/users01.dbf'

其中,代表坏块所在数据文件的绝对文件号,代表坏块是数据文件上的第几个数据块出现这种情况时,应该首先检查是否是硬件及操作系统上的故障导致Oracle数据库出现坏块。在排除了数据库以外的原因后,再对发生坏块的数据库对象进行处理。

1.8操作系统相关维护

DBA要注意对操作系统的监控:

●文件系统的空间使用情况(df -k),必要时对Oracle的警告日志及TRC

文件进行清理

●如果Oracle提供网络服务,检查网络连接是否正常

●检查操作系统的资源使用情况是否正常

●检查数据库服务器有没有硬件故障,如磁盘、内存报错

1.9协助搭建测试环境和数据库权限分配

1.10分析数据库中的各种运行事件

分析事件是否合理,对异常事件提供报告给应用相关人员进行分析处理。

1.11对数据库的扩容提供建议报告

包括对数据库运行一段时间后,数据库存储空间扩张、数据归档后的应用等。

1.12对外部系统连接本数据库提供评估和建议

其他系统需要访问某个数据库时,需要提供外部系统对本数据库正常、高效运行的评估报告或其他建议报告。

2定期提供数据库健康检查和系统优化建议

1.13提供系统硬件、操作系统运行报告

2.1.1.CPU情况报告

● .系统资源对CPU的使用情况

● .用户资源对CPU的使用情况

● .应用程序对CPU的使用情况

● .每天中CPU的使用模式(按小时计)

● .每天中应用程序对CPU的使用模式(按小时计)

● .CPU的活动分布

● .CPU的应用分布

● .CPU使用的高峰

2.1.2.内存情况报告

● .每秒对虚拟内存的磁盘读

● .内存的使用情况

● .内存分页

● .虚拟内存

2.1.

3.磁盘情况报告

●磁盘输入/输出:

● .磁盘总体使用情况

● .数据库管理系统和应用程序对磁盘的使用情况

● .磁盘输入/输出等待的原因

2.1.4.网络情况报告

● .网落使用的高峰

● .信息包的传输率

●交换区、资源队列和系统调用率

2.1.5. 数据库系统情况

由于不同数据库,其软件结构也不尽相同,但一般来讲,从以下几个方面:

● .信息包的传输率

● .数据库的物理结构和逻辑结构

● .数据库的CPU利用率

● .数据库的内存利用率,包括数据缓冲区,命令缓冲区等

● .数据库的磁盘I/O

● .数据库的网络利用率

● .数据库运行频繁的SQL语句,从而确定关键事务

● .索引的使用,查询构造,数据库锁的行为等等

2.1.6. 应用系统情况

● .应用系统的物理结构和逻辑结构

● .应用系统CPU利用率

● .应用系统内存利用率,包括数据缓冲区,命令缓冲区等

● .应用系统磁盘I/O 数据库的网络利用率

● .数据库运行频繁的SQL语句,从而确定关键事务

● .检查最消耗系统资源的应用进程,分析应用程序的执行逻辑

3 定期系统安全检测和审计检测

●主要定期完成各个系统数据库的用户名密码检查,提供用户名、密码安全

检查报告

●对数据库的审计日志进行检查,审核各个用户对系统的操作的合法性,发

现系统数据安全隐患,提供改进建议和报告

相关文档
最新文档