数据库日常运维手册
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
神州数码信息系统有限公司数据库日常运维手册
神州数码信息系统有限公司
2015/9/5
日常运维操作手册主要针对ORACLE数据库管理员对数据库系统做定期监控:(1). 每天对ORACLE数据库的运行状态、日志文件、备份情况、数据库的空间使用情况、系统资源的使用情况进行检查,发现并解决问题。并要有相关的人员负责每天查看,发现问题及时上报分析。检查每天的数据库备份完成情况。
(2). 每周对数据库对象的空间扩展情况、数据的增长情况进行监控、对数据库做健康检查、对数据库对象的状态做检查。
(3). 每月对表和索引等进行Analyze、检查表空间碎片、寻找数据库性能调整的机会、进行数据库性能调整、提出下一步空间管理计划。对ORACLE数据库状态进行一次全面检查
(4)根据公司数据库的安全策略对ORACLE DB进行加固
一.日维护过程
1.1、确认所有的INSTANCE状态正常
登陆到所有数据库或例程,检测ORACLE后台进程:
$ps –ef|grep ora
1.2、检查文件系统的使用(剩余空间)
如果文件系统的剩余空间小于20%,需删除不用的文件以释放空间。
#df –k
1.3、检查日志文件和trace文件记录
检查相关的日志文件和trace文件中是否存在错误。
A、连接到每个需管理的系统
使用’telnet’命令
B、对每个数据库,进入到数据库的bdump目录,unix系统中BDUMP目录通常是
$ORACLE_BASE/
#$ORACLE_BASE/
C、使用Unix ‘tail’命令来查看alert_
#tail $ORACLE_BASE/
D、如果发现任何新的ORA- 错误,记录并解决
1.4、检查数据库当日备份的有效性。
对RMAN备份方式:
1.5、检查数据文件的状态
检查所有数据文件并记录状态不是“online”的数据文件,并做恢复。
Sqlplus> Select file_name from dba_data_files where status=’OFFLINE’
1.6、检查表空间的使用情况
SELECT tablespace_name, max_m, count_blocksfree_blk_cnt,
sum_free_m,to_char(100*sum_free_m/sum_m, '99.99') || '%' AS pct_free FROM
( SELECT tablespace_name,sum(bytes)/1024/1024 AS sum_m FROM dba_data_files GROUP BY tablespace_name), ( SELECT tablespace_name AS fs_ts_name, max(bytes)/1024/1024 AS max_m, count(blocks) AS count_blocks, sum(bytes/1024/1024) AS sum_free_m FROM dba_free_space GROUP BY tablespace_name ) WHERE tablespace_name = fs_ts_name
1.7、检查剩余表空间
SELECT tablespace_name, sum ( blocks ) as free_blk ,
trunc ( sum ( bytes ) /(1024*1024) ) as free_m,
max ( bytes ) / (1024) as big_chunk_k,
count (*) as num_chunks FROM dba_free_space GROUP BY tablespace_name;
1.8、监控数据库性能(重点)
运行bstat/estat生成系统报告或者使用statspack收集统计数据
1.9、检查数据库系统性能(重点)
主要检查并记录数据库系统的cpu使用率、pagespaces、IO、buffer命中率等等,可以使用topas、vmstat、iostat、glance、top等命令
1.10、日常出现问题的处理。
二.每周维护过程
2.1、监控数据库对象的空间扩展情况
根据本周每天的检查情况找到空间扩展很快的数据库对象,并采取相应的措施
-- 删除历史数据
--- 扩表空间
alter tablespace
--- 调整数据对象的存储参数
next extent
pct_increase
2.2、监控数据量的增长情况
根据本周每天的检查情况找到记录数量增长很快的数据库对象,并采取相应的措施-- 删除历史数据
--- 扩表空间
altertablespace
2.3、系统健康检查
检查以下内容:
init
controlfile
redo log file
archiving
sort area size
tablespace(system,temporary,tablespace fragment)
datafiles(autoextend,location)
object(number of extent,nextextent,index)
rollback segment
logging&tracing(alert.log,max_dump_file_size,sqlnet)