oracle rac的日常维护及注意事项

合集下载

oracle日常运维操作总结

oracle日常运维操作总结

oracle日常运维操作总结一、硬件维护1.确保服务器硬件运行正常,定期检查硬件设备,如服务器、存储设备、网络设备等。

2.根据需要及时更新硬件设备,包括升级内存、硬盘等。

3.确保服务器周边设备运行正常,如UPS电源、空调等。

二、软件维护1.确保Oracle数据库软件运行正常,定期检查软件版本、补丁等。

2.更新Oracle数据库软件,包括升级Oracle版本、打补丁等。

3.定期清理无用文件,包括日志文件、临时文件等。

4.定期备份数据库,确保数据安全。

三、性能优化1.定期检查数据库性能,包括CPU使用率、内存使用率等。

2.根据性能检查结果,进行性能优化,如调整数据库参数、优化SQL语句等。

3.定期对数据库进行优化,包括重建索引、优化表空间等。

四、安全加固1.配置Oracle数据库的安全设置,如用户密码、权限管理等。

2.确保数据库账户的安全性,如定期修改密码、禁用无效账户等。

3.防止SQL注入等攻击行为,如使用参数化查询、限制用户输入等。

4.定期检查数据库的安全日志,包括登录日志、操作日志等。

五、数据备份1.制定数据备份计划,并按照计划执行备份操作。

2.采用多种备份方式,如全备份、增量备份等。

3.确保备份数据的可用性和完整性,如定期测试备份数据的恢复能力。

4.对备份数据进行存储和管理,确保数据安全。

六、故障处理1.建立故障处理流程,明确故障处理责任人和流程步骤。

2.对发生的故障进行及时处理,如系统崩溃、网络故障等。

3.对故障进行分类和总结,建立故障处理知识库。

4.定期对系统进行健康检查和性能测试,预防故障发生。

七、监控管理1.建立监控管理体系,包括监控指标、监控周期等。

2.使用监控工具,如OracleEnterpriseManager、Nagios等,对系统进行实时监控。

3.对监控数据进行分析和处理,及时发现和处理潜在问题。

4.定期对监控数据进行存储和管理,方便后续查询和分析。

八、应急预案1.制定应急预案,明确应急响应流程和责任人。

Oracle 11g RAC维护参考

Oracle 11g RAC维护参考

Oracle 11g RAC维护参考RAC集群,全称Real Application Clusters,译为“实时应用集群”,是Oracle提供的一种高可用、并行集群系统,RAC除了具有高可用能力还有负载均衡能力,整个RAC集群系统由Oracle Clusterware (集群软件)和Real Application Clusters(RAC)两大部分组成。

1硬件环境RAC集群的硬件环境包括主机、共享存储、网络设备。

1.1主机(节点)RAC集群环境中至少有两台主机,也就是两个节点,每个节点配置一样的硬件,至少配置两块物理网卡。

1.2网络设备网卡,每个RAC集群节点上至少配置两块物理网卡。

一块网卡用于集群内部的私有通信,集群节点间数据块的传输都是通过这块网卡,我们称之为私有网卡,IP别名Private IP;另一块网卡用于对外服务,比如数据库的查询等,我们称之为公有网卡,IP别名Public IP。

除此之外,每个节点还有第三个VIP(Virtual IP)的IP。

RAC集群正常运行时,每个节点的VIP会被分配到公有网卡上,当某个节点出现故障宕机时,这个节点的VIP会被移到其它正常运行节点的公有网卡上。

网络交换机,首先,用于连接所有节点的公有网卡以提供对外的数据库服务,其次,用于连接各个节点之间的私有网卡以传递集群节点之间的心跳数据和数据库数据块(Cache Fusion)。

1.3共享存储在RAC集群中,最重要的是共享存储,RAC是一个“多实例、单一数据库”的架构,所有的节点共享一个数据库。

数据文件、联机日志、参数文件、控制文件存放在共享存储上以保证每个节点的实例都能访问。

每个节点安装HBA卡,然后通过光纤线和存储设备连接。

2软件环境RAC集群的软件组成包含:操作系统、集群软件、数据库软件。

2.1操作系统每个节点上所安装的操作系统必须是相同版本的。

2.2集群软件Oracle Clusterware(统称为CRS/Cluster Ready Service)集群软件,负责管理整个集群环境中的硬件资源,并为上层的RAC集群提供基础服务。

最详细的oracle rac日常基本维护命令

最详细的oracle rac日常基本维护命令

最详细的oracle rac日常基本维护命令以下是一些使用Oracle RAC进行日常基本维护的常用命令:1. CRSCTL命令:- crsctl check crs:检查集群资源状态。

- crsctl start crs:启动整个集群资源服务。

- crsctl stop crs:停止整个集群资源服务。

- crsctl disable crs:禁用整个集群资源服务。

- crsctl enable crs:启用整个集群资源服务。

2. SRVCTL命令:- srvctl start instance -db <database_name> -instance<instance_name>:启动指定的实例。

- srvctl stop instance -db <database_name> -instance<instance_name>:停止指定的实例。

- srvctl status instance -db <database_name> -instance<instance_name>:检查指定实例的状态。

- srvctl start service -db <database_name> -service <service_name>:启动指定的服务。

- srvctl stop service -db <database_name> -service <service_name>:停止指定的服务。

- srvctl status service -db <database_name> -service<service_name>:检查指定服务的状态。

3. SQL*Plus命令:- sqlplus / as sysdba:以SYS用户身份登录数据库。

- startup:启动数据库实例。

Oracle-11g日常维护手册

Oracle-11g日常维护手册

Oracle 11g 日常维护手册目录第1章文档说明 (5)第2章CRS的管理 (5)2.1 RAC状态检查 (5)检查守护进程状态 (5)检查资源状态 (5)2.2 手工启动与关闭RAC (6)2.3 OCR的管理 (6)2.4 VOTING DISK的管理 (8)2.5 CSS管理 (9)2.6 管理工具SRVCTL (9)管理实例 (9)管理监听程序 (9)管理ASM (10)管理service (10)2.7 修改RAC的IP及VIP (11)修改外网IP及心跳IP (11)修改VIP (11)查看与删除IP (12)第3章ASM的管理 (13)3.1 管理DG (13)建立与扩充disk group (13)mount与unmount的吩咐 (14)删除disk group (14)增加DISK的total_mb (14)DG的属性-AU大小 (14)DG的属性-离线删除时间 (15)DG的属性-兼容版本 (15)向ASM中添加disk的完整步骤 (16)3.2 ASMCMD (17)ASMCMD常用吩咐 (17)复制ASM文件 (18)吩咐lsdg (18)元数据备份与复原 (18)3.3 ASM磁盘头信息备份与复原 (19)3.4 ASM常用视图 (20)视图V$ASM_DISKGROUP (20)视图V$ASM_DISK (21)3.5 常用方法 (22)如何确定ASM实例的编号 (22)查询DG-RAW-磁盘的对应关系 (22)第4章数据库管理 (24)4.1 参数文件管理 (24)4.2 表空间管理 (25)表空间自动扩张 (25)表空间更名 (26)表空间的数据文件更名 (26)缺省表空间 (26)表空间删除 (27)UNDO表空间 (27)TEMP表空间 (27)4.3 重做日志文件管理 (27)增加REDO日志组 (27)删除日志组 (28)日志切换 (28)日志清理 (28)重做日志切换次数查询 (28)4.4 归档模式 (29)单实例数据库修改为归档模式的方法 (29)RAC数据库修改为归档模式的方法 (29)归档路径 (30)4.5 重建限制文件 (31)4.6 内存参数管理 (32)Oracle内存管理发展阶段 (32)自动内存管理AMM (32)自动共享内存管理ASMM (33)自动PGA管理 (33)4.7 其他管理内容 (33)数据库版本查看 (33)字符集 (34)创建密码文件 (34)关闭审计功能 (34)帐号管理 (34)profile管理 (35)第1章文档说明本文档描述了Oracle11g中常见的维护和管理方法,包括CRS、ASM、数据库等。

RAC维护手记10-ASM维护注意事项

RAC维护手记10-ASM维护注意事项

1、生产中查看DISK、DISKGROUP信息务必使用:v$asm_disk_stat、
v$ask_diskgroup_stat,不得使用 v$asm_disk、v$ask_diskgroup,使用后者时,会直接读取磁盘头部,生产中可能会对业务造成影响。

2、对于使用ASM实现双存储保护的系统,在磁盘组新增磁盘时,务必保证一个failgroup中新增磁盘和已有磁盘都在一个存储机柜,避免出现交叉现象。

3、加入、删除磁盘前后,都必须首先备份磁盘头信息。

(具体命令见3.7)
4、加入、删除磁盘操作SQL返回提示符后,rebalance操作此时并未完成,通过查询v$asm_operation可以得到rebalance操作完成的预估时间,该时间通常小于实际时间。

rebalance操作完成前,不得对该磁盘组及其磁盘进行新的其他操作(包括创建表空间、增删数据文件),尤其不得从OS中删除磁盘。


v$asm_operation中没有对应diskgroup的记录时,说明rebalance操作全部完成。

5、有存储保护的磁盘组中,如果单边存储失效,按当前规范配置,这些磁盘不会立即被drop,3.5小时后仍然不能恢复,才会被drop。

但这些磁盘的状态不会自动恢复,需要人工干预,因此在存储故障后,DBA一定要手工检查确认所有磁盘正常online。

SYS磁盘组必须设置rebalancepower为0,否则在存储一边失效时会导致SYS offline。

设置为0后,在V$asm_operation里面会有一条记录,表明SYS磁盘组总是处于reba wait状态,但是est_work等都没有,这是正常的。

附ASM常用性能视图:。

oracle数据库维护手册

oracle数据库维护手册

目录1. 检查数据库基本状况41.1. 检查ORACLE实例状态41.2. 检查ORACLE服务进程41.3. 检查ORACLE监听状态52. 检查系统和ORACLE日志文件62.1. 检查操作系统日志文件62.2. 检查ORACLE日志文件62.3. 检查ORACLE核心转储目录72.4. 检查ROOT用户和ORACLE用户的EMAIL 73. 检查ORACLE对象状态73.1. 检查ORACLE控制文件状态73.2. 检查ORACLE在线日志状态83.3. 检查ORACLE表空间的状态83.4. 检查ORACLE所有数据文件状态83.5. 检查无效对象93.6. 检查所有回滚段状态104. 检查ORACLE相关资源的使用情况104.1. 检查ORACLE初始化文件中相关参数值10 4.2. 检查数据库连接情况114.3. 检查系统磁盘空间124.4. 检查表空间使用情况124.5. 检查一些扩展异常的对象134.6. 检查SYSTEM表空间内的内容144.7. 检查对象的下一扩展与表空间的最大扩展值145. 检查ORACLE数据库备份结果145.1. 检查数据库备份日志信息155.2. 检查BACKUP卷中文件产生的时间155.3. 检查ORACLE用户的EMAIL 156. 检查ORACLE数据库性能156.1. 检查数据库的等待事件156.2. DISK READ最高的SQL语句的获取156.3. 查找前十条性能差的SQL 166.4. 等待时间最多的5个系统等待事件的获取16 6.5. 检查运行很久的SQL 166.6. 检查消耗CPU最高的进程166.7. 检查碎片程度高的表176.8. 检查表空间的I/O 比例176.9. 检查文件系统的I/O 比例176.10. 检查死锁及处理176.11. 检查数据库CPU、I/O、内存性能186.12. 查看是否有僵死进程196.13. 检查行链接/迁移196.14. 定期做统计分析196.15. 检查缓冲区命中率206.16. 检查共享池命中率206.17. 检查排序区206.18. 检查日志缓冲区217. 检查数据库安全性217.1. 检查系统安全日志信息217.2. 检查用户修改密码218. 其他检查228.1. 检查当前CRONTAB任务是否正常228.2. ORACLE JOB是否有失败228.3. 监控数据量的增长情况228.4. 检查失效的索引238.5. 检查不起作用的约束238.6. 检查无效的TRIGGER 23本文档为本人亲自整理的公司的维护文档,内容很详细,DBA日常任务基本就是文档中写的那些,初学DBA或是有意学习DBA的同学们可取去学习学习,文档有实例讲解,很实用。

ORACLERAC日常管理概述

ORACLERAC日常管理概述

ORACLERAC日常管理概述一、Oracle RAC简介:Oracle RAC 支持Oracle 数据库在集群上运行真正的应用程序。

此处的真正应用是指RAC 能够支持所有类型的主流商业应用程序。

这包含流行的封装产品,如SAP、PeopleSoft 与Oracle E*Business Suite 等,与自主研发的应用程序,其中包含OLTP 与DSS,与Oracle 有效支持混合OLTP/DSS 环境的独有能力。

Oracle 是唯一提供具备这一功能的开放系统数据库的厂商。

Oracle RAC 运行于集群之上,为Oracle 数据库提供了最高级别的可用性、可伸缩性与低成本计算能力。

假如集群内的一个节点发生故障,Oracle 将能够继续在其余的节点上运行。

假如需要更高的处理能力,新的节点可轻松添加至集群。

为了保持低成本,即使最高端的系统也能够从使用标准化商用组件的小型低成本集群开始逐步构建而成。

Oracle 的要紧创新是一项称之高速缓存合并的技术,它最初是针对Oracle9i 真正应用集群开发的。

高速缓存合并使得集群中的节点能够通过高速集群互联高效地同步其内存高速缓存,从而最大限度地低降低磁盘I/O。

高速缓存最重要的优势在于它能够使集群中所有节点的磁盘共享对所有数据的访问。

数据无需在节点间进行分区。

Oracle 是唯一提供具备这一能力的开放系统数据库的厂商。

其它声称能够运行在集群上的数据库软件需要对数据库数据进行分区。

这关于拥有复杂的数据结构的真正应用程序而言,显得不切实际。

而且也不可能对集群系统进行统一变更。

假如您添加或者删除节点或者存储资源,数据则需要完全重新分区。

二、ORACLE RAC工作原理在一个应用环境当中,所有的服务器使用与管理同一个数据库,目的是为了分散每一台服务器的工作量,硬件上至少需要两台以上的服务器,而且还需要一个共享存储设备。

同时还需要两类软件,一个是集群软件,另外一个就是Oracle数据库中的RAC组件。

oracle日常运维总结

oracle日常运维总结

千里之行,始于足下。

oracle日常运维总结以下是Oracle日常运维总结的一些要点:1. 定期备份数据:重要性不言而喻,确保数据安全。

可以使用Oracle的备份工具或者第三方工具进行备份,定期检查备份的完整性和可用性。

2. 监控数据库性能:使用Oracle的性能监控工具,如AWR报告、ASH报告等,分析数据库性能瓶颈,并及时采取措施进行优化。

3. 维护数据库统计信息:定期收集和更新数据库的统计信息,以便优化查询性能。

可以使用Oracle的DBMS_STATS包来进行统计信息的收集和更新。

4. 定期检查表空间使用情况:监控数据库的表空间使用情况,及时扩展表空间或调整表空间大小,以确保数据库的正常运行。

5. 定期检查数据库日志和告警日志:定期检查数据库的日志文件和告警日志,及时处理数据库异常或错误。

6. 定期进行数据库滚动备份:数据库滚动备份可以保证数据库的连续备份,避免因备份过程中的数据变更造成备份不完整。

7. 定期进行数据库性能调优:定期进行数据库性能调优,如优化SQL语句、调整数据库参数等,以提高数据库的运行效率和性能。

8. 定期进行数据库安全审计:定期审计数据库的安全性,检查数据库的用户权限、网络安全等,并及时修复和加固数据库的安全漏洞。

第1页/共2页锲而不舍,金石可镂。

9. 定期进行数据库版本升级和补丁安装:定期检查Oracle官方网站,了解最新的数据库版本和补丁,并根据需要进行升级和安装,以保证数据库的安全和稳定。

10. 定期进行数据库容量规划:根据业务需求和数据增长情况,定期进行数据库容量规划,以确保数据库能够满足业务的需求并保持良好的性能。

以上是Oracle日常运维总结的一些要点,根据实际情况进行调整和补充。

oracle日常运维总结

oracle日常运维总结

oracle日常运维总结Oracle是一种功能强大的关系型数据库管理系统,广泛应用于各种企业级应用程序中。

作为一名Oracle数据库管理员(DBA),日常运维是我们工作的重要组成部分。

在这篇文章中,我将总结一些Oracle日常运维的经验和注意事项,希望对其他DBA或使用Oracle 的人员有所帮助。

一、备份与恢复备份和恢复是数据库管理中至关重要的一环。

我们需要定期进行数据库备份,以防止数据丢失和系统故障。

在备份过程中,我们可以使用Oracle提供的工具和功能,如RMAN(Recovery Manager)和Data Pump。

RMAN提供了完整的备份和恢复解决方案,可以进行全库备份和增量备份,并且支持备份集和归档日志的管理。

Data Pump 可以用于导出和导入数据库对象和数据,可以选择全库导出或指定对象导出。

恢复也是DBA必须掌握的技能之一。

当数据库遇到故障或数据损坏时,我们需要根据备份文件进行恢复。

在恢复过程中,我们需要了解不同的恢复场景和方法,如完全恢复、不完全恢复和点恢复。

同时,我们还要考虑日志文件的应用和恢复集的管理,确保数据的一致性和完整性。

二、性能优化Oracle数据库的性能优化是DBA不可或缺的工作之一。

通过监控和调整数据库的各个方面,我们可以提高数据库的响应速度和吞吐量,提升用户体验。

以下是一些常见的性能优化技巧:1. SQL调优:通过分析和改进SQL语句,优化查询计划和执行效率。

我们可以使用Oracle提供的SQL调优工具,如SQL Tuning Advisor和SQL Access Advisor。

2. 系统监控:通过监控数据库的系统资源利用率和性能指标,及时发现和解决性能瓶颈。

我们可以使用Oracle Enterprise Manager 或自定义脚本进行系统监控。

3. 索引优化:通过创建和维护合适的索引,加快数据检索和查询速度。

我们需要了解不同类型的索引和索引的使用场景,避免创建过多或不必要的索引。

ORACLE数据库日常使用中的维护和技巧

ORACLE数据库日常使用中的维护和技巧
量的 S Q L语句 ,减少计算工作量 ,可 以尽可能减少查
E x p是数据库导出命令 E x p o r t 的简写 ;
Fi l e数据 备份文件名 ,恢 复数据用到 此文件 ;
L o g是导 出 日志 的文件名 ,可以通过导 出 日志检 查备 是否 成功 完成 。 然后利用 Wi n d o w 自带的计划任务 工具每天定时
常检查 备 份 文件 的生 成情 况 ,由于 系统 或者 杀 毒软 件的缘 故 ,备份 工作可 能不能正常进行 ,发生异常时
应该 及时处 理 ,确保 备份数 据 的正确 及时 。
1 . 5 . 2 数 据 恢 复
h i r e d a t e ,c o mm,d e p t n o f r o m e mp,响应时 间为
数据库 系统显 得越来越 重要 。S Q L语 句尤其 是复杂 S Q L语 句的性 能优化 对于数据 库的性 能是至 关重要 的。在集中式数据库 中 S QL查询的执行总代价 = I / 0 代价 + CPU 代价 +内存 代价 。调整影 响其执行效率
的 三大 因素 来 减少 系统 总 代价 :一 是 减少 查 询所 产 生的 I / O总次数 ,二是减少 C P U 的计算频 度 ,减少
份 数据 备 份 的数据 和 日志 文件 。 日常工 作 中应该 经
从1 0 2 4行记录 中查询 想要的结果 :
优化前 : S e l e c t * f r o m e mp ,响应时间为 0 . 9 5 3 S 。
优化 后 : S e l e c e mp n o ,e n a me ,j o b ,mg r ,s a l ,
2 O R A C L E数据库 S Q L查询优化

运维手册_数据库_Oracle11gRAC日常运维手册(352)

运维手册_数据库_Oracle11gRAC日常运维手册(352)

Oracle运维手册恒生电子客服总部系统服务部本文所述内容(包括文字和图片),恒生电子股份有限公司(以下简称“恒生”或“恒生公司”)拥有完全独立的唯一版权。

未经恒生公司书面同意或授权,任何单位和个人都不得将其复制、影印或引用。

目录第一章通过SQL*Plus管理Oracle系统 (3)**. 登录oracle系统 (3)**. 退出SQL*Plus (3)**. 在sqlplus下得到帮助信息 (3)第二章Oracle11gR2 RAC日常管理 4**. 监控oracle (4)**. 监控Oracle日志 (4)**. 监控oracle状态 (5)**. 监控表空间使用情况 (6)**. 监控主机 (8)**. 监控CPU (8)**. 使用vmstat 命令监控cpu使用情况 (8)**. 监控主机日志 (9)**. 监控OS文件系统使用情况 (9)**. 启动、关闭数据库 (9)**. 启动数据库 (9)**. 关闭数据库 (11)**. 监听器启动、关闭 (13)**. 表统计信息维护 (14)**. 修改主机系统时间 (15)**. 时间管理原则 (15)**. 时间修改方法 (15)**. 数据库日志收集 (15)**. OS日志 (16)**. DB日志 (16)**. grid日志 (16)**. AWR和ASH报告生成 (16)**. AWR报告生成(同10g) (16)**. ASH报告生成(同10g) (19)**. Recyclebin管理 (23)**. 归档日志的清理 (23)**. 查看回收站中的对象 (23)**. 指定删除某些特定对象 (23)**. 指定删除某表空间的所有回收站对象 (23)**. 清除某用户下的回收站对象 (23)**. 清除所有回收站对象 (23)**. 数据库性能监控 (24)**. 查看系统当前等待事件 (24)**. 通过sid查看sql语句24第一章通过SQL*Plus管理Oracle 系统登录oracle系统以oracle用户登录主机1)以sys用户登录oracle系统[oracle@rac1 ~]$ sqlplus / as sysdba2)其他用户登录oracle系统[oracle@rac1 ~]$ sqlplus hs_user/handsome@jsswdb1退出SQL*PlusSQL>exit在sqlplus下得到帮助信息列出全部SQL命令和SQL*Plus命令SQL> help index列出某个特定的命令的信息SQL>help 命令名或者SQL>? 命令名第二章Oracle11gR2 RAC日常管理监控oracle2.1.1.监控Oracle日志2.1.1.1. DB日志以oracle用户登录该日志文件在每个节点主机的$ORACLE_BASE/diag/rdbms/<dbname>/<sid>/trace目录下,文件名为:alert_XXXX.log (节点1)例如:/u01/app/oracle/diag/rdbms/hsdb/hsdb1/trace/alert_hsdb1.log在出现oracle故障前或故障时,数据库会将一些警告、错误信息写入该文件,交易时应随时监控该文件,及时发现警告、错误信息。

Oracle数据库日常维护方案书

Oracle数据库日常维护方案书

Oracle数据库日常维护方案书ORACLE数据库日常运行维护年度服务项目方案书目录12 3项目背景及目标 (5)1.1项目背景 (5)1.2项目目标 (5)需求分析 (5)项目总体方案 (7)3.1数据库性能优化 (8)3.1.1检查Oracle数据库性能 (8)3.1.1.13.1.1.23.1.1.33.1.1.43.1.1.53.1.1.63.1.1.73.1.1.83.1.1.9检查数据库的等待事件 (9)Disk Read最高的SQL语句的获取 (9)查找前十条性能差的sql (9)等待时间最多的5个系统等待事件的获取 (9)检查运行很久的SQL (9)检查消耗CPU最高的进程 (10)检查碎片程度高的表 (10)检查表空间的I/O比例 (10)检查文件系统的I/O比例 (10)3.1.1.10检查死锁及处理 (10)3.1.1.11检查数据库cpu、I/O、内存性能 (11)3.1.1.12查看是否有僵死进程 (12)3.1.1.13检查行链接/迁移 (13)3.1.1.14定期做统计分析 (13)3.1.1.15检查缓冲区命中率 (14)3.1.1.16检查共享池命中率 (14)3.1.1.17检查排序区 (14)3.1.1.18检查日志缓冲区 (15)3.1.2性能调优及方法 (15)3.1.2.1Oracle数据库日常维护方案书3.1.2.2 3.1.2.3 3.1.2.4 3.1.2.5 寻找问题根源 (16)System_Event事件 (16)Session_Event事件 (16)Session_Wait (17)应用优化 (17)3.1.2.5.1 3.1.2.5.2 3.1.2.5.3 3.1.2.5.4例程调优 (17)I-O优化 (19)竞争优化 (19)O-S监控 (20)3.2数据库备份恢复 (21)3.2.1检查Oracle数据库备份结果 (21)3.2.1.1 3.2.1.2 3.2.1.3 检查数据库备份日志信息 (21)检查backup卷中文件产生的时间 (22)检查oracle用户的email (22)3.3数据库迁移 (22)3.4数据库运维 (23)3.4.1检查数据库基本状况 (23)3.4.1.1 3.4.1.2 3.4.1.3 检查Oracle实例状态 (23)检查Oracle服务进程 (24)检查Oracle监听状态 (24)3.4.2检查系统和oracle日志文件 (25)3.4.2.1 3.4.2.2 3.4.2.3 3.4.2.4 检查操作系统日志文件 (25)检查oracle日志文件 (26)检查Oracle核心转储目录 (26)检查Root用户和Oracle用户的email (27)3.4.3检查Oracle对象状态 (27)3.4.3.1 3.4.3.2 3.4.3.3 3.4.3.4 3.4.3.5 3.4.3.6 检查Oracle控制文件状态 (27)检查Oracle在线日志状态 (27)检查Oracle表空间的状态 (28)检查Oracle所有数据文件状态 (28)检查无效对象 (29)检查所有回滚段状态 (29)3.4.4检查Oracle相关资源的使用情况 (30)3.4.4.1 3.4.4.2 3.4.4.3 3.4.4.4 3.4.4.5 3.4.4.6 3.4.4.7 检查Oracle初始化文件中相关参数值 (30)检查数据库连接情况 (31)检查系统磁盘空间 (32)检查表空间使用情况 (32)检查一些扩展异常的对象 (33)检查system表空间内的内容 (33)检查对象的下一扩展与表空间的最大扩展值 (34)3.4.5检查数据库安全性 (34)3.4.5.1 3.4.5.2 检查系统安全日志信息 (35)检查用户修改密码 (35)3.4.6其他检查 (36)3.4.6.1 3.4.6.2 3.4.6.3 3.4.6.4 3.4.6.5 Oracle Job是否有失败 (36)监控数据量的增长情况 (36)检查失效的索引 (37)检查不起作用的约束 (37)检查无效的trigger (37)4 项目实施及管理 (38)4.1项目实施方案 (38)4.1.1项目实施策略 (38)4.1.2项目实施计划 (38)4.1.3项目交付文档 (39)4.1.3.1 4.1.3.2 交付要求 (39)提交文件资料 (39)5 支持服务体系 (40)5.1.1售后服务 (40)5.1.2电话支持 (40)5.1.3现场服务 (40)5.1.4电子邮件支持 (41)5.1.5紧急故障处理 (41)5.1.6 ORACLE定期巡检服务(24次/年) (41)6 培训方案 (41)6.1.1培训方式 (42)6.1.2教师、教材使用及授课语言 (42)6.1.3培训计划 (44)6.1.4培训分工 (44)Oracle数据库日常维护方案书1项目背景及目标1.1项目背景xxx信息化建设经过多年的发展和完善,已经建立成熟的网络环境及生产经营管理的各类应用系统,目前全厂在线运行的PC近600台,近年来建设的企业资产管理、基建 MIS 管理系统、全面预算管理系统、生产综合管理系统技术监督管理系统等若干应用信息系统多数是基于 Oracle 数据库系统的应用。

oracle RAC维护

oracle RAC维护

Oracle RAC数据库基础维护1、Oracle RAC数据库启动默认的正常情况下RAC数据库所有服务是自动启动的,即系统启动后数据库就自动启动了如果想手启动所有服务,用如下命令:[oracle@rac1 ~]crs_start –all此命令用来启动所有的集群服务,但是启动的前提是资源状态State不能是UNKNOWN 查看资源状态用如下命令,state为online为服务正常运行:[oracle@rac1 ~]$ crs_stat -t (crsstat)Name Type Target State Host------------------------------------------------------------ora.....CRM.cs application ONLINE ONLINE rac1ora....cl1.srv application ONLINE ONLINE rac1ora.orcl.db application ONLINE ONLINE rac2ora....l1.inst application ONLINE ONLINE rac1ora....l2.inst application ONLINE ONLINE rac2ora....SM1.asm application ONLINE ONLINE rac1ora....C1.lsnr application ONLINE ONLINE rac1ora.rac1.gsd application ONLINE ONLINE rac1ora.rac1.ons application ONLINE ONLINE rac1ora.rac1.vip application ONLINE ONLINE rac1ora....SM2.asm application ONLINE ONLINE rac2ora....C2.lsnr application ONLINE ONLINE rac2ora.rac2.gsd application ONLINE ONLINE rac2ora.rac2.ons application ONLINE ONLINE rac2ora.rac2.vip application ONLINE ONLINE rac22、Oracle RAC数据库停止手动停所有RAC服务:[oracle@rac1 ~]crs_stop –all3、发现unknown 的服务如何处理?[oracle@rac1 ~]$crs_stat -tName Type Target State Host------------------------------------------------------------ ora....CL1.srv application ONLINE UNKNOWN rac1ora....CL2.srv application ONLINE UNKNOWN rac2ora....TEST.cs application ONLINE UNKNOWN rac2ora....L1.inst application ONLINE OFFLINEora....L2.inst application ONLINE OFFLINEora.ORCL.db application ONLINE UNKNOWN rac1ora....SM1.asm application ONLINE UNKNOWN rac1ora....C1.lsnr application ONLINE UNKNOWN rac1ora.rac1.gsd application ONLINE UNKNOWN rac1ora.rac1.ons application ONLINE UNKNOWN rac1ora.rac1.vip application ONLINE ONLINE rac1ora....SM2.asm application ONLINE UNKNOWN rac2ora....C2.lsnr application ONLINE UNKNOWN rac2ora.rac2.gsd application ONLINE UNKNOWN rac2ora.rac2.ons application ONLINE UNKNOWN rac2ora.rac2.vip application ONLINE ONLINE rac2可以各种原因导致服务呈现unknown 状态,比如两个节点时间差太多,比如1分钟,可能导致这个异常。

Oracle数据库维护、管理

Oracle数据库维护、管理

Oracle数据库维护、管理解决方案目录一、Oracle 数据库维护、管理解决方案介绍二、产品详细介绍2.1. Spotlight on Oracle2.2. Space Manager2.3. SQL Expert Professional2.4. I/Watch三、成功案例3.1新疆移动通信公司3.2大唐电信软件公司3.3 中国工商银行北京市分行附录一、其他解决方案1.开发解决方案2.数据库以及系统测试解决方案3. 系统存储解决方案附录二、数据库管理、维护以及优化1. 数据库管理、维护的主要任务2. 数据库调优的方法一、Oracle 数据库维护、管理解决方案介绍建立在Oracle数据库上的关键业务系统,是当今企业的核心应用。

如何改善其性能和可用性,是包括系统设计、维护和管理人员的最大挑战。

为了更好地维护系统和数据库,必须随时了解系统和数据库的运行状况。

但由于数据库维护具有一定的复杂性,增加了维护工作的难度。

优秀的数据库管理工具,可以大大简化生产环境下的应用维护和管理,提高IT人员的工作效率。

数据库管理人员借助相应的工具可以主动、迅速、方便的监控系统的运行。

对于Oracle 数据库的管理,主要包括三方面的内容:√系统诊断,了解当前运行的Oracle的状态,发现数据库性能瓶颈;√空间管理,即数据库存储结构的调优,包括定期检查数据库的存储结构,发现Oracle数据库存储中的主要问题(如数据库碎片),进行碎片重组和数据分布以及容量规划等;√调优SQL,分析对系统性能影响比较大的SQL 语句,调整SQL 语句的执行效率。

使SQL 存取尽可能少的数据块。

针对以上三方面的调优内容,我们提供了相应的工具,包括:Spotlight on Oracle、Space Manager for Oracle、和SQL Expert Professional, 分别从系统诊断、空间管理和调优SQL三个方面帮助DBA和管理人员解决Oracle 数据库的维护管理工作。

Oracle Rac日常维护操作手册

Oracle  Rac日常维护操作手册

Oracle Rac日常维护操作手册一、关闭服务器1.1关闭数据库实例在DBSERVER01和DBSERVER02服务器上分别运行以下命令:在cmd命令行中运行C:\Documents and Settings\Administrator>d:D:\>cd D:\oracle\product\10.2.0\crs\BIND:\oracle\product\10.2.0\crs\BIN>crs_stat –t (检查oracle数据库运行状态)名称类型目标状态主机------------------------------------------------------------ora....S1.inst application ONLINE ONLINE dbserver01ora....S2.inst application ONLINE ONLINE dbserver02ora.HBHIS.db application ONLINE ONLINE dbserver02ora....01.lsnr application ONLINE ONLINE dbserver01ora....r01.gsd application ONLINE ONLINE dbserver01ora....r01.ons application ONLINE ONLINE dbserver01ora....r01.vip application ONLINE ONLINE dbserver01ora....02.lsnr application ONLINE ONLINE dbserver02ora....r02.gsd application ONLINE ONLINE dbserver02ora....r02.ons application ONLINE ONLINE dbserver02ora....r02.vip application ONLINE ONLINE dbserver02D:\oracle\product\10.2.0\crs\BIN>sqlplus sys/sys as sysdbaSQL>shutdown immediateSQL>exitD:\oracle\product\10.2.0\crs\BIN>crs_stat –t (再次检查oracle数据库运行状态) 名称类型目标状态主机------------------------------------------------------------ora....S1.inst application OFFLINE OFFLINEora....S2.inst application OFFLINE OFFLINEora.HBHIS.db application OFFLINE OFFLINEora....01.lsnr application ONLINE ONLINE dbserver01ora....r01.gsd application ONLINE ONLINE dbserver01ora....r01.ons application ONLINE ONLINE dbserver01ora....r01.vip application ONLINE ONLINE dbserver01ora....02.lsnr application ONLINE ONLINE dbserver02ora....r02.gsd application ONLINE ONLINE dbserver02ora....r02.ons application ONLINE ONLINE dbserver02ora....r02.vip application ONLINE ONLINE dbserver021.2关闭CRS集群服务在DBSERVER01或DBSERVER02服务器上运行以下命令:C:\Documents and Settings\Administrator>srvctl stop nodeapps -n dbserver01C:\Documents and Settings\Administrator>srvctl stop nodeapps -n dbserver02D:\oracle\product\10.2.0\crs\BIN>crs_stat –t (再次检查oracle数据库运行状态) 名称类型目标状态主机------------------------------------------------------------ora....S1.inst application OFFLINE OFFLINEora....S2.inst application OFFLINE OFFLINEora.HBHIS.db application OFFLINE OFFLINEora....01.lsnr application OFFLINE OFFLINEora....r01.gsd application OFFLINE OFFLINEora....r01.ons application OFFLINE OFFLINEora....r01.vip application OFFLINE OFFLINEora....02.lsnr application OFFLINE OFFLINEora....r02.gsd application OFFLINE OFFLINEora....r02.ons application OFFLINE OFFLINEora....r02.vip application OFFLINE OFFLINE1.3关闭服务器操作系统先关DBSERVER01,在关闭DBSERVER02;二、开启服务器2.1DBSERVER02服务器开机DBSERVER02服务器操作系统启动后待网卡服务全部启动,执行以下命令验证oracle服务启动情况C:\Documents and Settings\Administrator>d:D:\>cd D:\oracle\product\10.2.0\crs\BIND:\oracle\product\10.2.0\crs\BIN>crs_stat –t (检查oracle数据库运行状态)名称类型目标状态主机------------------------------------------------------------ora....S1.inst application OFFLINE OFFLINEora....S2.inst application ONLINE ONLINE dbserver02ora.HBHIS.db application ONLINE ONLINE dbserver02ora....01.lsnr application OFFLINE OFFLINEora....r01.gsd application OFFLINE OFFLINEora....r01.ons application OFFLINE OFFLINEora....r01.vip application OFFLINE OFFLINEora....02.lsnr application ONLINE ONLINE dbserver02ora....r02.gsd application ONLINE ONLINE dbserver02ora....r02.ons application ONLINE ONLINE dbserver02ora....r02.vip application ONLINE ONLINE dbserver02待DBSERVER02上oracle服务全部启动后再开启DBSERVER01。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

oracle rac的日常维护及注意事项2009-03-13 23:26oracle rac的日常维护及注意事项在Oracle数据库运行期间,DBA应该对数据库的运行日志及表空间的使用情况进行监控,及早发现数据库中存在的问题。

一、Oracle警告日志文件监控Oracle在运行过程中,会在警告日志文件(alert_SID.log)中记录数据库的一些运行情况:l 数据库的启动、关闭,启动时的非缺省参数;l 数据库的重做日志切换情况,记录每次切换的时间,及如果因为检查点(checkpoint)操作没有执行完成造成不能切换,会记录不能切换的原因;l 对数据库进行的某些操作,如创建或删除表空间、增加数据文件;问题处理启动参数不对检查初始化参数文件因为检查点操作或归档操作没有完成造成重做日志不能切换如果经常发生这样的情况,可以考虑增加重做日志文件组;想办法提高检查点或归档操作的效率;有人未经授权删除了表空间检查数据库的安全问题,是否密码太简单;如有必要,撤消某些用户的系统权限出现坏块检查是否是硬件问题(如磁盘本生有坏块),如果不是,检查是那个数据库对象出现了坏块,对这个对象进行重建表空间不够增加数据文件到相应的表空间出现ORA-600根据日志文件的内容查看相应的TRC文件,如果是Oracle的bug,要及时打上相应的补丁二、数据库表空间使用情况监控(字典管理表空间)数据库运行了一段时间后,由于不断的在表空间上创建和删除对象,会在表空间上产生大量的碎片,DBA应该及时了解表空间的碎片和可用空间情况,以决定是否要对碎片进行整理或为表空间增加数据文件。

select tablespace_name, count(*) chunks , max(bytes/1024/1024) max_chunk from dba_free_space group by tablespace_name;上面的SQL列出了数据库中每个表空间的空闲块情况,如下所示:TABLESPACE_NAME CHUNKS MAX_CHUNK-------------------- ---------- ----------INDX 1 57.9921875RBS 3 490.992188RMAN_TS 1 16.515625SYSTEM 1 207.296875TEMP 20 70.8046875TOOLS 1 11.8359375USERS 67 71.3671875其中,CHUNKS列表示表空间中有多少可用的空闲块(每个空闲块是由一些连续的Oracle数据块组成),如果这样的空闲块过多,比如平均到每个数据文件上超过了100个,那么该表空间的碎片状况就比较严重了,可以尝试用以下的SQL命令进行表空间相邻碎片的接合:alter tablespace 表空间名coalesce;然后再执行查看表空间碎片的SQL语句,看表空间的碎片有没有减少。

如果没有效果,并且表空间的碎片已经严重影响到了数据库的运行,则考虑对该表空间进行重建。

MAX_CHUNK列的结果是表空间上最大的可用块大小,如果该表空间上的对象所需分配的空间(NEXT值)大于可用块的大小的话,就会提示ORA-1652、ORA-1653、ORA-1654的错误信息,DBA应该及时对表空间的空间进行扩充,以避免这些错误发生。

对表空间的扩充对表空间的数据文件大小进行扩展,或向表空间增加数据文件,具体操作见“存储管理”部份。

三、查看数据库的连接情况DBA要定时对数据库的连接情况进行检查,看与数据库建立的会话数目是不是正常,如果建立了过多的连接,会消耗数据库的资源。

同时,对一些“挂死”的连接,可能会需要DBA 手工进行清理。

以下的SQL语句列出当前数据库建立的会话情况:select sid,serial#,username,program,machine,status from v$session;输出结果为:SID SERIAL# USERNAME PROGRAM MACHINE STATUS---- ------- ---------- ----------- --------------- --------1 1 ORACLE.EXE WORK3 ACTIVE2 1 ORACLE.EXE WORK3 ACTIVE3 1 ORACLE.EXE WORK3 ACTIVE4 1 ORACLE.EXE WORK3 ACTIVE5 3 ORACLE.EXE WORK3 ACTIVE6 1 ORACLE.EXE WORK3 ACTIVE7 1 ORACLE.EXE WORK3 ACTIVE8 27 SYS SQLPLUS.EXE WORKGROUP\WORK3 ACTIVE11 5 DBSNMP dbsnmp.exe WORKGROUP\WORK3 INACTIVE其中,SID 会话(session)的ID号;SERIAL# 会话的序列号,和SID一起用来唯一标识一个会话;USERNAME 建立该会话的用户名;PROGRAM 这个会话是用什么工具连接到数据库的;STA TUS 当前这个会话的状态,ACTIVE表示会话正在执行某些任务,INACTIVE表示当前会话没有执行任何操作;如果DBA要手工断开某个会话,则执行:alter system kill session ''''SID,SERIAL#'''';注意,上例中SID为1到7(USERNAME列为空)的会话,是Oracle的后台进程,不要对这些会话进行任何操作。

四、控制文件的备份在数据库结构发生变化时,如增加了表空间,增加了数据文件或重做日志文件这些操作,都会造成Oracle数据库控制文件的变化,DBA应及进行控制文件的备份,备份方法是:执行SQL语句:alter database backup controlfile to ''''/home/backup/control.bak'''';或:alter database backup controlfile to trace;这样,会在USER_DUMP_DEST(初始化参数文件中指定)目录下生成创建控制文件的SQL 命令。

五、检查数据库文件的状态DBA要及时查看数据库中数据文件的状态(如被误删除),根据实际情况决定如何进行处理,检查数据文件的状态的SQL如下:select file_name,status from dba_data_files;如果数据文件的STATUS列不是A V AILABLE,那么就要采取相应的措施,如对该数据文件进行恢复操作,或重建该数据文件所在的表空间。

六、检查数据库定时作业的完成情况如果数据库使用了Oracle的JOB来完成一些定时作业,要对这些JOB的运行情况进行检查:技术社区select job,log_user,last_date,failures from dba_jobs;如果FAILURES列是一个大于0的数的话,说明JOB运行失败,要进一步的检查。

七、数据库坏块的处理当Oracle数据库出现坏块时,Oracle会在警告日志文件(alert_SID.log)中记录坏块的信息:ORA-01578: ORACLE data block corrupted (file # 7, block # <BLOCK>)ORA-01110: data file <AFN>: ''''/oracle1/oradata/V920/oradata/V816/users01.dbf''''其中,<AFN>代表坏块所在数据文件的绝对文件号,<BLOCK>代表坏块是数据文件上的第几个数据块出现这种情况时,应该首先检查是否是硬件及操作系统上的故障导致Oracle数据库出现坏块。

在排除了数据库以外的原因后,再对发生坏块的数据库对象进行处理。

1.确定发生坏块的数据库对象SELECT tablespace_name,segment_type,owner,segment_nameFROM dba_extents WHERE file_id = <AFN>AND <BLOCK> between block_id AND block_id+blocks-1;2.决定修复方法如果发生坏块的对象是一个索引,那么可以直接把索引DROP掉后,再根据表里的记录进行重建;如果发生坏块的表的记录可以根据其它表的记录生成的话,那么可以直接把这个表DROP 掉后重建;如果有数据库的备份,则恢复数据库的方法来进行修复;如果表里的记录没有其它办法恢复,那么坏块上的记录就丢失了,只能把表中其它数据块上的记录取出来,然后对这个表进行重建。

3.用Oracle提供的DBMS_REPAIR包标记出坏块exec DBMS_REPAIR.SKIP_CORRUPT_BLOCKS(''''<schema>'''',''''<tablename>'''');4.使用Create table as select命令将表中其它块上的记录保存到另一张表上create table corrupt_table_bak as select * from corrupt_table;5.用DROP TABLE命令删除有坏块的表drop table corrupt_table;6.用alter table rename命令恢复原来的表alter table corrupt_table_bak rename to corrupt_table;7.如果表上存在索引,则要重建表上的索引八、操作系统相关维护DBA要注意对操作系统的监控:l 文件系统的空间使用情况(df -k),必要时对Oracle的警告日志及TRC文件进行清理l 如果Oracle提供网络服务,检查网络连接是否正常l 检查操作系统的资源使用情况是否正常l 检查数据库服务器有没有硬件故障,如磁盘、内存报错l 数据库发生的错误,如表空间不够、出现坏块、数据库内部错误(ORA-600) DBA应该定期检查日志文件,根据日志中发现的问题及时进行处理。

相关文档
最新文档