oracle子查询的优化总结
Oracle 查询慢的原因总结
Oracle查询慢的原因总结查询速度慢的原因很多,常见如下几种:1、没有索引或者没有用到索引(这是查询慢最常见的问题,是程序设计的缺陷)2、I/O吞吐量小,形成了瓶颈效应。
3、没有创建计算列导致查询不优化。
4、内存不足5、网络速度慢6、查询出的数据量过大(可以采用多次查询,其他的方法降低数据量)7、锁或者死锁(这也是查询慢最常见的问题,是程序设计的缺陷)8、sp_lock,sp_who,活动的用户查看,原因是读写竞争资源。
9、返回了不必要的行和列10、查询语句不好,没有优化可以通过如下方法来优化查询:1、把数据、日志、索引放到不同的I/O设备上,增加读取速度,以前可以将Tempdb应放在RAID0上,SQL2000不在支持。
数据量(尺寸)越大,提高I/O越重要。
2、纵向、横向分割表,减少表的尺寸(sp_spaceuse)3、升级硬件4、根据查询条件,建立索引,优化索引、优化访问方式,限制结果集的数据量。
注意填充因子要适当(最好是使用默认值0)。
索引应该尽量小,使用字节数小的列建索引好(参照索引的创建),不要对有限的几个值的字段建单一索引如性别字段5、提高网速;6、扩大服务器的内存,Windows 2000和SQL server 2000能支持4-8G的内存。
配臵虚拟内存:虚拟内存大小应基于计算机上并发运行的服务进行配臵。
运行 Microsoft SQL Server? 2000 时,可考虑将虚拟内存大小设臵为计算机中安装的物理内存的 1.5 倍。
如果另外安装了全文检索功能,并打算运行Microsoft 搜索服务以便执行全文索引和查询,可考虑:将虚拟内存大小配臵为至少是计算机中安装的物理内存的 3 倍。
将 SQL Server max server memory 服务器配臵选项配臵为物理内存的 1.5 倍(虚拟内存大小设臵的一半)。
7、增加服务器 CPU个数;但是必须明白并行处理串行处理更需要资源例如内存。
Oracle数据库参数优化
Oracle数据库参数优化
参数优化对于Oracle数据库来说非常重要,因为它可以有效提高数据库的性能,并提供良好的可用性。
参数优化可令数据库更加稳定和高效地运行。
但是,在参数优化方面,很多初学者犯了不少错误,有些甚至会影响数据库的性能,甚至可能导致数据库出现问题。
因此,在优化参数方面,必须慎重、细心、谨慎。
首先,在参数优化之前,必须对当前参数进行全面的测试,找出需要优化的参数。
一般来说,优化可以采用两种方法,一种是优化全局参数,另一种是优化实例参数。
如果参数设置过高或者过低,可能会影响数据库的性能,因此,在参数优化时,必须按照Oracle数据库提供的最佳实践去设置参数。
最后,应该强调的是,在参数优化时,不要增加参数或者设置参数太高,并且要确保参数优化后,数据库在重要的方面有所改善,比如。
oracle优化方法总结
千里之行,始于足下。
oracle优化方法总结Oracle优化是提高数据库性能和响应能力的重要步骤。
本文总结了一些常见的Oracle优化方法。
1. 使用索引:索引是提高查询性能的主要方法。
通过在表中创建适当的索引,可以加快查询速度,并减少数据访问的开销。
但是要注意不要过度使用索引,因为过多的索引会增加写操作的开销。
2. 优化查询语句:查询语句的效率直接影响数据库的性能。
可以通过合理地编写查询语句来提高性能。
例如,使用JOIN来替代子查询,尽量避免使用通配符查询,使用LIMIT来限制结果集的大小等。
3. 优化表结构:表的设计和结构对数据库的性能也有很大的影响。
合理的表设计可以减少数据冗余和不必要的数据存储,提高查询速度。
例如,适当地使用主键、外键和约束,避免过多的数据类型和字段等。
4. 优化数据库参数设置:Oracle有很多参数可以用来调整数据库的性能。
根据具体的应用场景和需求,可以根据情况调整参数的值。
例如,调整SGA和PGA的大小,设置合适的缓冲区大小,调整日志写入方式等。
5. 使用分区表:当表的数据量很大时,可以考虑将表分成多个分区。
分区表可以加速查询和维护操作,提高数据库的性能。
可以按照时间、地域、业务等来进行分区。
6. 优化存储管理:Oracle提供了多种存储管理选项,如表空间和数据文件管理。
合理地分配存储空间和管理数据文件可以提高数据库的性能。
例如,定期清理无用的数据文件,使用自动扩展表空间等。
第1页/共2页锲而不舍,金石可镂。
7. 数据压缩:对于大量重复数据或者冷数据,可以考虑使用Oracle的数据压缩功能。
数据压缩可以减少磁盘空间的使用,提高IO性能。
8. 使用并行处理:对于大型计算或者批处理任务,可以考虑使用Oracle的并行处理功能。
并行处理可以将任务分成多个子任务,并行执行,提高处理能力和效率。
9. 数据库分区:对于大型数据库,可以考虑将数据库分成多个独立的分区。
数据库分区可以提高数据的并行处理能力,减少锁竞争和冲突,提高数据库的性能。
oracle优化方案
千里之行,始于足下。
oracle优化方案Oracle优化方案Oracle数据库是当今企业界最受欢迎的关系型数据库管理系统之一。
但是,随着数据量的不断增加和业务需求的不断增长,数据库的性能问题也会渐渐变得突出。
因此,对Oracle数据库进行优化是提高系统性能和运行效率的关键。
本文将介绍几个常见的Oracle数据库优化方案,挂念您更好地管理和优化您的数据库环境。
1. 索引优化索引是提高查询性能的关键。
可以通过以下几个方面对索引进行优化:(1)合理选择索引类型:依据查询的特点和数据分布选择合适的索引类型,如B-tree索引、位图索引等。
(2)避开过多的索引:过多的索引会增加数据插入、更新和删除的成本,并降低查询性能。
只保留必要的索引,可以有效提高性能。
(3)定期重建和重新组织索引:定期重建和重新组织索引可以提高索引的查询效率,削减碎片和冗余。
2. SQL优化SQL语句是Oracle数据库的核心,对SQL进行优化可以显著提高数据库的性能。
以下是一些SQL优化的建议:第1页/共3页锲而不舍,金石可镂。
(1)优化查询语句:避开使用不必要的子查询,尽量使用连接查询代替子查询,削减查询次数。
同时,避开使用全表扫描,可以通过创建合适的索引来提高查询效率。
(2)避开使用不必要的OR运算符:OR运算符的查询效率较低,应尽量避开使用。
可以通过使用UNION或UNION ALL运算符代替OR运算符来提高性能。
(3)避开使用ORDER BY和GROUP BY子句:ORDER BY和GROUP BY子句会造成排序和分组操作,对于大数据集来说是格外耗时的。
假如可能,可以考虑使用其他方式来实现相同的功能。
3. 系统资源优化合理配置和管理系统资源是确保数据库运行稳定和高效的重要因素。
以下是一些建议:(1)合理安排内存:依据系统和数据库的实际需求,合理安排内存资源。
调整SGA(System Global Area)区域的大小,确保适当的内存安排给缓冲池和共享池。
Oracle数据库参数优化
千里之行,始于足下。
Oracle数据库参数优化Oracle数据库参数优化是指通过调整数据库的配置参数,提高数据库的性能和稳定性。
下面是一些常见的Oracle数据库参数优化技巧:1. SGA参数优化:- 调整sga_target参数以控制SGA的大小。
SGA包括数据库缓冲区、共享池、重做日志缓冲区等,适当调整SGA的大小可以减少IO操作,提高数据库性能。
- 调整db_cache_size参数以增大数据库缓冲区的大小,提高数据块的访问速度。
- 调整shared_pool_size参数以增大共享池的大小,提高SQL语句的解析和执行效率。
2. PGA参数优化:- 调整pga_aggregate_target参数以控制PGA的大小。
PGA是用于处理SQL查询和排序的内存区域,适当调整PGA的大小可以减少磁盘IO操作,提高查询和排序的性能。
3. Redo日志参数优化:- 调整log_buffer参数以增大重做日志缓冲区的大小,减少频繁的重做日志刷新操作,提高数据库的写入性能。
- 调整log_checkpoint_timeout参数以控制重做日志刷新的频率,避免过于频繁的刷新。
4. 并行处理参数优化:- 调整parallel_max_servers参数以增大并行处理的资源限制,提高并行查询和并行DML操作的性能。
第1页/共2页锲而不舍,金石可镂。
- 调整parallel_min_servers参数以设置最小的并行处理资源数,避免并行操作的启动延迟。
5. SQL优化:- 使用合适的索引和优化的SQL语句,优化查询的执行计划。
- 使用绑定变量而不是直接将参数传递到SQL语句中,避免SQL重解析,提高性能。
6. 服务器参数优化:- 调整processes参数以增加数据库的并发连接数。
- 调整sessions参数以控制数据库的最大会话数。
- 调整open_cursors参数以增大打开游标的数量,避免游标溢出。
以上是一些常见的Oracle数据库参数优化技巧,但具体的优化策略需要根据实际情况进行调整,可以参考Oracle官方文档和专业的DBA建议。
Oracle提高查询效率的方法
优化SQL语句的若干方法1、操作符号:NOT IN操作符此操作是强列推荐不使用的,因为它不能应用表的索引。
推荐方案:用NOT EXISTS 或(外连接+判断为空)方案代替"IS NULL", "<>", "!=", "!>", "!<", "NOT", "NOT IN", "NOT LIKE", "LIKE '%500'",因为他们不走索引全是表扫描。
NOT IN会多次扫描表,使用EXISTS、NOT EXISTS、IN、LEFT OUTER JOIN来替代,特别是左连接, 而Exists比IN更快,最慢的是NOT操作。
使用in时,在IN后面值的列表中,将出现最频繁的值放在最前面,出现得最少的放在最后面,这样可以减少判断的次数2、注意union和union all的区别。
union比union all多做了一步distinct操作。
能用union all的情况下尽量不用union。
3、查询时尽量不要返回不需要的行、列。
另外在多表连接查询时,尽量改成连接查询,少用子查询。
4、尽量少用视图,它的效率低。
对视图操作比直接对表操作慢,可以用存储过程来代替它。
特别的是不要用视图嵌套,嵌套视图增加了寻找原始资料的难度。
我们看视图的本质:它是存放在服务器上的被优化好了的已经产生了查询规划的SQL。
对单个表检索数据时,不要使用指向多个表的视图,直接从表检索或者仅仅包含这个表的视图上读,否则增加了不必要的开销,查询受到干扰.5、创建合理的索引,对于插入或者修改比较频繁的表,尽量慎用索引。
因为如果表中存在索引,插入和修改时也会引起全表扫描。
索引一般使用于where后经常用作条件的字段上。
6、在表中定义字段或者存储过程、函数中定义参数时,将参数的大小设置为合适即可,勿设置太大。
oracle 查询慢的原因总结
查询速度慢的原因很多,常见如下几种:1、没有索引或者没有用到索引(这是查询慢最常见的问题,是程序设计的缺陷)2、I/O吞吐量小,形成了瓶颈效应。
3、没有创建计算列导致查询不优化。
4、内存不足5、网络速度慢6、查询出的数据量过大(可以采用多次查询,其他的方法降低数据量)7、锁或者死锁(这也是查询慢最常见的问题,是程序设计的缺陷)8、sp_lock,sp_who,活动的用户查看,原因是读写竞争资源。
9、返回了不必要的行和列10、查询语句不好,没有优化可以通过如下方法来优化查询:1、把数据、日志、索引放到不同的I/O设备上,增加读取速度,以前可以将Tempdb应放在RAID0上,SQL2000不在支持。
数据量(尺寸)越大,提高I/O越重要.2、纵向、横向分割表,减少表的尺寸(sp_spaceuse)3、升级硬件4、根据查询条件,建立索引,优化索引、优化访问方式,限制结果集的数据量。
注意填充因子要适当(最好是使用默认值0)。
索引应该尽量小,使用字节数小的列建索引好(参照索引的创建),不要对有限的几个值的字段建单一索引如性别字段5、提高网速;6、扩大服务器的内存,Windows 2000和SQL server 2000能支持4-8G的内存。
配置虚拟内存:虚拟内存大小应基于计算机上并发运行的服务进行配置。
运行Microsoft SQL Server? 2000 时,可考虑将虚拟内存大小设置为计算机中安装的物理内存的 1.5 倍。
如果另外安装了全文检索功能,并打算运行Microsoft 搜索服务以便执行全文索引和查询,可考虑:将虚拟内存大小配置为至少是计算机中安装的物理内存的 3 倍。
将SQL Server max server memory 服务器配置选项配置为物理内存的 1.5 倍(虚拟内存大小设置的一半)。
7、增加服务器CPU个数;但是必须明白并行处理串行处理更需要资源例如内存。
使用并行还是串行程是MsSQL自动评估选择的。
oracle 递归查询优化的方法
oracle 递归查询优化的方法Oracle数据库是一种常用的关系型数据库管理系统,具有强大的查询功能。
在实际开发中,我们经常会遇到需要递归查询的情况,即查询某个节点的所有子节点或祖先节点。
然而,递归查询往往会涉及到大量的数据和复杂的逻辑,导致查询效率低下。
因此,本文将介绍一些优化递归查询的方法,以提高查询效率。
1. 使用CONNECT BY子句进行递归查询Oracle提供了CONNECT BY子句来支持递归查询。
通过使用CONNECT BY子句,我们可以轻松地实现递归查询,例如查询某个员工及其所有下属员工的信息。
CONNECT BY子句的基本语法如下:```SELECT 列名FROM 表名START WITH 条件CONNECT BY PRIOR 列名 = 列名;```其中,START WITH子句用于指定递归查询的起始节点,CONNECT BY PRIOR子句用于指定递归查询的连接条件。
通过合理设置起始节点和连接条件,我们可以实现不同类型的递归查询。
2. 使用层次查询优化递归查询在递归查询中,我们经常会遇到多层递归查询的情况,即查询某个节点的所有子节点及其子节点的子节点。
这时,可以使用层次查询来优化递归查询。
层次查询是一种特殊的递归查询,通过使用LEVEL伪列可以获取每个节点的层次信息。
例如,我们可以使用以下语句查询某个员工及其所有下属员工的信息及其层次信息:```SELECT 列名, LEVELFROM 表名START WITH 条件CONNECT BY PRIOR 列名 = 列名;```通过使用LEVEL伪列,我们可以方便地获取每个节点的层次信息,从而更好地理解查询结果。
3. 使用递归子查询优化递归查询在某些情况下,使用CONNECT BY子句可能会导致查询效率低下,特别是在处理大量数据时。
这时,可以考虑使用递归子查询来优化递归查询。
递归子查询是一种特殊的子查询,通过使用WITH子句和递归关键字来实现递归查询。
34种Oracle性能优化的方法
34种Oracle性能优化的方法1、选择最有效率的表名顺序(只在基于规则的优化器中有效):ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句中写在最后的表(基础表driving table)将被最先处理,在FROM子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表。
如果有3个以上的表连接查询, 那就需要选择交叉表(intersection table)作为基础表, 交叉表是指那个被其他表所引用的表.2、WHERE子句中的连接顺序:ORACLE采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他WHERE条件之前, 那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾.3、SELECT子句中避免使用‘ * ‘:ORACLE在解析的过程中, 会将'*' 依次转换成所有的列名, 这个工作是通过查询数据字典完成的, 这意味着将耗费更多的时间4、减少访问数据库的次数:ORACLE在内部执行了许多工作: 解析SQL语句, 估算索引的利用率, 绑定变量 , 读数据块等;5、在SQL*Plus , SQL*Forms和Pro*C中重新设置ARRAYSIZE 参数, 可以增加每次数据库访问的检索数据量 ,建议值为2006、使用DECODE函数来减少处理时间:使用DECODE函数可以避免重复扫描相同记录或重复连接相同的表.7、整合简单,无关联的数据库访问:如果你有几个简单的数据库查询语句,你可以把它们整合到一个查询中(即使它们之间没有关系)8、删除重复记录:最高效的删除重复记录方法 ( 因为使用了ROWID)例子:DELETE FROM EMP E WHERE E.ROWID > (SELECT MIN(X.ROWID)FROM EMP X WHERE X.EMP_NO = E.EMP_NO);9、用TRUNCATE替代DELETE:当删除表中的记录时,在通常情况下, 回滚段(rollback segments ) 用来存放可以被恢复的信息. 如果你没有COMMIT事务,ORACLE会将数据恢复到删除之前的状态(准确地说是恢复到执行删除命令之前的状况) 而当运用TRUNCATE时, 回滚段不再存放任何可被恢复的信息.当命令运行后,数据不能被恢复.因此很少的资源被调用,执行时间也会很短. (译者按: TRUNCATE只在删除全表适用,TRUNCATE是DDL不是DML)10、尽量多使用COMMIT:只要有可能,在程序中尽量多使用COMMIT, 这样程序的性能得到提高,需求也会因为COMMIT所释放的资源而减少:COMMIT所释放的资源:a. 回滚段上用于恢复数据的信息.b. 被程序语句获得的锁c. redo log buffer 中的空间d. ORACLE为管理上述3种资源中的内部花费11、用Where子句替换HAVING子句:避免使用HAVING子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤. 这个处理需要排序,总计等操作. 如果能通过WHERE子句限制记录的数目,那就能减少这方面的开销. (非oracle中)on、where、having这三个都可以加条件的子句中,on是最先执行,where次之,having最后,因为on是先把不符合条件的记录过滤后才进行统计,它就可以减少中间运算要处理的数据,按理说应该速度是最快的,where也应该比having快点的,因为它过滤数据后才进行sum,在两个表联接时才用on的,所以在一个表的时候,就剩下where跟having比较了。
Oracle数据库性能优化分析
千里之行,始于足下。
Oracle数据库性能优化分析Oracle数据库性能优化分析是指对Oracle数据库进行综合性能分析和优化的过程。
通过分析数据库的运行状况、识别潜在的性能瓶颈、确定解决方案并实施优化措施,可以提高数据库的性能和效率。
以下是Oracle数据库性能优化分析的一般步骤:1. 收集性能数据:通过Oracle的性能监控工具,如AWR报告、统计信息收集等,收集数据库的性能数据,包括CPU利用率、I/O响应时间、锁定情况等。
2. 确定性能瓶颈:通过分析性能数据,确定数据库中存在的性能瓶颈,如高CPU使用率、高IO等待、长时间的锁等待等。
3. 优化SQL语句:分析执行频次较高的SQL语句,通过重写SQL语句、调整索引和统计信息等方式,优化SQL语句的执行计划,减少IO开销和CPU消耗。
4. 优化数据库结构:根据应用的需求和查询模式,调整表结构、分区策略、索引设计等,以提高查询性能和数据访问效率。
5. 优化数据库配置参数:调整数据库的配置参数,包括缓冲区大小、日志大小、并发连接数等,以最大限度地利用硬件资源,提高数据库的吞吐量和响应时间。
6. 确保数据完整性和一致性:通过使用合适的约束和触发器,确保数据的完整性和一致性,防止数据错误和冲突对性能造成负面影响。
第1页/共2页锲而不舍,金石可镂。
7. 监控和调优:定期监控数据库的性能指标,如响应时间、吞吐量等,及时识别和解决潜在的性能问题,保持数据库的高可用性和性能稳定性。
需要注意的是,性能优化是一个综合性的工作,需要结合具体的应用场景和需求来进行分析和优化,没有一种通用的解决方案,需要根据实际情况进行定制化的优化措施。
同时,性能优化是一个持续改进的过程,需要定期评估数据库的性能状况,并根据需求进行调整和优化。
0racle数据库的优化探讨
0racle数据库的优化探讨摘要:Oracle数据库作为全球第一大数据库厂商,在国内外获得了广泛应用,本文对Oracle数据库性能调整和优化进行了简要分析和研究,对各种优化技术进行了深入的探讨,将SQL语句优化、Oracle内存分配调整作为论文的主要研究内容。
关键词:数据库优化随着数据库规模的扩大,用户数量的增加,数据库应用系统的响应速度下降,性能问题越来越突出。
数据库系统的性能调整与优化对于整个系统的正常运行起着至关重要的作用。
基于此,本文主要研究SQI 语句、Oracle内存分配的性能优化问题,给出了一般情况下Oracle数据库应用系统的性能优化方一法,以期推动Oracle数据库性能优化技术的发展。
1 SQL查询优化数据库系统是管理信息系统的核心,从大多数系统的应用实例来看,查询操作在各种数据库操作中占据的比重最大,查询速度的快慢直接影响数据库的推广和应用,对于大型数据库来说,这一点显得尤其重要。
由于查询操作在SQL语句中代价最大,因此优质的查询语句可以大大提高应用系统的性能。
1.1 查找有问题的SQL语句①利用SQL Trace工具分析SQL语句。
Oracle的SQL Trace工具是确定SQL语句是否被合理优化的最好方法之一。
如果发现当前会话行为异常或性能下降,则可以通过该工具获得有关系统操作性能的信息,如解析、执行和返回数据的次数、CPU时间和执行时间、物理读和逻辑读操作次数、库缓冲区命中率等。
一旦为会话激活了SQL-TRACE Oracl。
就会在udump管理区创建跟踪文件。
由于SQL Trace将这些信息以一种不可读的格式存放在跟踪文件中,因p一个字段的标签同时在主查询和where子句中的查询中出现,那么当主查询中的字段值改变之后,子查询必须重新查询一次。
对于子查询来说,查询嵌套层次越多,效率越低,因此应当尽量避免它。
如果子查询不可避免,那么要在子查询中过滤掉尽可能多的行。
在Oracle中相关子查询的执行效率特别低,引入临时表可以使其速度快100倍左右。
常见Oracle数据库优化策略与方法
常见Oracle数据库优化策略与方法
Oracle数据库优化是提高数据库性能的关键步骤,可以采取多种策略。
以下是一些常见的Oracle数据库优化策略:
1.硬件优化:这是最基本的优化方式。
通过升级硬件,比如增加RAM、使用
更快的磁盘、使用更强大的CPU等,可以极大地提升Oracle数据库的性能。
2.网络优化:通过优化网络连接,减少网络延迟,可以提高远程查询的效率。
3.查询优化:对SQL查询进行优化,使其更快地执行。
这包括使用更有效的
查询计划,减少全表扫描,以及使用索引等。
4.表分区:对大表进行分区可以提高查询效率。
分区可以将一个大表分成多
个小表,每个小表可以单独存储和查询。
5.数据库参数优化:调整Oracle数据库的参数设置,使其适应工作负载,可
以提高性能。
例如,调整内存分配,可以提升缓存性能。
6.数据库设计优化:例如,规范化可以减少数据冗余,而反规范化则可以提
升查询性能。
7.索引优化:创建和维护索引是提高查询性能的重要手段。
但过多的索引可
能会降低写操作的性能,因此需要权衡。
8.并行处理:对于大型查询和批量操作,可以使用并行处理来提高性能。
9.日志文件优化:适当调整日志文件的配置,可以提高恢复速度和性能。
10.监控和调优:使用Oracle提供的工具和技术监控数据库性能,定期进行性
能检查和调优。
请注意,这些策略并非一成不变,需要根据实际情况进行调整。
在进行优化时,务必先备份数据和配置,以防万一。
oracle sql优化常用的15种方法
oracle sql优化常用的15种方法1. 使用合适的索引索引是提高查询性能的重要手段。
在设计表结构时,根据查询需求和数据特点合理地添加索引。
可以通过创建单列索引、复合索引或者位图索引等方式来优化SQL查询。
2. 确保SQL语句逻辑正确SQL语句的逻辑错误可能会导致低效查询。
因此,在编写SQL语句前,需要仔细分析查询条件,确保逻辑正确性。
3. 使用连接替代子查询在一些场景下,使用连接(JOIN)操作可以替代子查询,从而减少查询的复杂度。
连接操作能够将多个数据集合合并为一个结果集,避免多次查询和表的扫描操作。
4. 避免使用通配符查询通配符查询(如LIKE '%value%')在一些情况下可能导致全表扫描,性能低下。
尽量使用前缀匹配(LIKE 'value%')或者使用全文索引进行模糊查询。
5. 注意选择合适的数据类型选择合适的数据类型有助于提高SQL查询的效率。
对于整型数据,尽量使用小范围的数据类型,如TINYINT、SMALLINT等。
对于字符串数据,使用CHAR字段而不是VARCHAR,可以避免存储长度不一致带来的性能问题。
6. 优化查询计划查询计划是数据库在执行SQL查询时生成的执行计划。
通过使用EXPLAIN PLAN命令或者查询计划工具,可以分析查询计划,找出性能瓶颈所在,并对其进行优化。
7. 减少磁盘IO磁盘IO是影响查询性能的重要因素之一。
可以通过增加内存缓存区(如SGA)、使用高速磁盘(如SSD)、使用合适的文件系统(如ASM)等方式来减少磁盘IO。
8. 分区表对于大数据量的表,可以考虑使用分区表进行查询优化。
分区表可以将数据按照某个规则分散到不同的存储区域,从而减少查询范围和加速查询。
9. 批量操作尽量使用批量操作而不是逐条操作,可以减少数据库的事务处理开销,提高SQL执行效率。
可以使用INSERT INTO SELECT、UPDATE、DELETE等批量操作语句来实现。
oracle优化原则和方法
在oracle数据库管理中,优化是最重要的一项,也是最基础的一项。
oracle优化是为了改善数据库访问性能,使其更加高效。
要进行优化,就需要正确的方法和原则,下面介绍oracle优化的一些原则和方法。
一、优化原则1.应限制数据库大小,减少数据库扩充带来的影响,进而节省存储空间;2.应注重数据库索引结构优化,引起合理分类,改善搜索效率;3.应使用合理的逻辑结构,使得访问表时,扫描表行越少越高;4.应尽量避免使用全表扫描,从而提高数据处理速度;5.应尽量避免在数据库中使用触发器或存储过程,以免增加不必要的开销;6.应注重事务处理,尽量避免使用长事务;7.应尽量减少事务完成时间,避免不必要的资源锁定;8.应使用合理的架构逻辑结构,避免将多个大表同时加载到内存中;9.应限制数据库连接数,减少用户的等待时间和系统的负荷;10.应尽可能用正确的方式和有效的技术来优化系统。
二、优化方法1.创建索引:创建正确的索引对于提高oracle数据库的性能非常重要。
创建索引时,要考虑建立索引应包括的列和索引的类型;2.优化SQL语句:通过修改或优化SQL语句,可以使oracle数据库更加高效;3.改善数据库可用性:通过合理的备份与恢复措施,以及采用定期维护慢查询SQL和检查数据的一致性等技术,可以改善数据库的可用性;4.监控调优:可以通过oracle数据库定期监控功能,监控各种资源消耗情况,并深入分析SQL表达式,进行针对性的优化;5.定期重建表和索引:定期重建表和索引,能够使oracle数据库性能得到改善;6.合理分区:oracle数据库中用到分区表来改进query语句执行速度,减少用户的时间等待;以上是oracle优化的原则和方法,以改善oracle数据库的性能,。
论Oracle数据库的性能优化问题
论Oracle数据库的性能优化问题Oracle数据库是一款流行的企业级数据库软件,但其性能优化问题也是不可避免的。
在实际应用中,如果Oracle数据库出现性能问题,将有严重的影响和损失。
因此,本文将讨论如何优化Oracle数据库的性能问题。
首先,针对Oracle数据库的性能瓶颈,可以通过调整数据库参数来提高性能。
Oracle数据库有很多参数可以配置,例如,缓存区大小、连接数、内存分配等。
通过针对不同的应用场景调整不同的参数配置,可以最大化地利用数据库的性能。
其次,针对SQL的性能问题,可以通过改进SQL语句来提高性能。
SQL优化是一项复杂的工作,但可以通过分析SQL执行计划来发现性能瓶颈,例如,缺乏索引、大表连接、高开销的子查询等。
并可以通过添加索引、优化查询语句等方式来提高数据库的性能。
除此之外,还可以通过加强硬件设备等方面来提升数据库性能。
例如,扩展数据库服务器的内存和硬盘容量,可以提高数据库的读写速度。
而使用高速网络设备如IB网络和10/100G以太网设备等,也可提高数据库的数据传输速度。
此外,Oracle数据库的性能优化也需要管理进程的支持与配合。
例如,数据库管理员需要监控数据库服务器硬件和软件性能,例如Oracle数据库的内部锁、等待事件、I/O活动等等。
在监控到性能问题后,需要在业务空档期进行优化,如调整SQL语句、更改数据库参数等。
总之,提高Oracle数据库的性能需要全面考虑软硬件配置、SQL语句等多个方面的因素。
通过合理的参数配置、SQL优化和硬件支持等方式,可以优化数据库的性能,提高应用的稳定性和响应速度。
oracle 查询慢的原因总结
查询速度慢的原因很多,常见如下几种:1、没有索引或者没有用到索引(这是查询慢最常见的问题,是程序设计的缺陷)2、I/O吞吐量小,形成了瓶颈效应。
3、没有创建计算列导致查询不优化。
4、内存不足5、网络速度慢6、查询出的数据量过大(可以采用多次查询,其他的方法降低数据量)7、锁或者死锁(这也是查询慢最常见的问题,是程序设计的缺陷)8、sp_lock,sp_who,活动的用户查看,原因是读写竞争资源。
9、返回了不必要的行和列10、查询语句不好,没有优化可以通过如下方法来优化查询:1、把数据、日志、索引放到不同的I/O设备上,增加读取速度,以前可以将Tempdb应放在RAID0上,SQL2000不在支持。
数据量(尺寸)越大,提高I/O越重要.2、纵向、横向分割表,减少表的尺寸(sp_spaceuse)3、升级硬件4、根据查询条件,建立索引,优化索引、优化访问方式,限制结果集的数据量。
注意填充因子要适当(最好是使用默认值0)。
索引应该尽量小,使用字节数小的列建索引好(参照索引的创建),不要对有限的几个值的字段建单一索引如性别字段5、提高网速;6、扩大服务器的内存,Windows 2000和SQL server 2000能支持4-8G的内存。
配置虚拟内存:虚拟内存大小应基于计算机上并发运行的服务进行配置。
运行Microsoft SQL Server? 2000 时,可考虑将虚拟内存大小设置为计算机中安装的物理内存的 1.5 倍。
如果另外安装了全文检索功能,并打算运行Microsoft 搜索服务以便执行全文索引和查询,可考虑:将虚拟内存大小配置为至少是计算机中安装的物理内存的 3 倍。
将SQL Server max server memory 服务器配置选项配置为物理内存的 1.5 倍(虚拟内存大小设置的一半)。
7、增加服务器CPU个数;但是必须明白并行处理串行处理更需要资源例如内存。
使用并行还是串行程是MsSQL自动评估选择的。
优化sql语句提高oracle执行效率
优化sql语句提高oracle执行效率
1.尽可能高效:采用最有效的查询方式、避免使用不必要的查询语句、提高检索速度而非数据量。
2.避免使用子查询:尽量不使用子查询,把子查询换成联合查询或者
通过多表连接更新数据。
3.避免重复读取:尽量从数据库中读取一次数据,不要读取多次相同
的数据,避免多次查询,提高数据库的查询效率。
4.避免使用NOTIN和NOTEXISTS:尽量不用NOTIN和NOTEXISTS查询
语句,因为这种查询方式比较耗时,可以把NOTIN换成LEFTJOIN不为空
即可。
5.避免使用OR:尽量不用OR,用AND替代OR,AND通常比OR更有效。
6.避免使用模糊查询:尽量不用模糊查询,模糊查询效率较低,可以
用相似查询替代模糊查询。
7.合并多个表:如果有多个表,尽量合并这些表,以便减少查询次数。
8. 使用索引: 设置索引来提高查询速度,尽可能在 Where、Group by、Having、Order by等关键字中使用索引。
9. 优化sql语句顺序: 尽可能把WHERE条件的语句写在前面,以便
优先查询出少量的数据来,提高查询效率;把ORDER BY语句写在最后,
以便能有效地利用索引。
10.选择可用的查询方法:使用最适合的查询方法,选择适当的SELECT语句、JOIN语句和UNION语句,以使SQL语句更快地返回结果。
11. 避免使用Distinct: Distinct能会导致查询效率降低,尽量避免使用Distinct。
oracle子查询与节点查询
最近项目中用到了很多ORACLE的查询语句,尤其是各种连接查询和子查询,现在就总结下这些语句的用法和部分效率相关内容.首先是连接查询.当我们所需要的数据存在于两张不同的表中时,这个时候就需要用到表连接查询.1. select d.deptno,d.dname,e.empno,e.ename,e.salfromdept d join emp e on d.deptno=e.deptno;--这是在做一个连接查询,连接的条件就是以表emp别名e和表dept别名d的deptno字段相等为条件做的一个表连接查询当emp表中的deptno字段与dept 中的deptno字段能一一对应的时候,就现在在结果集中2. select d.deptno,d.dname,e.empno,e.ename,e.salfrom dept d , emp ewhere d.deptno=e.deptno;--这个其实做得是和上面一样的一个连接查询,功能完全一样,如果前一个写法是现代写法,那么这个写法就算是古典写法吧3. select d.deptno,d.dnam e,e.empno,e.ename,e.salfromdept d left join emp e on d.deptno=e.deptno;--这是左连接查询,就是第一种查询里加了一个关键字left, 这种查询的结果于第一种不同,左边的表dept 中所有的记录都会显示在结果集中,无论emp表中是否有与之对应的对应left还有right,那么就是连接时,右边表的结果集全都显示在表中,叫做右连接4. ORACLE针对左右连接查询,还有特别的符号(+),并且ORALCE针对使用这个符号的连接查询做了特别的优化,select d.deptno,d.dname,e.empno,e.ename,e.salfrom dept d,emp ewhere d.deptno=e.deptno(+);--这个加号写在左边,其查询的结果和使用left的左连接查询效果相同select d.deptno,d.dname,e.empno,e.ename,e.salfrom dept d,emp ewhere d.deptno(+)=e.deptno;--这个加号写在左边,其查询的结果和使用right的右连接查询效果相同5. 最后还有一种全连接,使用full join 关键字select d.deptno,d.dname,e.empno,e.ename,e.salfrom dept d full join emp e on d.deptno=e.deptno;--这种查询效率不高,很少用到,左右表的数据全显示6.自连接,这个就是数据都在一张表中,但是需要根据条件筛选select yg.ename,sj.ename 上级from emp yg,emp sjwhere yg.mgr=sj.empno下面介绍下oracle特有的树形查询语句一般来说,如果数据库本身没有封装树形查询,那么就需要使用JAVA或者其他语言写相应的递归查询,写起来是比较复杂的,用起来效率肯定也没oracle封装后的效率高.先建立一张表,用于保存一个树形结构.create table type_tree(type_id number(5) primary key,type_name varchar2(10),parent_type number(5));也有很多项目使用的两张表或者多张表保存属性结构,这样也是可以保存的,但是这样的设计对于很复杂的树形结构是很不方便的,因为每一个节点都必须要有一张对应的表,当查询涉及多个节点的时候,就需要连接多个表,连接的表越多,效率越低.而且在以后扩展业务需求的时候,节点增加,表也增加.如果项目中不会涉及到很多的树形查询,那么我个人认为这种设计也是可以的接受的.7.使用自链接查询子节点,父节点select s.type_nam e as 节点,p.type_name as 父节点from type_tree s,type_tree pwhere s.parent_type=p.type_idorder by 2--这种查询也可以查处某种成都的树形结构,只不过其缺点是只能知道父节点和子节点两层,更多的需求还是需要使用递归查询.8.使用Oracle提供了递归查询(又叫树型查询)select t.*,level as 层次--level,oracle数据库中的关键字,表示层次from 表twhere 普通条件--也可以用于限制levelstart with 子ID=? --开始的节点connect by prior 子ID=父ID --子ID=父ID 往下查父ID=子ID 往上查例如: 显示每个节点的信息和它所处的层次(level)select t.*,level as 层次from type_tree tstart with t.type_id=100connect by prior t.type_id=t.parent_type9.在网页上实现展示点击一个节点后,展示此节点下面的一层子节点,那么这时就需要用到where条件中过滤levelselect t.*,level as 层次from type_tree twhere level=2 --用到了level,2表示是以此节点为根节点的下一层节点start with t.type_id=100connect by prior t.type_id=t.parent_type10. 对level字段使用max可以获得从每个节点开始,向下(或向上)的层次数量select max(level) as maxlevelfrom type_tree tstart with t.type_id=107 --在此填写不同的开始节点,就可以获得此节点开始的节点数量connect by prior t.type_id=t.parent_type由此可以看出,使用oracle中内置的递归查询,可以很轻松的实现所有的树形查询了.下面介绍下子查询与效率的问题子查询分为相关子查询和非相关子查询非相关子查询是独立于外部的的子查询,子查询总共执行一次,执行完毕后将值传递给外部查询.非相关子查询的子查询部分是可以单独执行的.相关子查询的执行以来于外部查询的数据返回一行,子查询就执行一次.由此也可以看出,相关子查询的效率是不高的,所以很少使用.示例:查询各部门的人数,格式:部门编号,部门名称,人数select deptno,dname,0 as 人数from dept; --计算列子查询,这个查询本身没什么实际意义,就是始终让一列为0select deptno,dname,(select count(*) from emp) as 人数from dept; --非相关子查询,这个查询本身也没什么实际意义,就是始终让一列为emp表中的记录总数select deptno,dname,(select count(*) from emp where emp.deptno=dept.deptno) as 人数from dept;--相关子查询,查询每个部门的人数,子查询中的所用到的where 条件后面的 dept,deptno依靠外部查询传入这样看起来起来,就像没一条dept的记录都会让子查询执行一次.DEPTNO DNAME 人数10 ACCOUNTING select count(*) from emp where emp.deptno=1020 RESEARCH select count(*) from emp where emp.deptno=2030 SALES select count(*) from emp where emp.deptno=3040 OPERATIONS select count(*) from emp where emp.deptno=40如果一张表中的记录条数达到了10000条,而它的每一行某个字段又作为了子查询查询另外一张表(这张表有20000条记录)的一个条件,那么这样计算下来,这条语句一共执行了10000+10000*20000次,效率是相当的低了.。
Oracle语句优化规则汇总
Oracle语句优化规则汇总(1)1.选用适合的ORACLE优化器ORACLE的优化器共有3种:a.RULE(基于规则)b.COST(基于成本)c.CHOOSE(选择性)设置缺省的优化器,可以通过对init.ora文件中OPTIMIZER_MODE参数的各种声明,如RULE,COST,CHOOSE,ALL_ROWS,FIRST_ROWS.你当然也在SQL句级或是会话(session)级对其进行覆盖。
为了使用基于成本的优化器(CBO,Cost-Based Optimizer),你必须经常运行analyze命令,以增加数据库中的对象统计信息(object statistics)的准确性。
如果数据库的优化器模式设置为选择性(CHOOSE),那么实际的优化器模式将和是否运行过analyze命令有关。
如果table已经被analyze过,优化器模式将自动成为CBO,反之,数据库将采用RULE形式的优化器。
在缺省情况下,ORACLE采用CHOOSE优化器,为了避免那些不必要的全表扫描(full table scan),你必须尽量避免使用CHOOSE优化器,而直接采用基于规则或者基于成本的优化器。
2.访问Table的方式ORACLE采用两种访问表中记录的方式a.全表扫描全表扫描就是顺序地访问表中每条记录。
ORACLE采用一次读入多个数据块(database block)的方式优化全表扫描。
b.通过ROWID访问表你可以采用基于ROWID的访问方式情况,提高访问表的效率,ROWID包含了表中记录的物理位置信息……ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系。
通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高。
3.共享SQL语句为了不重复解析相同的SQL语句,在第一次解析之后,ORACLE将SQL语句存放在内存中。
这块位于系统全局区域SGA(system global area)的共享池(shared buffer pool)中的内存可以被所有的数据库用户共享。
浅谈ORACLE数据库的优化
在基 于规 则优化 的情 况下 , 如果 下列 任何条 件
在 S A语句 出现 , 要对 一个表进 行全表扫 描 : G 就
( )通 过 全表 扫描 读取 的数 据很 快从 S A 的 2 G 缓 冲区移走 ( 如果 正在 扫描 的表不 是“ 高速存 储” 的
表)
24 管理包含 视图的 S . QL语句
如 果 查 询 包 含 视 图 , 化 器 有 两 种 执 行 查 询 的 优 方 法 : 先 解 决 视 图 然 后 执 行 查 询 , 者 把 视 图 文 首 或 本 集 成 到 查 询 里 去 。如 果 首 先 执 行 视 图 , 么 先 完 那
维普资讯
技7 交溜 I c
浅谈 OR L AC E数据库 的优化
赵 峰 ( 西 省 通 信 公 司) 山
摘 要 :提 出 了一 种 优 化 Orc al 据 库 的 方 法 , 要 基 于 ORC L e数 主 A E优 器化 分 析 了 S QL语 句 在 ORC L 中执 行 的 三 个 步 骤 来 优 化 和 提 高 ORC L AE A E数 据 库 的 性 能 。 关 键 词 :数 据 库 扫 描 多表 联 结 子 查 询
< 西 置 信 斟 技 )0 6年 囊 3期 山 z0
通 过过程 、 程序包 、 函数 、 发器等来实 现。 触
L OOP 、 S HAS J N 和 MERGE l N。ME H OI OI RGE
J N 是 一 组 操 作 , 所 有 行 被 处 理 完 之 前 , 不 返 OI 在 它
最 理 想 的 步 骤 是 语 句 只 执 行 1 2 3和 8步 来 、、 进 行 处 理 。不 经 过 2 3步 来 测 试 被 传 给 O d 的 语 、 a r e 句 要 使 用 1 8步 进 行 处 理 。只 经 过 1 2 3 8的 S - 、、、 QL 语 句 要 比经 过 1 8步 的 语 句 更 为 有 效 。 - 1 . 在 共 享 池 中重 用 S 2 QL语 句
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Oracle执行很多种的查询变换——子查询展开(译者注:Subquery Unnesting,指的是把ANY和EXISTS这类子查询变成连接),分组和DISTINCT视图的合并(译者注:group-by and distinct view merging,指的是在带有GROUP BY/DISTICNT的视图/内联视图中,先和外层的表进行连接,过滤掉一些数据然后再做聚合操作),相同子表达式的消除(译者注:common sub-expression elimination,指的是同样的一个表达式出现多次,只需计算一次并多次引用计算结果),连接谓词下推(译者注:join predicate pushdown,指的是把外层的连接条件推入里层从而达到预先过滤的目的),连接因式分解(译者注:join factorization,指的是把UNION的两个子查询中的公共部分提取出来放到UNION之后做,类似提取公因式),集合操作INTERSECT和MINUS到连接/反连接的转换,OR谓词的扩展(译者注:OR expansion,指的是把OR或者IN变成一系列UNION ALL),星型转换(译者注:star transformation,用于数据仓库的事实表和维表连接,转换为事实表的位图索引的一系列BITAND运算),分组和DISTINCT的置换(译者注:group-by and distinct placement,指的是在有GROUP BY或DISTINCT,同时有WHERE连接条件,CBO先做分组聚合减少行数再做连接操作,和先前的group-by and distinct view merging恰好相反)。Oracle中的查询变换可能是试探式的或基于成本的。在基于成本的变换中,逻辑变换和物理优化结合起来生成了优化的执行计划。
2.子查询合并
子查询合并指的是这样一种技术,即两个子查询在某些条件下能够合并成一个,从而把多次表扫描、多次连接匹配减少为单次表扫描和单次连接匹配。虽然子查询合并被定义为二元操作(译者注:指合并的子查询数目为两个),它可以被依次应用到任意数目的子查询。子查询合并是可行的,因为一个子查询的作用相当于在外层查询的表之上的一个过滤谓词。
Oracle对几乎所有的子查询都进行展开。有两种范围广泛的展开方式——一种生成衍生表(内联视图),另一种把一个子查询合并到它的外层查询。在Oracle中,前者是以一种基于成本的方式应用的,而后者则是以一种试探式的方法完成的。
对于非标量子查询(译者注:scalar subqueries标量子查询指的是出现在SELECT部分的子查询)的展开往往变成半连接(semijoin)或反连接(antijoin)。Oracle能够使用索引查找,哈希,排序-合并来进行半连接或反连接。Oracle执行引擎对反连接或半连接结果中的左表元组进行缓存,所以当左表的连接列中有大量重复数据时,对子查询的多次求值能够避免。在缺乏相关索引的情况下,Oracle对存在量词或全称量词的不等比较子查询(例如: > ANY, < ANY,等等)进行展开,在不等谓词上做排序-合并连接。
1.3.1报表类窗口函数
本文展示的子查询优化利用了窗口函数中被称为报表窗口函数的一类。这些窗口函数,根据它们的定义,对于每行返回相应分区(按照分区键的定义)中所有行的聚合值。如果一个窗口函数没有排序键和WINDOW子句,或者当每行的WINDOW包含了它所属分区的每一行,则可称为报表窗口函数。在本文中,我们有时候也把这些函数成为窗口汇总。
Window_Function ([arguments]) OVER (
[ PARTITION BY pk1 [, pk2,...] ]
[ ORDER BY ok1 [, ok2, ...] [WINDOW clause] ] )
窗口函数在由分区键PARTITION BY pk1, pk2, ...定义的分区中求值,每个分区的数据以排序键ORDER BY ok1,ok2,....进行排序。WINDOW子句为每行数据定义窗口(起止点)。SQL聚合函数(SUM, MIN, COUNT等等),排名函数(RANK, ROW_NUMBER,等等),或参照函数(LAG, LEAD, FIRST_VALUE,等等)可被用作窗口函数。ANSI SQL标准[文献10,11]包含了窗口函数的语法语义细节。
2.1同类型的子查询合并
如果两个AND EXISTS子查询或者两个OR NOT EXISTS子查询满足包容属性,那么它们就能被合并为一个,合并结果是被包容的那个子查询留下,包容子查询去除。如果是OR EXISTS或者AND NOT EXISTS的情况,则合并结果是包容子查询被留下,被包容子查询去除。
如果Oracle的基于成本的优化器选择了一个计划,使得数据能够以分区键和排序键的顺序产生,那么排序就可以去掉。在这种情况下,窗口缓存执行被使用,Oracle仅仅是把数据缓存并多次访问来计算窗口函数。可是,对于像RANK, ROW_NUMBER,累计窗口聚合函数(译者注:例如SUM,COUNT等)这些窗口函数来说,假如数据是按顺序产生的,那么连缓存也没有必要。只要保留某些上下文信息(窗口函数值和分区键值),这些函数就能够在处理输入数据的同时被计算。
Oracle 10g引进了一种用作基于成本的查询变换的通用框架[文献8],和几种状态空间的搜索策略。在基于成本的查询变换过程中,一个查询被复制、变换,同时,现有的基于成本的物理优化器会计算出它的成本。这个过程被重复多次,每次运用一套不同的转换方案;最后,一种或多种转换被选中并应用于原来的查询,如果它的成本计算结果很理想的话。基于成本的变换框架提供了一种机制,能够试探一种或多种变换所生成的状态空间,从而使得Oracle能够以一种高效的方式选择理想的转换方案。基于成本的变换框架能够处理用户查询的多个查询块和多种转换方案之间的依赖关系造成的复杂性。
在一个查询块之中,窗口函数在WHERE,GROUP-BY,和HAVING子句之后被求值。在计算一个窗口函数时,Oracle按分区键和排序键对数据进行排序,并且根据需要遍历数据。我们称之为窗口排序执行。显然,如果窗口函数没有分区键和排序键,则排序就没有必要。在这种情况下,Oracle为了计算窗口函数对数据进行缓存,这称作窗口缓存执行。
目前,当两个EXISTS (或NOT EXISTS)子查询出现在一个逻辑相连或逻辑分离之中(译者注:指AND或者OR。为方便起见,下文都把conjunctive和disjunctive翻译为AND和OR),Oracle会执行不同的子查询合并。既然ANY和ALL子查询能被相应转换成EXISTS和NOT EXISTS子查询,我们这里不再不讨论ANY/ALL子查询的合并。两个子查询等价而且是同一种类型(即都是EXISTS或都是NOT EXISTS)的情况是微不足道的,因为子查询合并仅仅是把其中一个去除。如果两个等价子查询是不同类型,则合并过程会把两个都去除并代之以FALSE/TRUE谓词,取决于这两个子处理各种复杂的SQL查询,包括带有聚合函数,UNION/UNION ALL, DISTINCT,分组(GROUP BY)视图等等的嵌套子查询。这类查询在决策支持系统(DSS)和在线分析处理系统(OLAP)中越来越重要。查询变换是通常推荐的用于优化此类子查询的技术。
子查询是SQL的一种强大的组件,大大扩展了它的声明性和表达能力。SQL标准允许子查询被使用在SELECT, FROM, WHERE和HAVING子句中。决策支持系统的基准测试TPC-H [文献14]和TPC-DS [文献15]大量使用了子查询。TPC-H基准测试的22个查询中,差不多有一半用了子查询。大部分是相关子查询,很多都含有聚合函数。所以,高效地执行复杂子查询对数据库至关重要。
包容属性是一个重要属性,它使得我们能够把两个子查询的动作合并到一起。如果两个相连的子查询违背了包容属性,那么它们的过滤谓词就不能结合到一个子查询,因为这个子查询只会产生交集。
(译者注:例如EXISTS A AND EXISTS B, A和B可以是“分别存在”即可,如果改为EXISTS A AND B则要求满足两个条件的同一行存在,和原来不等价)
SUM(volume) OVER (PARTITION BY ticker) AS "Reporting SUM"
FROM stocks;
Table 1. Reporting Window SUM Example
Ticker Day Volume Reporting SUM
-------------------------------------------------
如果两个查询块产生了同样的结果集,则它们被认为是语义等价的。结构或语法相同的两个查询块也可以确定它们的等价性。
如果一个查询块Y的结果是X的结果的子集(不一定是真子集),那么我们就认为查询块X包容查询块Y。X称为包容查询块,而Y则称为被包容查询块。换而言之,假如Y含有一些"与"过滤谓词P,并且当P不被考虑时X和Y变得等价,则X和Y满足包容属性。(译者注:假设Y是在X的基础上多加一些WHERE过滤谓词,这组谓词P是用AND连到X上去的,那么X就包容Y)
本文描述了ORACLE关系数据库系统中的增强型子查询优化。它讨论了几种技术——子查询合并,利用窗口函数(译者注:即分析函数)的子查询消除,对分组查询的视图消除(view elimination)。这些技术辨认出查询结构中的冗余成分,并把它们去除,将查询转换为可能更加优化的形式。本文也讨论了新型的并行执行技术,该技术应用广泛,并可用来改善这些经过变换的查询的可扩展性。它还描述了一种反连接(antijoin)的变种,用来优化在有空值的列上带全称量词(译者注:在SQL中指ALL这类量词)的查询。它随后演示了这些优化的结果,表明在执行速度上有着显著的改善。
如果子查询在全称量词比较(例如, <>ALL)中带有可空列,则无法展开为常规的反连接。Oracle使用了一种反连接的变种,称为“已知空值反连接”(null-aware antijoin),来展开此类子查询。