Oracle 性能优化之—表设计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0005 0008 0009 0010
AAA TTT RRR HHH
980 320 330 560
AAA AAA AAA BBB CCC
0001 0003 0001 0002
EEE DDD AAA FFF
300 400 600 550
数据块
0120 0340 0900 0190
NNN OOO SDF DSS
3
3
4
4
8
75
95
14
索引重构
• 和表重构是一样的道理,经过长时间的修改、删除会造成很多没有用的空块. 通过使用nologging 和parallel degree 8 ,创建索引大多情况下不需要记录log。
• •
Alter index index_name rebuild nologging; Alter index index_name rebuild partition partition_name nologging;
比较项 存储 行的唯一识别 主健是否必须指定 行的读取 全表扫描 能否使用聚簇 分区的应用 并行处理
堆表 随机存储(快) ROWID 可以不指定 使用ROWID进行读取 按任意顺序返回行(慢) 可以 允许 允许
索引组织表 按索引排序存储(慢) 主键 必须指定 使用主键读取 按主键顺序返回行(快) 不能 版本不同有所差别 版本不同有所差别
4
堆表与索引组织表
堆表 索引组织表
Table access by ROWID
Non-key columns Key column Row header
聚簇表
聚簇表是指:如果一组表有一些共同的列,则将这样一组表存储在相同的数据库 块中。把相关数据存储在同一个块上。 可以通过设置Size值来限制一个块上最多只能存储多少个不同的聚簇。
13
表重构
• 表重构就是把表里的数据重新插入一遍,这样做的好处有回收垃圾空间、使 用表里的数据存储便有连续性、减少行迁移,方便I/O的读取。
刚初始化后数据存储情况
1
2
3
3
3
3
4
4
4
4
使用一段时间后,因为删除了数据和添加了数据的存储情况
95
3
75
3
4
8
9
4
表重构后,表空间收缩后
95
3
75
3
4
8
4
能否把存储情况改成和索引顺序一至,提高集群因子,减少读取的数据块
120 330 220 580 DDD DDD EEE
索引2
11
集群因子越低通过索引读取的块越少,速度越快! 我们建表时需要考虑表的特性,对不同的表制定不同的建表策略来达到数据存取的最优。
12
分区表(主要是纵向分区)
分区有横向和纵向分区,一般所说的分区都是指横向分区,而忽略纵向分。 横向分区有:区间分区、散列分区、列表分区、组合分区,这些内容很多此 次不打算讲。主要讲纵向分区。 纵向分区非常简单就是把表里的不常用的字段移到另一个表,这样可减少检 索数据读取的数据块,达到优化目的。
目 录
1 2 3 4 5
表简介
聚簇因子) 集群因子 (聚簇因子)
表分区(主要是纵向分区) 表分区(主要是纵向分区)
表重构 索引重构
1
堆表 • 堆表
以一种随机的方式管理。数据会放在最合适的地方,而不是以某种特定 顺序来放置.存储快,读取慢。 一般需要增加索引来提高数据检索效率.
2
索引组织表
把索引和一般数据列全部存储在相同位置上的表结构.存储慢,通过主键读取快.
•
OVERFLOW子句(行溢出) 因为所有数据都放入索引,所以当表的数据量很大时,会降低索引组织表的查 询性能。此时设置溢出段将主键和溢出数据分开来存储以提高效率。溢出段 的设置有两种格式: PCTTHRESHOLD n :制定一个数据块的百分比,当行数据占用大小超出时 ,该行的其他列数据放入溢出段 INCLUDING column_name :指定列之前的列都放入索引块,之后的列都放 到溢出段 ● 当行中某字段的数据量无法确定时使用PCTTHRESHOLD。 ● 若所有行均超出PCTTHRESHOLD规定大小,则考虑使用INCLUDING。
8
聚簇表
ORD_NO ----101 102 102 102 101 101
PROD -----A4102 A2091 G7830 N9587 A5675 W0824
QTY -----20 11 20 26 19 10
...
Fra Baidu bibliotek
Cluster Key (ORD_NO) 101 ORD_DT CUST_CD 05-JAN-97 R01 PROD QTY A4102 20 A5675 19 W0824 10 102 ORD_DT CUST_CD 07-JAN-97 N45 PROD QTY A2091 11 G7830 20 N9587 26
3
•
索引组织表的适用情况: 1、 代码查找表。 2、 经常通过主码访问的表。 3、 构建自己的索引结构。 4、 加强数据的共同定位,要数据按特定顺序物理存储。 5、 经常用between…and…对主码或唯一码进行查询。数据物理上分类查 询。如一张订单表,按日期装载数据,想查单个客户不同时期的订货和统计 情况。
6
使用索引聚簇指南 • 考虑对经常在连接语句中访问的表建立聚簇 • 如果表只是偶尔被连接或者它们的公共列经常被修改,则不要聚簇表。(修 改记录的聚簇键值比在非聚簇的表中修改此值要花费更多的时间,因为 Oracle必须将修改的记录移植到其他的块中以维护聚簇)。 • 如果经常需要在一个表上进行完全搜索,则不要聚簇这个表(对一个聚簇表 进行完全搜索比在非聚簇表上进行完全搜索的时间长,Oracle可能要读更多 的块,因为表是被一起存储的。) • 如果经常从一个父表和相应的子表中查询记录,则考虑给1对多(1:*)关系 创建聚簇表。(子表记录存储在与父表记录相同的数据块中,因此当检索它 们时可以同时在内存中,因此需要Oracle完成较少的I/O)。 • 如果经常查询同一个父表中的多个子记录,则考虑单独将子表聚簇。(这样 提高了从相同的父表查询子表记录的性能,而且也没有降低对父表进行完全 搜索的性能)。 • 如果从所有有相同聚簇键值的表查询的数据超过一个或两个Oracle块,则不 要聚簇表。(要访问在一个聚簇表中的记录,Oracle读取所有包含那个记录 值的全部数据块,如果记录占据了多个数据块,则访问一个记录需要读的次 数比一个非聚簇的表中访问相同的记录读的次数要多)。 7
15
从理论上来看, 从理论上来看,根本就不存在一种能够满足 所有读取要求的数据存储方式
16
ORD_NO -----101 102
ORD_DT CUST_CD ----------05-JAN-97 R01 07-JAN-97 N45
Unclustered orders and order_item tables
Clustered orders and order_item tables
表对比
使用哈希聚簇指南 • 当经常使用有相同列的包含相等条件的查询子句访问表时,考虑使用哈希聚 簇来存储表。使用这些列作为聚簇键。 • 如果可以确定存放具有给定聚簇键值的所有记录所需的空间(包括现在的和 将来的),则将此表以哈希聚簇存储。 • 如果空间不够,并且不能为将要插入的新记录分配额外的空间,那么不要使 用哈希聚簇。 • 如果偶尔创建一个新的、很大的哈希聚簇来保存这样的表是不切实际的,那 么不要用哈希聚簇存储经常增长的表。 • 如果经常需要进行全表搜索,并且必须要为表的预期增长中的哈希聚簇分配 足够的空间,则不要将此表以哈希聚簇存储。(这样的完全检索必须要读分 配给哈希聚簇的全部块,即使有些块可能只包含很少的记录。单独地存储表 将减少由完全的表检索读取的块的数量。) • 如果你的应用程序经常修改聚簇键的值,则不要将表以哈希聚簇方式存储。 • 不管这个表是否经常与其他表连接,只要进行哈希对于基于以前的指南的表 是合适的,那么在哈希聚簇中存储一个表可能是有用的。
10
集群因子 (聚簇因子)
• 集群因子: 集群因子:指按照索引列值进行了索引排序和对应表中数据行序的相似程度 。 0001 0001 0001 0001 0001 0002 0002 0003 0004 0005
索引1
0001 0001 0001 0002
AAA DDD CCC BBB
100 200 100 300