第6章数据物理组织与索引 重点
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
152015/12/28
第六章 1 定长记录
就是每条记录都是占用一定长度的字节数。记
录的排列也就是一张表格每行有相同的长度,以
一行为单元进行增加删除等修改操作。
Sn1 Sn2 Sn3 Sn4 000001 000002 000003 000004 甲 乙 丙 丁 162015/12/28
第六章
Snum 0903330001 Cnum C002 Score 53
丢失。
硬磁盘的特性:
6
2015/12/28
第六章
①硬磁盘的物理特性
硬磁盘的总容量为:
盘面数目×每盘面的磁道数×每磁道的盘块数×每盘块的字节数
磁盘是一种直接存储设备,可随机读写任一盘块。 盘块地址的形式是:
柱面号 磁头号 盘块号
图6.1
磁盘块地址形式示意图 7
2015/12/28
第六章
②磁盘的性能指标
为分布式软件的主要存储介质,可存储音频、 图像一类的数据 。
目前流行的光存储器是光盘只读存储器
(CD-ROM) 和 数 字 视 频 光 盘 只 读 存 储 器 (DVD-ROM)。 122015/12/28
第六章
6 快擦写存储器(Flash Memory)
快擦写存储器又称为“电可擦可编程只读存储
392015/12/28
第六章
图6.11
聚集文件例子
402015/12/28
第六章
4. HASH 文件
哈稀 (HASH) 文件又称为散列文件,是一种
支持快速存取的文件存储方法。
查 找 键 集 K
桶 地 址 集 B
主 文 件 记 412015/12/28 录
第六章
6.3 索引技术
K1
K2
K3 A(RK3)
度倍数,则必然在读这样的记录时要访问两个块。
192015/12/28
第六章 删除方法
1) 删除记录后,把记录依次上移。
缺点移动次数过多。
2) 把最后的记录补到删除的位置。
只需移动一次。
以上两个方法都需要移动结点,操作不灵
活,处于灵活的考虑必然会想到指针,就是第
三种方法。
202015/12/28
第六章 3) 把删除的结点用指针链接起来
主存储器简称为主存,或内存 。主存中的数
据在掉电或系统崩溃时,会全部丢失。 5
2015/12/28
第六章 3. 磁盘存储器(Magnetic-Disk Storage)
磁盘是目前最常用的外部存储器,由磁性材料
制成,数据存储在磁盘表面。
磁盘是一种大容量的可直接存取的外部存储
设备。在掉电或系统崩溃后,仍能保持数据不
第六章
图6.8
固定块和溢出块结构
322015/12/28
第六章
6.2.2
文 件 结 构
文件中记录的组织方式有无序文件、有序文
件、聚集文件和HASH 文件四种。
1.无序文件
无序文件也称为堆文件.无序文件的操作比
较简单,但查找效率比较低.
无序文件的删除操作比较复杂,常用的方法
主要有以下三种: 332015/12/28
它是利用一台磁盘阵列控制器来统一管理和
控制一组 ( 几台到几十台 ) 磁盘驱动器,组
成一个高度可靠的、快速的大容量磁盘系统。
实现途径有两个:
数据重复存储 和通过并行提高数据传输速度
RAID 按照其基本特性,可分为八级 。
102015/12/28
第六章
4 磁带
磁带是一种顺序存储设备 ,即磁带只能顺序访问,
342015/12/28
第六章
2. 有序文件
有序文件是指记录按某个(或某些)域的值的
大小顺序组织,一般最为常用的是按关键字的 升序或降序排列,即每个记录增加一个指针字 段,根据主键的大小用指针把记录链接起来。
文件中每个记录增加一个指针字段,根据查找
键的大小用指针把记录连接起来。 352015/12/28
织有两种方式,一种是把文件看成无结构的 流式文件,另一种是把文件看成有结构的纪 录式文件。记录式文件分为定长记录和变长 记录。 142015/12/28
第六章
6.2.1 文件组织方式
一个文件有逻辑地组织成为记录的一
个序列,这些记录映射在磁盘上,通 常把文件是为记录的集合。 本节讨论逻辑文件中的记录在物理文 件中如何实现。 文件记录分为两种:定长记录格式和 变长记录格式。
Snum 0903330001 0903330002 0903330004 0903330005 Cnum C002 C004 C001 C001 Score 53 75 85 92 Cnum C004 ︿ ︿ C003 Score 89 ︿ ︿ 76 Cnum C005 ︿ ︿ ︿ Score 65 ︿ ︿ ︿
3
2015/12/28
第六章
6.1数据库存储设备
计算机中存储介质主要包括两类 , 一级
存储器和二级存储器(外存)。
根据访问数据的速度 、 成本和可靠性 , 存储介质可分成以下六类: 4
2015/12/28
第六章 1.高速缓冲存储器(Cache)
简称为“高速缓存”,也就是一般说的Cache。
Cache访问速度快,但贵,容量小。 2. 主存储器(Main Memory)
第六章
字节串表示形式缺点:
①
②
每条记录长度不一,被删除后的位置难于使用。
记录要增长很难 。
“分槽式页结构”:每块的开始设置一个“块
首部”,包含以下信息:块中的记录数目,指向
块中自由空间尾部的指针,登记每个记录近的开
始位置和大小的信息。
第六章
图6.5 分槽式页结构
272015/12/28
第六章
第六章
图6.9
顺序文件 362015/12/28
第六章
有序文件操作 删除:只需修改指针即可。同定长记录的方法三 插入: 1)定位:找到要插的位置。按查找键的顺序 2)插入:在找到记录的块内,如果自由空间有 空闲纪录,那么插入;若没有就插入到溢出块中。
在初始的时候,可以保持无力顺序和查找键的顺序
图6.6
变长记录的预留空间表示形式 292015/12/28
第六章
2)指针技术
解决记录长度差很大的方法,省去过多的
空间浪费。
每个定长记录后面增加指针指向在上一方 法中可以合并为同一记录的其他记录。
被指向的整体成为溢出块。
302015/12/28
第六章
图6.7 变长记录的指针表示方式 312015/12/28
不跨块方式: 一个数据块只包含若干完整记录,
不足以容纳一个记录的零头空间放弃不用。
跨块方式: 允许一个记录跨在不同数据块。这种
组块方式虽然可节省空间,但实现比较困难,用得 较少。 9
2015/12/28
第六章
④廉价磁盘冗余阵列
(Redundant Array of Inexpensive(或Indscendent) Disks,简称RAID)
器”,快闪存在掉电后仍能保持数据不丢失。
快闪存的缺陷是只能支持有限次擦写。而且不
能直接重写,必须先擦去整组存储器的内存,然
后再写数据进去。 132015/12/28
第六章
6.2
文
件
外存中,数据库以文件形式组织,而文
件又是由记录组成。文件结构由操作系统的
文件系统提供和管理。从文件的组织形式看,
分为逻辑结构和物理结构两种。逻辑文件组
(2) 变长记录的定长表示形式
1)预留空间技术
取所有记录中最长的一个记录的长度作
为存储空间的记录长度,来存储变长记录。
对于预留空间,仍如同定长格式的表格状。
缺点:如果每个记录的差别很大,就会造
成大量空间的浪费。 282015/12/28
第六章 例如图 6.4 的字节串表示形式可以用图 6.6 的 预留空间技术实现。该方法一般在大多数记录的长 度接近最大长度时才使用,否则使用时空间浪费很 大。
第六章 ( 1)首先找到被删记录所在的磁盘块,然后读
到主存缓冲区,在缓冲区中删除记录,最后把 缓冲区内容写回到磁盘文件. (2)在每个记录的存储空间增加一个标志位, 标识记录删除与否,一般该标志常为空。删除 一个记录时,将此记录的标志位置“1”, 以后查
找记录时跳过有该标志的记录。
(3)常用于定长记录文件,删除一个记录时, 总是把文件末尾记录移到被删记录位置。
磁盘的性能用磁盘的容量、存取时间、数 据传输速度和可靠性四个参数衡量。
③ 内外存间的数据交换
访问的数据不在主存时 , 需通过外存加 载,所以内外存间要频繁地进行数据交换, 每交换一次数据,就称为一次 I/O 操作。 8 2015/12/28
第六章 数据块的长度不一定恰好等于记录的整数倍,通 常有两种 组块方式 :
182015/12/28
第六章
如上图每条记录包含姓名、学号、班级三条信息。 在每条记录中对应的信息占相同的字节数,所以每 条记录的长度一定,构成了一个含有四条记录的定 长记录的文件。
存在的两个问题: 个位置;
① 删除:删除后是在其位置补充一个记录还是忽略这
② 长度:若物理上每个块的大小不等于每个记录的长
首先,文件增设“文件首部”,其中有一个指针指向
第一个被删除的记录位置,所有被删除记录的位置都用指 针链接起来,构成“空闲记录链表”。
缺点:这些被指针链接的记录被称为“被拴记录”,
若被删记录被删掉,则指向记录的指针称为“悬挂指针”, 所指空间称为“垃圾”,也就是别人无法使用而又被空闲 着。
212015/12/28
一致,以提高速度,若多次操作后变化很大,有必 要重新组织一次。 372015/12/28
第六章
3. 聚集文件
文件允许一个文件有多个关系的记录组成,
即记录类型文件。 例:可以把有关一个人的全部记录信息放在相
邻的位置,按人查找信息时就会很方便。
382015/12/28
第六章
图6.10 插入一个记录后的顺序文件
第六章
wk.baidu.com
插入方法
可以根据删除的方法而定,直接插入尾部,或插
到空位置。
222015/12/28
第六章
2
变长记录
实际应用中定长记录格式文件较多 , 但为了增强文
件的灵活性 , 在数据库系统中,有时需要文件中的
记录是变长格式。
变长记录的表示有字节串形式和定长形式两种。
232015/12/28
第六章
(1)变长记录的字节串表示形式
①尾标志法 把每个记录看成连续的字节串,然后在每 个记录的尾部附加 “ 记录尾标志符 ” (∧), 表明记录结束。图 6.2 的定长记录文 件可以用图 6.4 的格式表示。
② 记录长度法
记录的开始加一个记录长度的字段来实现,
读取数据时以此作为记录结束与否的标志。
不能随机访问。
主要用于数据备份或数据归档。
磁带的可靠性较好,主要有两大用途:
作为磁盘的后援存储器,存储数据库文件 用来存储磁盘上存储不了的大型数据库文
的副本 件 , 数据库中不常用的数据库文件或历史数据可 以存储在磁带上。
11 2015/12/28
第六章
5 光存储器
光存储器是多媒体信息的主要存储设备,作
242015/12/28
第六章
Snum 0903330001 0903330002 0903330004
Cnum C002 C004 C001
Score 53 75 85
Cnum C004 ︿ ︿
Score 89
Cnum C005
Score 65 ︿
0903330005
C001
92
C003
76
︿
图6.4 变长记录的字节串表示形式 252015/12/28
0903330001
0903330001 0903330002 0903330004 0903330005 0903330005
C004
C005 4 C004 C001 C001 C003
89
65 75 85 92 76
图6.2
定长记录的文件 172015/12/28
第六章
图6.3
删除记录2,5,7后的文件结构
442015/12/28
第六章
2.稀疏索引
… …
Kn A(RKn)
A(RK1) A(RK2)
图6.16.索引结构
422015/12/28
第六章
图6.13
学生关系索引方式
432015/12/28
第六章
索引的组织方式主要有线性索引和树形索引两类 。
6.3.1
线性索引
线性索引可分为稠密索引和稀疏索引两种。
1.稠密索引
对主文件中每一个查找键值都建立一个索引记号 优点 :查找、更新数据记录方便, 存取速度快 缺点 :索引项多, 索引表大, 空间代价大 .
数据库系统原理
SHUJUKU XITONG YUANLI
中国计量学院信息学院
China Jiliang University 2011
SHUJUKU XITONG YUANLI
第六章
数据物理组织与索引
2
2015/12/28
第六章
主要内容
6.1 数据库存储设备
6.2 文件
6.3 索引技术