数据库存储结构 LN
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第6章 数据库存储结构
主要内容
6.1 数据库存储设备 6.2 文件组织 6.3 文件结构 6.4 索引技术
2020/6/13
2
6.1数据库存储设备
计算机中有两级存储,分别是主存和辅存 根据访问数据的速度、成本和可靠性,存储介质 可分成以下六类:
2020/6/13
3
1.高速缓冲存储器(Cache) 简称为“高速缓存”,也就是一般说的
磁盘是一种大容量的可直接存取的外部存储设备。 在掉电或系统崩溃后,仍能保持数据不丢失。
硬磁盘的特性:
2020/6/13
5
①硬磁盘的物理特性
硬磁盘的总容量为:
盘面数目×每盘面的磁道数×每磁道的盘块数×每盘块的字节数
磁盘是一种直接存储设备,可随机读写任一盘 块。盘块地址的形式是:
柱面号 磁头号 盘块号
图6.2 定长记录的文件
2020/6/13
15
图6.3 删除记录2,5,7后的文件结构
2020/6/13
16
如上图每条记录包含姓名、学号、班级三条信息。 在每条记录中对应的信息占相同的字节数,所以
每条记录的长度一定,构成了一个含有四条记录
的定长记录的文件。
存在的两个问题:
1. 删除:删除后是在其位置补充一个记录还是忽略 这个位置;
2020/6/13
Sn1 Sn2 Sn3 Sn4
000001 000002 000003 000004
甲 乙 丙 丁
14
Snum S003 S001 S005 wenku.baidu.com004 S006 S003 S002 S004 S003
Cnum 1 2 4 1 3 2 2 2 3
Scor e60 83 80 85 75 80 85 60 40
它是利用一台磁盘阵列控制器来统一管理和控 制一组 ( 几台到几十台 ) 磁盘驱动器,组成一 个高度可靠的、快速的大容量磁盘系统。
实现途径有两个: 数据重复存储 和通过并行提高数据传输速度
RAID 按照其基本特性,可分为八级 。
2020/6/13
9
4 磁带
磁带是一种顺序存储设备 ,即磁带只能顺序访问, 不能随机访问。
2020/6/1是3 别人无法使用而又被空闲着。
19
6.2.1.2. 插入方法 可以根据删除的方法而定,直接插入尾部,或插
到空位置。 6.2.2 变长记录 实际应用中定长记录格式文件较多,但为了增强文
件的灵活性,在数据库系统中,有时需要文件中的 记录是变长格式。 变长记录的表示有字节串形式和定长形式两种。
Cache。Cache访问速度快,但贵,容量小。 2. 主存储器(Main Memory) 主存储器简称为主存,或内存 。主存中的数据
在掉电或系统崩溃时,会全部丢失。
2020/6/13
4
3. 磁盘存储器(Magnetic-Disk Storage)
磁盘是目前最常用的外部存储器,由磁性材料制成, 数据存储在磁盘表面。
2020/6/13
21
Snum Cnum Scor Cnum Scor Cnum Scor
图6.1 磁盘块地址形式示意图
2020/6/13
6
②磁盘的性能指标
磁盘的性能用磁盘的容量、存取时间、数据传 输速度和可靠性四个参数衡量。
③ 内外存间的数据交换
访问的数据不在主存时, 需通过外存加载,所
以内外存间要频繁地进行数据交换,每交换一次
数据,就称为一次 I/O 操作。
2020/6/13
7
数据块的长度不一定恰好等于记录的整数倍, 通常有两种 组块方式 :
2020/6/13
20
6.2.2.1 变长记录的字节串表示形式 ①尾标志法
把每个记录看成连续的字节串,然后在每 个记录的尾部附加 “ 记录尾标志符 ” (∧), 表明记录结束。图 6.2 的定长记录文件可以用 图 6.4 的格式表示。
② 记录长度法
记录的开始加一个记录长度的字段来实现, 读取数据时以此作为记录结束与否的标志。
不跨块方式: 一个数据块只包含若干完整记录, 不足以容纳一个记录的零头空间放弃不用。
跨块方式: 允许一个记录跨在不同数据块。这种 组块方式虽然可节省空间,但实现比较困难,用得 较少。
2020/6/13
8
④廉价磁盘冗余阵列
(Redundant Array of Inexpensive(或 Indscendent) Disks,简称RAID)
2020/6/13
12
6.2 文件组织
外存中,数据库以文件形式组织,而文件 又是由记录组成。记录在物理文件中的实 现就是本节讨论的内容。
文件组织的两种方式:定长格式和变长格 式。
2020/6/13
13
6.2.1 定长记录 就是每条记录都是占用一定长度的字节数。
记录的排列也就是一张表格每行有相同的长度, 以一行为单元进行增加删除等修改操作。
就是第三种方法。
2020/6/13
18
3. 把删除的结点用指针链接起来
首先,文件增设“文件首部”,其中有一个指针 指向第一个被删除的记录位置,所有被删除记录 的位置都用指针链接起来,构成“空闲记录链 表”。
缺点:这些被指针链接的记录被称为“被拴记
录”,若被删记录被删掉,则指向记录的指针称
为“悬挂指针”,所指空间称为“垃圾”,也就
2. 长度:若物理上每个块的大小不等于每个记录的 长度倍数,则必然在读这样的记录时要访问两个
块。
2020/6/13
17
6.2.1.1 删除方法
1. 删除记录后,把记录依次上移。
缺点移动次数过多。
2. 把最后的记录补到删除的位置。
只需移动一次。
以上两个方法都需要移动结点,操作
不灵活,处于灵活的考虑必然会想到指针,
主要用于数据备份或数据归档。
磁带的可靠性较好,主要有两大用途:
作为磁盘的后援存储器,存储数据库文件的 副本
用来存储磁盘上存储不了的大型数据库文件, 数据库中不常用的数据库文件或历史数据可以存储
在磁带上。
2020/6/13
10
5 光存储器
光存储器是多媒体信息的主要存储设备,作为分 布式软件的主要存储介质,可存储音频、图像一 类的数据 。
目前流行的光存储器是光盘只读存储器 (CDROM) 。
2020/6/13
11
6 快擦写存储器(Flash Memory)
快擦写存储器又称为“电可擦可编程只读存储器”, 快闪存在掉电后仍能保持数据不丢失。
快闪存的缺陷是只能支持有限次擦写。而且不能直 接重写,必须先擦去整组存储器的内存,然后再写 数据进去。
主要内容
6.1 数据库存储设备 6.2 文件组织 6.3 文件结构 6.4 索引技术
2020/6/13
2
6.1数据库存储设备
计算机中有两级存储,分别是主存和辅存 根据访问数据的速度、成本和可靠性,存储介质 可分成以下六类:
2020/6/13
3
1.高速缓冲存储器(Cache) 简称为“高速缓存”,也就是一般说的
磁盘是一种大容量的可直接存取的外部存储设备。 在掉电或系统崩溃后,仍能保持数据不丢失。
硬磁盘的特性:
2020/6/13
5
①硬磁盘的物理特性
硬磁盘的总容量为:
盘面数目×每盘面的磁道数×每磁道的盘块数×每盘块的字节数
磁盘是一种直接存储设备,可随机读写任一盘 块。盘块地址的形式是:
柱面号 磁头号 盘块号
图6.2 定长记录的文件
2020/6/13
15
图6.3 删除记录2,5,7后的文件结构
2020/6/13
16
如上图每条记录包含姓名、学号、班级三条信息。 在每条记录中对应的信息占相同的字节数,所以
每条记录的长度一定,构成了一个含有四条记录
的定长记录的文件。
存在的两个问题:
1. 删除:删除后是在其位置补充一个记录还是忽略 这个位置;
2020/6/13
Sn1 Sn2 Sn3 Sn4
000001 000002 000003 000004
甲 乙 丙 丁
14
Snum S003 S001 S005 wenku.baidu.com004 S006 S003 S002 S004 S003
Cnum 1 2 4 1 3 2 2 2 3
Scor e60 83 80 85 75 80 85 60 40
它是利用一台磁盘阵列控制器来统一管理和控 制一组 ( 几台到几十台 ) 磁盘驱动器,组成一 个高度可靠的、快速的大容量磁盘系统。
实现途径有两个: 数据重复存储 和通过并行提高数据传输速度
RAID 按照其基本特性,可分为八级 。
2020/6/13
9
4 磁带
磁带是一种顺序存储设备 ,即磁带只能顺序访问, 不能随机访问。
2020/6/1是3 别人无法使用而又被空闲着。
19
6.2.1.2. 插入方法 可以根据删除的方法而定,直接插入尾部,或插
到空位置。 6.2.2 变长记录 实际应用中定长记录格式文件较多,但为了增强文
件的灵活性,在数据库系统中,有时需要文件中的 记录是变长格式。 变长记录的表示有字节串形式和定长形式两种。
Cache。Cache访问速度快,但贵,容量小。 2. 主存储器(Main Memory) 主存储器简称为主存,或内存 。主存中的数据
在掉电或系统崩溃时,会全部丢失。
2020/6/13
4
3. 磁盘存储器(Magnetic-Disk Storage)
磁盘是目前最常用的外部存储器,由磁性材料制成, 数据存储在磁盘表面。
2020/6/13
21
Snum Cnum Scor Cnum Scor Cnum Scor
图6.1 磁盘块地址形式示意图
2020/6/13
6
②磁盘的性能指标
磁盘的性能用磁盘的容量、存取时间、数据传 输速度和可靠性四个参数衡量。
③ 内外存间的数据交换
访问的数据不在主存时, 需通过外存加载,所
以内外存间要频繁地进行数据交换,每交换一次
数据,就称为一次 I/O 操作。
2020/6/13
7
数据块的长度不一定恰好等于记录的整数倍, 通常有两种 组块方式 :
2020/6/13
20
6.2.2.1 变长记录的字节串表示形式 ①尾标志法
把每个记录看成连续的字节串,然后在每 个记录的尾部附加 “ 记录尾标志符 ” (∧), 表明记录结束。图 6.2 的定长记录文件可以用 图 6.4 的格式表示。
② 记录长度法
记录的开始加一个记录长度的字段来实现, 读取数据时以此作为记录结束与否的标志。
不跨块方式: 一个数据块只包含若干完整记录, 不足以容纳一个记录的零头空间放弃不用。
跨块方式: 允许一个记录跨在不同数据块。这种 组块方式虽然可节省空间,但实现比较困难,用得 较少。
2020/6/13
8
④廉价磁盘冗余阵列
(Redundant Array of Inexpensive(或 Indscendent) Disks,简称RAID)
2020/6/13
12
6.2 文件组织
外存中,数据库以文件形式组织,而文件 又是由记录组成。记录在物理文件中的实 现就是本节讨论的内容。
文件组织的两种方式:定长格式和变长格 式。
2020/6/13
13
6.2.1 定长记录 就是每条记录都是占用一定长度的字节数。
记录的排列也就是一张表格每行有相同的长度, 以一行为单元进行增加删除等修改操作。
就是第三种方法。
2020/6/13
18
3. 把删除的结点用指针链接起来
首先,文件增设“文件首部”,其中有一个指针 指向第一个被删除的记录位置,所有被删除记录 的位置都用指针链接起来,构成“空闲记录链 表”。
缺点:这些被指针链接的记录被称为“被拴记
录”,若被删记录被删掉,则指向记录的指针称
为“悬挂指针”,所指空间称为“垃圾”,也就
2. 长度:若物理上每个块的大小不等于每个记录的 长度倍数,则必然在读这样的记录时要访问两个
块。
2020/6/13
17
6.2.1.1 删除方法
1. 删除记录后,把记录依次上移。
缺点移动次数过多。
2. 把最后的记录补到删除的位置。
只需移动一次。
以上两个方法都需要移动结点,操作
不灵活,处于灵活的考虑必然会想到指针,
主要用于数据备份或数据归档。
磁带的可靠性较好,主要有两大用途:
作为磁盘的后援存储器,存储数据库文件的 副本
用来存储磁盘上存储不了的大型数据库文件, 数据库中不常用的数据库文件或历史数据可以存储
在磁带上。
2020/6/13
10
5 光存储器
光存储器是多媒体信息的主要存储设备,作为分 布式软件的主要存储介质,可存储音频、图像一 类的数据 。
目前流行的光存储器是光盘只读存储器 (CDROM) 。
2020/6/13
11
6 快擦写存储器(Flash Memory)
快擦写存储器又称为“电可擦可编程只读存储器”, 快闪存在掉电后仍能保持数据不丢失。
快闪存的缺陷是只能支持有限次擦写。而且不能直 接重写,必须先擦去整组存储器的内存,然后再写 数据进去。