第十二章文件-PPT精选

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十二章文件-PPT精选
主要内容
文件的基本概念 顺序文件 索引文件 索引顺序文件(ISAM文件和VSAM文件) 直接存取文件(散列文件) 多关键字文件
文件的基本概念
表 存储在内存中的大量记录的集合。 文件 存储在外存中的大量记录的集合。
不同的范畴中,文件代表不同的意义 操作系统中,文件是命名的无结构的字节序列,其记录的格 式依需要可以灵活划定。 文件管理系统或数据库系统中,文件是命名的性质相同的逻 辑记录的集合,每个记录由若干个数据项构成。文件被放置 在外存上。
从磁道索引项的溢出索引项中得到溢出链表的头指针查找 2.插入 1) 利用查找确定记录应插入的柱面和磁道 2)该磁道不满,则插入该磁道的适当位置上,结束 3)该磁道已满,视插入记录的关键字
插入磁道,调整溢出链表和磁道索引 直接插入溢出链表,调整磁道索引
ISAM文件上的操作
3.删除 1) 查找待删除的记录 2)在基本区时,在其存储位置上作删除标记
在溢出区时,可从链表中取消 周期性地集中整理ISAM文件,以保证空间利用率和存取效率。
ISAM小结
[ISAM小结] ISAM文件是一种多叉树形的索引顺序文件
叶结点存放数据记录,组成文件的数据区 非叶结点组成文件的索引区
文件在记录插入和删除时,索引结构不变,是静态索引结构 主索引和柱面索引在每次检索时都需查找,宜放在文件所占的几个柱面
[修改] 插入:将插入的记录置于数据区末尾,并在索引表中插入索引项 删除:删去相应的索引项 更新:若主关键字被修改,则需修改对应的索引表项
多级索引
当外存的一个页块不能容纳下索引表时,通常可以为索引
表再建立一个索引,称为查找表;在此基础上还可以建立第二查 找表、第三查找表、……
[例]
主文件
索引表
ISAM(索引顺序存取方法)文件 专为磁盘存取文件设计的文件组织方式 静态索引结构
ISAM文件的组织方式
多级主索引+柱面索引+磁道(盘面)索引+主文件
主索引 柱面索引
磁道索引
主文件
柱面磁C道 1 索引
T1
450
79 C1T1
50 T2’1 60 T9’2
R14 R21 R45 R50 T2
870
的居中的柱面上,使磁头平均移动距离最小。
VSAM(虚拟存储存取方法)文件
此存取方法利用虚拟内存系统访问存储设备 B+树(B树的变型)动态索引结构 大型索引顺序文件 [VSAM文件的组织方式]
root
59 97
15 44 59
72 97
sqt
10 15 20 37 44 51 59
5 11
7 12
更新操作,可能都要重组索引,因此多级索引适合于 静态索引 当文件记录变动较多时,可采用适合于动态索引的树 表结构,插入删除方便
平衡二叉树:内存可容纳整个索引表 B-树:索引表很大时
索引顺序文件
索引顺序文件是常用的一种文件组织形式 主文件按关键字有序,可以有较高的检索效率 采用稀疏索引,索引占用空间较少
130 C2T1
R79 T8
60 ^ 53 T9’1
T9溢出区
T10
柱面磁C道 2 索引
T1
R84 R88 R90 R91 T2
……
……
R130 T8 T9溢出区 T10
ISAM文件上的操作
1.查找 让主索引常驻内存 1)从主索引出发,确定相应的柱面索引 2)读入柱面索引,确定记录所在柱面的磁道索引地址 3)读入磁道索引,确定记录所在的磁道 4)在该磁道上查找
排序
原始文件
主文件 (有序)
有序的 事务文件
新主文件
索引文件
索引文件的组织方式 主文件 + 索引表(按主关键字有序) 索引项的结构: 关键字 物理块号
索引文件只能是磁盘文件 索引顺序文件:主文件中的记录按主关键字有序 索引非顺序文件:主文件中的记录按主关键字无序 稠密索引:主要用于索引非顺序文件
顺序文件
顺序文件的组织方式和特点
[组织方式] 记录在物理结构中的排列顺序与逻辑顺序一致。 连续文件:次序相继的两个物理记录的存储位置是相邻的 串联文件:物理记录之间次序由指针相链表示
[特点] 根据记录的序号或记录的相对位置进行存取。 顺序存取时效率较高。
顺序文件上的查找
[查找] 顺序存取存储器(磁带)上的顺序文件
10 15 控制区间(道) 控制区域(面)
63 72
索引集
B+

85 91 97 顺序集
数据集
VSAM文件上的操作:查找和插入
1.查找 方法1:随机查找。 方法2:顺序查找。 2.插入
文件的基本概念
数据项(字段/属性) 文件ຫໍສະໝຸດ Baidu使用的最小单位 主关键字项 其值能唯一标识一个记录的数据项或数据项的组合;该
值称为主关键字。 次关键字项 其值不能唯一标识一个记录的数据项,称为次关键字。
单关键字文件 文件的记录只有主关键字 多关键字文件 文件的记录除有主关键字,还含有若干个次关键字 定长记录文件 每个记录含有信息的长度相同(所有数据项定长) 不定长记录文件 文件中每个记录含有的信息长度不一定相同
查找表
物理记录号 学号 姓名 其它 关键字 物理记录号 最大 物理
101 07 王得
15 04
103
关键字 块号
101 12 谢旺
07
101
12
15
103 04 陈明
12
101
44
16
103 44 胡建
16 22
104
104 37 刘流
37
104
104 22 郑辰
44
103
多级索引特点
为减少访问外存次数,应尽量减少索引表深度 各级索引均为顺序表,结构简单;但修改不便,每次
主文件中的每个记录对应一个索引项 稀疏索引:用于索引顺序文件
主文件的每个页块对应一个索引项
索引文件上的操作
前提:索引非顺序文件,稠密索引 [查找] 1)将外存上存放索引表的索引区页块读入内存,可采用顺序或折半
查找来查找记录的物理记录号(块号) 2)再将外存上存放该记录的数据区页块读入内存进行查找
顺序查找 为提高效率,适合于批量检索。
直接存取存储器(磁盘)上的顺序文件 顺序查找 折半查找 适合于较小的有序定长记录文件的检索。查找很大的文件时 (多个柱面),磁头频繁移动,降低时效。
批量处理方式:增删改
由于文件的记录不易于像内存空间的数据那样“移动”,通常采用 批量处理方式。
修改请求
事务 在一段时间内 文件 使用的记录
相关文档
最新文档