第10讲 文件

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 检索:只能进行按关键字的查找, 不能进行顺序查找。检索时,先在 基桶内进行查找,若不存在,则再 到溢出桶中进行查找;
• 插入:当查找不成功时,将记录插 入在相应的基桶或溢出桶内;
• 删除:对被删记录作特殊标记。
南京中医药大学信息技术学院,主讲教师:李新霞
4. 优点:记录随机存放,不需要进行排
序;插入、删除方便,存取速 度快;节省存储空间,不需要 索引区。
缺点:不能进行顺序存取;在经过多 次插入和删除操作之后,需进 行“重组文件”的操作。
南京中医药大学信息技术学院,主讲教师:李新霞
3.顺序集本身是一个单链表,它 包含文件的全部索引项,同时,顺 序集中的每个结点即为B+树的叶子 结点,索引集中的结点即为B+树的 非叶结点。
南京中医药大学信息技术学院,主讲教师:李新霞
文件的操作
• 检索:可进行顺序存取和按关键字存取;
• 插入:按关键字大小插入在某个适当的 控制区间中,当控制区间中的记录数超 过文件规定的大小时,要“分裂”控制 区间,必要时,还需要“分裂”控制区 域;
第 i 个 记 录 , 必 须 先 读 出 前 i-1 个 记录;
南京中医药大学信息技术学院,主讲教师:李新霞
• 3.插入新的记录只能加在文 件的末尾;
• 4.删除记录时,只作标记; • 5.更新记录必须生成新的文
件。
南京中医药大学信息技术学院,主讲教师:李新霞
索引文件
南京中医药大学信息技术学院,主讲教师:李新霞
二、文件可按其中记录的类型不同而 分成两类:
其一为操作系统的文件,文件中的记 录仅是一个字符组。由于操作系 统中的文件仅是一维的连续字符 序列,为了用户存取和加工的方 便,将文件中的信息划分为若干 组,其中每一组信息称作一个记 录;
南京中医药大学信息技术学院,主讲教师:李新霞
其二为数据库文件,文件中的记录带 有结构,是数据项的集合。记录 是文件中可以存取的数据基本单 位,数据项是文件中可以使用的 数据最小单位。
例如:有一组关键字如下所列
{589,063,269,505,764,182,166,330}
假设哈希函数为 key MOD 7,每个桶可以容纳
3个记录(称桶的容量为3),则哈希文件如下:
基桶
溢出桶
063 182
589 505 764
330
269
166
南京中医药大学信息技术学院,主讲教师:李新霞
3.文件的操作
南京中医药大学信息技术学院,主讲教师:李新霞
顺序文件
南京中医药大学信息技术学院,主讲教师:李新霞
结 构 特 点:
记录在文件中的排列顺序是由记 录进入存储介质的次序决定的, 即文 件物理结构中记录的排列顺序和文件 的逻辑结构中记录的排列顺序一致。
南京中医药大学信息技术学院,主讲教师:李新霞
操作特点: • 1.便于进行顺序存取; • 2.不便于进行直接存取,为取
• 删除:必须“真实地”删除记录,因此 要在控制区间内“移动”记录。
南京中医药大ቤተ መጻሕፍቲ ባይዱ信息技术学院,主讲教师:李新霞
直接存取文件
南京中医药大学信息技术学院,主讲教师:李新霞
1.和前几节讨论的文件组织方法 不同,直接存取文件的特点是,由 记录的关键字“直接”得到记录在外 存上的映象地址。
类似于哈希表的构造方法,根 据文件中关键字的特点设计一种“哈 希函数”和“处理冲突的方法”将记录
南京中医药大学信息技术学院,主讲教师:李新霞
三、记录中能识别不同记录的数据项 被称为关键字,若该数据项能唯 一识别一个记录,则称为主关键 字,若能识别多个记录则称为次 关键字。
南京中医药大学信息技术学院,主讲教师:李新霞
四、文件的逻辑结构指的是呈现在用 户面前的文件中记录之间的逻辑 关系;文件的物理结构指的是文 件中的逻辑记录在存储器中的组 织方式。
文件是利用操作系统中提供的虚拟 存储器的功能组织的文件,免除了 用户为读/写记录时直接对外存进行 的操作,对用户而言,文件只有控 制区间和控制区域等逻辑存储单位。
南京中医药大学信息技术学院,主讲教师:李新霞
1.文件的结构
… ...
索引集 B+树
顺序集
...
...
... 数据集
控制区域
控制区间
南京中医药大学信息技术学院,主讲教师:李新霞
2. 控制区间是用户进行一次存取的 逻辑单位,可看成是一个逻辑磁道。 但它的实际大小和物理磁道无关。
控制区域由若干控制区间和它们
的索引项组成,可看成是一个逻辑柱面。
VSAM文件初建时,每个控制区 间内的记录数不足额定数,并且有的 控制区间内的记录数为零。
南京中医药大学信息技术学院,主讲教师:李新霞
第10章 文件
南京中医药大学信息技术学院,主讲教师:李新霞
有关文件的基本概念
南京中医药大学信息技术学院,主讲教师:李新霞
一、文件即为记录的集合,和“查找 表”的差别在于,“文件”指的是存 储在外存储器中的记录的集合。 记录是文件中可以存取的数据的 基本单位。
南京中医药大学信息技术学院,主讲教师:李新霞
• 1.索引文件由“主文件”和“索引”组成; • 2.索引中的每个记录由“关键字”和“指针”
组成; • 3.通常,索引文件中的主文件是无序文件,
索引是 (按关键字有序)的有序文件; • 4.“索引”是在输入数据建立文件时自动生
成。
南京中医药大学信息技术学院,主讲教师:李新霞
二、VSAM文件
VSAM(Vistual Storage Access Method)
散列到外存储设备上,又称“散列文件”。
南京中医药大学信息技术学院,主讲教师:李新霞
2.哈希文件的结构
由于记录在外存上是成组存放的, 因此允许多个记录映象到同一个地址 上。在此,称外存储器中存放多个记 录的“数据块”为“桶”。 因此由哈希 数得到的映象地址为“桶地址”。
南京中医药大学信息技术学院,主讲教师:李新霞
相关文档
最新文档