数据结构(c语言版)课件 第九章 文件 (严蔚敏、吴伟民编 清华大学出版社)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对散列文件的的随机存取效率很高,对于关键 字值等于给定值的记录的访问,可以直接由散列函数 及冲突处理方法求得在外存上的存储位置,从而方便 地对它存取。但散列文件不适宜顺序存取和成批处理。
数据文件是带有结构的、性质相同的记录的集合。 每个记录由若干个数据项组成,数据项是最基本的不可分割 的数据单位,也是文件中可以操作的最小数据单位。本章介 绍的就是数据文件的组织结构及其处理方式。



关键字 能够标识文件中记录的数据项称为关 键字,能够唯一标识记录的关键字称为主关键字,否 则为次关键字。
第9章 文件

本章中介绍下列主要内容: 文件的基本概念 常用的文件操作 文件的组织结构以及文件的不同组
织方式的特点
文件的基本概念 9.2 文件的操作 9.3 文件的组织
9.1
9.1 文件的基本概念

文件 文件是存储在外部介质上的由大量性质相同的 记录组成的集合。按其记录的类型不同可以分为两类:程序 文件和数据文件。 程序文件是一维的、连续的、无结构的字符序列, 可以看成是由一条无结构的记录组成的文件。

Baidu Nhomakorabea
记录的逻辑结构 是指文件的记录在用户或应用 程序员面前逞现的方式,是对数据间的客观联系的一 种表示,是用户对数据的存取方式。 记录的物理结构 是指文件中的记录在物理存储 介质上的存储方式,是数据的物理表示和组织。根据 不同的需要、设备本身的特性及操作系统中的文件系 统,记录的物理结构可以有不同的表示和组织方法。
物理记录 是计算机用一条I/O命令进行读写的 基本数据单位,对于确定的设备和操作系统,它的大 小基本上是固定不变的。



物理记录与逻辑记录的关系 物理记录与逻辑
记录之间有三种可能的关系,分别为一个物理记录中 存放一个逻辑记录、一个物理记录中存放多个逻辑记 录、多个逻辑记录存储于一个物理记录中。 文件的存取 文件存储在外部介质上,所以对

文件的存取要通过访问外存储介质来实现。外存储介
质的共同特点是存储容量大,存取速度慢。以目前使 用最为广泛的磁盘存储器为例,读写磁盘上的信息,
首先要经过选定柱面、选定磁道、选定扇区(即物理
记录)三步机械定位动作,然后才能通过磁头读写盘 片上的信息。

此外,主机对外存储介质上的数据不能直接进行存
取,要读取外存储介质上的数据,首先要通过通道把 数据读到内存的一个指定区域(缓冲区)中,然后从 缓冲区中读取有关的数据。写操作的过程则相反,先 将内容写到缓冲区中,然后通过通道将缓冲区中的数 据写到外存储介质上。外存储介质上的数据存取时间 往往比主机对数据进行处理的时间花费大,所以对外 存储介质上的数据处理常常以访问外存储介质次数的 多少作为衡量其数据结构及其算法质量的标准。节省 存取时间的有效方法是:在每次访问外存储介质时, 传送批量的数据,从而减少访问外存储介质的次数。

由于顺序文件中记录的物理次序与逻辑次序是 一致的,所以适宜于顺序存取(即存取一个记录之后 接着存取其后继记录)和批量处理。但是对顺序文件 中记录的随机存取效率很低。

2.散列文件 散列文件类似于哈希表,即根据文件中的关键
字特点设计一种哈希函数(也叫作散列函数)和处理
冲突的方法来确定记录的存储位置,将记录散列在存 储介质上,这样的文件被称作散列文件。散列文件是 一种随机组织方式。

2.文件的修改
文件的修改操作包括插入一条记录、删除一条
记录和更新一条记录三种操作。
9.3 文件的组织

文件在存储介质(如磁盘或磁带)上的组织方 式称为物理结构。常用的文件组织方式有三种基本形 式:顺序组织、随机组织和链组织。

1.顺序文件 顺序文件的记录是按其在文件中的逻辑顺序 依次存入存储介质的。它是一种顺序组织方式。
9.2 文件的操作

在这里讲述的文件操作主要是指对文件中数据的操 作。其基本操作有:文件的读操作和写操作,这两种操作与 具体的设备及操作系统有关,在此我们假定有专门的程序完 成其功能。除此之外,还可以对文件进行检索和修改。

1.文件的检索 文件的检索有下列三种方式: 顺序存取:存取下一个每个记录。 随机存取:存取第i个逻辑记录。 按关键字存取:查询一个或一批关键字与给定 值相关的记录。
相关文档
最新文档