计算机操作系统原理-文件管理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
定长记录
变长记录
文件的逻辑结构(续)
2)无结构的流式文件:由字符序列组成的文件,其内部不 再划分结构,字符是该文件的基本信息单位。
字符流
在UNIX系统中,所有的文件都被看作是流式文件:即使 是有结构的文件,也被视为流式文件,系统不对文件进行 格式处理,文件的含义由用户程序进行解释。
2、文件的物理结构
按用途分类 系统文件 库文件 用户文件
文件的保护类型 只读文件 读写文件 可执行文件 不保护文件
信息流向 输入文件 输出文件
输入/输出文件
文件分类(续)
文件的信息(Unix采用这种方式划分)
普通文件:包括用户的ASCII或二进制文件 特殊文件:包括目录文件和I/O设备文件
文件的后缀
exe, com, bin:可执行文件 c, cc, cpp, java, pas:程序源代码 bat, sh: 命令文件 txt, doc: 文本数据,文本文档 lib, dll: 库文件 zip, rar: 压缩文件 mpeg, mov, rm: 多媒体文件 ……
24 25 26 27
list
28 29 30 31
文件目录 文件名 始址 块数
count 0
2
tr
14
3
mail 19
6
list 28
4
f
6
2
顺序文件特点
优点
实现简单,顺序存取信息时速度快; 不需要增加存储空间存放附加控制信息(如不需要保存所
有磁盘块的地址)
缺点:
要求有连续的存储空间:容易形成磁盘碎片(似内存可变分
3、目录
为了便于对文件进行存取和管理,文件系统为所有的文件建 立了目录,每个文件在目录中都有一个登记项,称为文件目录 项,每个目录项记录着一个文件的名字及其外存地址等该文件 的管理和使用信息。
实现文件按名字存取; 实现文件共享和保护。 文件目录项又称为文件控制块(File Control Block, FCB),它除了记录文件名字和外存地址外,通常还保存了文 件的创建者、创建日期、访问权限和长度等。 有些系统中,目录也以特殊文件形式进行保存,称为“目录 文件”。
,增加了系统开销。 可靠性问题,如指针出错。
补充:FAT12
早期MS-DOS所使用的是FAT12文件系统。即一个 FAT表项占12位,共可表示4096个表项。
只能支持8+3格式的文件名; 若以物理盘块(扇区,大小一般为512字节)为分配单位
,则每个磁盘分区的容量仅为2MB(4096 * 512B) 一个物理磁盘支持4个磁盘逻辑分区,所以相应的磁盘容
量仅为8MB 为使FAT12支持更大的磁盘,引入了一个新的分配单位:
“簇”的概念。
补充:簇的基本概念
“簇(Cluster)”是一组连续的扇区,簇的大小一般为2n个 盘块(扇区),如512B/1KB/2KB/8KB等,进行文件空间分 配时,不再以盘块而是以“簇(Cluster)”为基本单位。 当簇大小为1KB时,FAT12可支持最大磁盘容量为16MB 当簇大小为4KB时,FAT12可支持最大磁盘容量为64MB 优点:增加支持的磁盘大小,减小了FAT表大小,降低存 取开销,提高了磁盘的I/O效率 缺点:造成更大的簇内零头(类似于页式管理中的页内碎片)
索引号 索引表块(26#)
0 108
索引号 索引表块(1#)
1 210
0
26
1
32
.
┇
┇
.
┇
. 123
1023 136
. 103
使用64位磁盘地址,理论支持2的64次方字节磁盘分区; 具有一定的系统容错功能,提供一些机制来保证文件系统
的一致性; 提供诸如文件和文件夹权限、加密、磁盘配额和压缩等高
级功能。
3)索引文件
FAT存在两个问题:
不能支持高效的直接存取; FAT占用较大的内存空间;
打开一个文件时,完 全没有必要将整个FAT 表调入内存
个字符,这种扩展FAT16也称为VFAT
补充:FAT32
一个FAT表项占32位,共可表示4G个簇。Windows 95及以后系列操作系统支持
FAT32支持2T及以上分区:4G * 512B = 2TB,理论上最 大可支持128T的分区(32K簇大小)。一些操作系统对 FAT32支持的分区大小进行了限制,如windows 2000无法 使用FAT32格式化超过32G的分区;
补充:FAT16
一个FAT表项占16位,共可表示65536个簇。MSDOS及Windows 95使用。
FAT16中每个簇中可有盘块数4、8、16、32、64 ,因此支 持的最大分区为:655356* 64 * 512B = 2048MB
FAT16仍然采用8+3格式文件名 Windows 95对FAT16进行了扩展,文件名长度可达到255
文件管理
文件系统概述 文件的逻辑结构与物理结构 文件的存取方式与文件操作 文件目录结构及检索 文件存储空间的管理 文件共享与保护 文件系统的一致性
一 文件系统概述(
1、文件
磁带
磁盘
光盘
优盘
定义:是记录在外存上的,具有符号名的,在逻 sort.c 辑上具有完整意义的一组相关信息项的集合。
Jeep 19
19
9 17 1 10 25 -1 -1 -1
文件jeep的 单级索引表
索引文件特点
优点:
能顺序存取,又能直接存取。 满足了文件动态增长、插入删除的要求。 没有外碎片,外存空间利用率较高。
缺点
索引表本身需要存储空间; 文件比较小时,索引表利用率低;
0123 4567 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
jeep 9
显式链接
物理 块号
0 1 …
9 10 … 16 …
25 …
FAT
10
16
25 1 -1
链接文件特点
优点
提高了磁盘空间利用率,不存在外部碎片问题。 有利于文件插入和删除,及其动态扩充。
缺点:
隐式链接不支持随机存取,显式链接随机查找慢。 显式链接中的FAT表需占用较大内存空间。 存储空间可能不连续,带来更多的寻道次数和寻道时间。 需要牺牲一些空间存放链接指针,同时需要维护这些指针
信息项:是构成文件内容的基本单位,可以是一个字符, 也可以是一个记录。
文件的组成部分
文件体:文件本身的信息
sort.c
文件说明:文件存储和管理信息
• 文件名称 • 文件内部标识符 • 文件类型 •文件存储位置 •文件大小 • 访问权限 • 时间、日期、用户标识 ……
文件属性
文件控制块 (FCB)
支持255长度文件名; 优点:支持更大的硬盘,簇大小可以设置的比较小,减少
簇内碎片。 缺点:由于FAT表扩大,运行速度比FAT16稍慢;不能保
持向下兼容。
补充:NTFS
NTFS以卷为单位,将一个卷中的所有文件信息、目 录信息以及可用的未分配空间信息,都以文件记录的 方式记录在一张主控文件表MFT(Master File Table )中。Windows XP及以后操作系统支持。
“索引文件”解决方法:
为每个文件建立一个索引块(表); 将分配给该文件的所有盘块号都存放于其中; 通常,采用一个盘块作为索引块。
磁盘空间索引式分配产生索引文件
文件目录 文件名 索引表地址
0123 4567 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
4、文件系统的结构
用户程序
用户界面(文件存取方式,一组文件操作)
符号文件系统(建立或搜索文件目录,获取文件内部标识)
文
内
件
核
逻辑文件系统(合法性检查,形成逻辑块号及块内偏移)
系
空
统Байду номын сангаас
间
物理文件系统(文件和目录的物理存储管理)
设备驱动程序
外部存储器
5、文件分类
为了方便管理和控制文件,常根据文件用途、存取控 制属性、保存期限等进行分类。
3)索引文件:ext2、ext3、ext4等UNIX文件系统采用该 方式。
1)顺序文件(连续分配)
将逻辑上连 续的文件信 息依次存放 在外存若干 个连续的物 理块中。
磁盘空间
count
0123
f
4567
8 9 10 11
tr
12 13 14 15
16 17 18 19
20 21 22 23
文件目录 文件名 始址 末址
jeep 9
25
data
隐式链接
next
链接文件(续)
隐式链接不便于随机 存取。
显式链接将链接各物 理块的指针存放在一个 专门的链接表中:FAT (File Allocation Table),整个文件系 统一张
系统启动时,FAT被 读入内存
文件目录 文件名 首址
文件目录 文件名 索引表地址
Jeep
19
9
17
1
19
10
25
-1
-1
-1
假设:块的大小为4K, 每个盘块号占4字节, 文件大于4M 则这个块中可以存放1024个盘块号(4M)。 该如何表示?
多级索引
二级索引:将一个大文件的所有索引表(二级索引
)的地址放在另一个索引表(一级索引)中。如果文件非
常大,还可用三级、四级。
区容易形成外碎片)
必须事先知道文件长度,对文件进行内容增、删比较困难 磁带上的文件只能是顺序文件,因为磁带是顺序存取设备。
2)链接文件
一个文件的 信息存放在 若干不连续 的物理块中 ,各块之间 通过指针连 接。包括隐 式链接和显 示链接
磁盘空间
0 1 10 2 3 4567 8 9 16 10 25 11 12 13 14 15 16 1 17 18 19 20 21 22 23 24 25 -1 26 27 28 29 30 31
从系统角度看到的文件信息的组织形式称为文件的物理结构。 实际上就是文件的存储结构,即文件信息在文件存储介质(如磁 盘)上的存储组织形式。主要分为3大类:
1)顺序文件:早期文件系统使用,现今仅在磁盘文件对换 区的使用上还能看到其影子。
2)链接文件:分为隐式链接和显式链接两类。FAT12、 FAT16、FAT32文件系统使用的就是显式链接方式;
目录项
2、文件系统
操作系统中负责存取和管理文件信息的模块称为文件系统。它负责管理 文件的存储、检索、更新、共享和保护,并为用户提供一整套方便有效的文 件使用和操作方法。
文件系统
用户 系统
• 基本目标:实现“按名存取”; • 提供方便的操作和统一的 调用 接口,屏蔽底层细节。
• 组织、分配、回收文件的存储 空间; • 负责文件的存储、检索、共 享 和保护。 • 重要目标:提高文件存取速度
物理结构:又称为文件的存储结构,是指文件在外存上的 存储组织形式。这不仅与存储介质的存储性能有关,而且 与所采用的外存分配方式有关。
1、文件的逻辑结构
从用户角度看到的文件信息的组织形式,分为有结构的文件( 记录式文件)和无结构文件(流式文件)两类。
1)有结构的记录式文件:文件是具有一定长度的记录的序 列,用户以记录为单位来组织信息。 记录:是一个具有内部结构的用于描述一个实体多方面 属性的信息单位。
Windows 95以上版本,最大支持2T分区,支持长文件名。
Windows NT/2000。很强的安全特性和文件系统恢复功能。
Linux操作系统使用的扩展文件系统。支持256字符的文件名, ext2/ext3最大支持16T分区,最多32000个子目录,ext4支持 1E分区,无限个子目录
OS/2操作系统使用的文件系统。突破了FAT文件系统的一些限 制,改善了文件在大目录下的访问时间,支持2TB硬盘容量。
逻辑结构
记录式文件 流式文件
物理结构
连续文件 链接文件 索引文件
6、目前常用的文件系统类型
FAT12/FAT16 FAT32 NTFS ext2/ext3/ext4
HPFS UDF 其他
MS-DOS。文件名采用8.3格式,FAT12最大支持16M分区, FAT16最大支持2G分区,Win95对FAT16进行了扩展,支持长 文件名(255个字符),称为VFAT
符合ISO9660标准的支持CD-ROM的文件系统。
xfs、gfs、ReiserFS、bwfs……
二、文件的结构
文件的结构指文件中信息的配置和构造方式,有逻辑 结构和物理结构之分。
逻辑结构:是从用户观点出发所观察到的文件组织形式, 是用户可以直接处理的数据及其结构,它独立于文件的物 理特性,又称为文件组织 。