Word文档结构分析及恢复
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
S e c t 0 r s的大小都 相 同 。 S e c t o r s简单 的 以其 在文 件 中 的顺序 列 举 , 一个 扇 区 的索 引 ( 从 0开 始 ) 叫做 扇 区 标识 ( S I D: s e c t o r i d e n t i f i e r ) 。 S I D是一个 有 符号 的 3 2 位 的整 型值 。 如果 一个 S I D 的值 非 负 , 就 表示 真 正 存 在 的那个 S e c t o r ; 如果为负 , 就表 示 特 殊 的含 义 。 用 于存 储 流 数 据 的所 有 S e c t o r s的列表 叫做 扇 区链
2 复 合 文件 中 的 s e c t o r的 大 小 ( 通常为 9 , 则 s e c t o r大小 是 2的 9次 幂 . 5 1 2 b y t e s ) 2 s h o r t — s e c t o r的 大 小 ( 通 常为 6 , 则 s h o r t — s e c t o r 大 小 是 2的 6次 幂 . 6 4 b y t e s )
1 0 No t u s e d
流的 S I D链 。S A T的大小 ( S I D个数 ) 就等 于复 合 文
档 中所 存 在 的 s e c t o r 的个数 。S A T的建立 就是 通 过
按 顺序 读取 MS A T中指定 的 s e c t o r 中的 内容 。
3 2
录人 口 ( d i r e c t o r y e n t y) r 组 成 。每一 个 目录 入 口都 指 向复合 文档 的一个仓 库 或流 。 目录人 口以其 在 目录 流 中 出现 的顺 序被 列举 ,一个 以 0开始 的 目录入 口 索 引 称 为 目 录 入 口标 识 ( D I D:d i r e c t o y r e n t y r
1 6 此文 件 的唯 一 标 识( 不重要, 可全部为 o )
2 文 件 格式 修 订 号 ( 一般为 0 0 3 E H )
MS A T的大 小 ( S I D个 数 ) 就 等 于存 放 S A T的 s e c t o r 数. 在 头 中指 明。 扇 区配 置表 ( S A T: s e c t o r a l l o c a t i o n t a b l e ) 是一个
2 6
2 8
2 文 件 格式 版 本 号 ( ~般为 0 0 0 3 H )
2 字 节顺 序 : F E F F = L i t l f e — E n d i a n F F F E= B i g — E n d i a n
3 0
S I D数 组 , 包 含所 有 用 户 流 ( 短流除外 ) 和 内部 控 制
( - ' ) Wo r d文档头 部特 征
Wo r d文档 头 在 文件 的开 始 ,且 其 大 小 必定 为
5 1 2字节 。这 意 味着第 一 个 S e c t o r 的开 始 相对 文 件
的偏 移 量为 5 1 2字 节 。 W0 r d文档头 描述 着这 个文 档 的重要 参数信 息 , 其 结构 如表 1 所示。
( S e c t o r C h a i n ) 。这些 S e c t o r s 可 以是无 序 的 。因此用
i d e n t i i f e r ) 。 根 目录入 口( R o o t E n t y) r 由很多 目录入 口 ( D i r e c t o r y E n t y) r 组成 , 每一 个 目录人 口都 指 向复合 文档 的一个 仓库 或流 。
圜困国囫
赵 振 洲 女 赵 永 峰 — — w 0 『 d 文 档 结 构 分 析 及 恢 复
第1 期
所 有 的流 又分 成 更 小 的数 据 块 , 叫做数 据 扇 区
( s e c t o r s ) 。 S e c t o r s 可能包 含控 制数 据或用 户数 据 。 整 个 文 件 由一 个 头 ( He a d e r )结 构 以 及 其 后 的 所 有 S e c t o r s 组 成 。S e c t o r s 的 大 小 在 头 中确 定 ,且 每 个
B1 H 1 AH E1 H
t a b l e ) 是 一个 S I D数组 . 指 明了所有 用 于存放 扇 区配
置表( S A T: s e c t o r a l l o c a t i o n t a b l e ) 的 s e c t o r的 S I D。
8Baidu Nhomakorabea
2 4
3 4
当一个流的大小小于指定 的值 ( 在头中指定 ) ,
就 称为短流 ( s h o r t — s t r e a m ) 。短 流并 不 是 直 接 使 用
s e c t o r 存 放 数 据 ,而是 内含在 一 种 特殊 的内部 控 制
流—— 短 流 存 放 流 ( s h o t— r s t r e a m c o n t a i n e r s t r e a m) 中。 短 流存 放流 象其他 的用 户流 一样 : 先从 目录 中 的
( 一 2 ) 为结 束标 记 。流的 S I D链是 通过 扇 区配置 表构 建的。
主 扇 区配 置 表 ( MS A T : m a s t e r s e c t o r a l l o c a t i o n
0
8 复合 文 档 文 件 标 识 : D 0 H C F H 1 1 H E 0 H A1 H
0 f f _ s e t S i z e C o n t e n t s
于 指定 一 个 流 的 S e c t o r s的顺 序 的 S I D数 组 就 称 为
S I D c h a i n 一 个 S I D c h a i n总是 以 E n d O f C h a i n S I D