CC-NUMA结构计算机含错技术研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
状态下 含错技 术 问题 。
1 主存共享
在 C C~N MA结构计 算机上有 两种共 享主存方 法 : 级 共 享 和物 理 级共 享 , U 逻辑 两种 方 法需 要不 同的数
据结构 管理方 法并 在系统 中的不 同位置 实现 。 1 1 主存 页 的逻辑 级共享 .
当一个 节点需 要访 问 由另 一节点缓 冲的数据 时 , 它分 配一 个新 的 pd 来 记 录该 页的逻 辑 页 面标 识 和物 fs 理地址 , 这些 动态分 配 的 pd 称 为扩展 p s fs f 。一旦 扩展 pd 被分 配 并 被加 入 pd 哈 希表 , 多数核 心模 型 d fs fs 大 可 以不 必担 心该页 实 际上 是属 于另一节 点 内存 的一部分 而对其 进行操 作 。
第l 8卷
第 6期
长
春
大
学
学
报
V 1 1 No 6 0. 8 . D e2 o e.0 8
20 0 8年 l 2月
J RN HANG OU AL 0F C CHU U VE n N NI RS 丫
文 章编 号 :0 9— 97 20 )6— 0 8— 3 10 3 0 (0 8 0 02 0
不 分配扩展 pd 。 fs
含 错 区域 划分研 究
2 含错区域划分研究
2 1 依 进程划 分含错 区域 .
进程是操作系统进行资源分配 的最基本单位[ , 3 操作 系统会记录每个进程当前 占用 的所有资源的信 ] 息, 包括占用的处理器、 主存地址空间、 使用的文件等。对于 C —U A结构计算机来说, CN M 某个进程可能 占用 多个节点的主存 , 某节点的主存也可能被多个进程所 占用。当故障发生时, 想要将故障限制在单个节点的内 部, 相对来说是 比较困难的, 而将故障限制在相应进程的内部 , 实现起来相对比较简单且比较直观。
பைடு நூலகம்
C -U CN MA结构计算机含错技术研究
金 丽娜
( 长春大学 现代教育技术 中心 ,吉林 长春 10 1 ) 30 2 )
摘 要 : 主要研究 C . U A结构计算机 的主存共享状态下含 错技术 问题。本文对主存 共享、 CN M 含错 区域
划分进行 了 说明, 并深入分析了 在主存共享状态下的含错区 域划分、 乱写防护等含错技术支持和保障。
启动一个节点作为内存本地 , 向即将转变为数据本地的另一节点借 出一个页帧。内存本地将该页帧移动到 保留表并忽略它 , 直到数据本地将其释放或发生故障。
1 3 逻 物理 级共 享的交 互 .
总的来讲 , 两类共享主存方法是独立且并发运作 的。
() 1 页帧可能同时被借用和输出, 即数据本地在过分的存储压力下 , 可能在借用的页帧内缓冲页面。 () 2 页帧可能同时被借出并重新输入到内存 本地 , 这种情况会在数据本地向缺页客户节点主存上放置
1 2 主存 页 的物理 级共享 .
逻 辑级共 享设计 描述 了文件数 据共享有 一个 主要 的约束 j所 有 页 面必须 在其 数据 本地 缓 冲。如 果 该 2, 设 计约束 了存 储在 数据本 地 内存 的所有 页面 , 系统负载平衡 将会 很差 , 在使 用进程 中不 能将页 面放置在更 好 的位置 , 而这 是提 高 C .U CN MA机 器性能 所需要 的。物理 级 共享 将 解决 这 一 问题 。利 用扩 展 的 pd 机制 来 fs
收 稿 日期 :0 81-2 20 .00
作者简介 : 金丽娜(98)女 , 17. , 吉林省九台市人, 长春大学现代教育技术中心助理实验师, 主要从事计算机应用及维护方面的研究。
第6 期
金丽娜 : CN MA结构计算机 含错 技术 研究 C .U
2 9
该页面。为 了有效地支持该 C U A优化 , CN M 虚存系统在重新输入一个借用页面时, 重新使用以前的 p s f 而 d
2 2 进程 间的依 赖 关 系对 含错 区域 划分 的影 响 .
有些应用程序的进程之 间会采用消息交换 、 共享数据 区等来实现交互功能 , 使得进程 间存在依赖关系。 这种依赖关系会导致某个进程的故障所造成的错误会很快被传播到依赖进程 , 这是含错必须解决的问题。 含错技术的基础是快速的故障检测与诊断, 一旦故障发生 , 就要立即禁止相应进程的消息发送到临界区访 问 操作 , 避免故障产生的错误向依赖进程传播。然而 , 如果故 障破坏 了临界区数据 , 或其发送 的错误消息已被
关键 词 : CN M 主存 共享 ; C — U A; 含错技 术
中图分 类 号 :P 3 T 38
文献标识码 : A
0 引
言
目前 , 高性 能并行计 算机技 术无论 在理论研究 还是 在商业 应用上 都有 了长足 的进步 , 成果 被广泛应 用 于
仿真、 通信、 金融、 气象等各个领域。其中, 基于分布式共享存储技术的高速缓存一致性非对称存储访问 C — C N M C ce oe IeN ——u iⅡ e o ce ) U A( ah hrl o g  ̄c n 0nM m r Acs 计算机一直备受关注… , f y s 且众多高性 能计算机制造 商都有基于 C .U A结构的商用产品 , IM,r , P S I CN M 如 B Ca H ,G 等。相对于其它体系结构 的计算机, CN — y C -U MA结 构计算 机 的优点是 易于编 程 、 性能 高 , 缺点是 Cce ah 一致 性 协 议硬 件 设计 复杂 、 协议 处理 开 销较大 , 影 响 了共 享存 储 系统的 可扩 展性 , 许多 系统在设计上 支持 大规模 、 可扩 展 , 是实 际使用 时采用 中 、 但 小规模 分 区 使用 , S I 司的 Oii 0 0等 ] 如 G公 r n 0 g2 。本 文主要关 注于 中 、 小规模 应用 的 C . U A结 构计 算 机 的主存 共享 CN M
1 主存共享
在 C C~N MA结构计 算机上有 两种共 享主存方 法 : 级 共 享 和物 理 级共 享 , U 逻辑 两种 方 法需 要不 同的数
据结构 管理方 法并 在系统 中的不 同位置 实现 。 1 1 主存 页 的逻辑 级共享 .
当一个 节点需 要访 问 由另 一节点缓 冲的数据 时 , 它分 配一 个新 的 pd 来 记 录该 页的逻 辑 页 面标 识 和物 fs 理地址 , 这些 动态分 配 的 pd 称 为扩展 p s fs f 。一旦 扩展 pd 被分 配 并 被加 入 pd 哈 希表 , 多数核 心模 型 d fs fs 大 可 以不 必担 心该页 实 际上 是属 于另一节 点 内存 的一部分 而对其 进行操 作 。
第l 8卷
第 6期
长
春
大
学
学
报
V 1 1 No 6 0. 8 . D e2 o e.0 8
20 0 8年 l 2月
J RN HANG OU AL 0F C CHU U VE n N NI RS 丫
文 章编 号 :0 9— 97 20 )6— 0 8— 3 10 3 0 (0 8 0 02 0
不 分配扩展 pd 。 fs
含 错 区域 划分研 究
2 含错区域划分研究
2 1 依 进程划 分含错 区域 .
进程是操作系统进行资源分配 的最基本单位[ , 3 操作 系统会记录每个进程当前 占用 的所有资源的信 ] 息, 包括占用的处理器、 主存地址空间、 使用的文件等。对于 C —U A结构计算机来说, CN M 某个进程可能 占用 多个节点的主存 , 某节点的主存也可能被多个进程所 占用。当故障发生时, 想要将故障限制在单个节点的内 部, 相对来说是 比较困难的, 而将故障限制在相应进程的内部 , 实现起来相对比较简单且比较直观。
பைடு நூலகம்
C -U CN MA结构计算机含错技术研究
金 丽娜
( 长春大学 现代教育技术 中心 ,吉林 长春 10 1 ) 30 2 )
摘 要 : 主要研究 C . U A结构计算机 的主存共享状态下含 错技术 问题。本文对主存 共享、 CN M 含错 区域
划分进行 了 说明, 并深入分析了 在主存共享状态下的含错区 域划分、 乱写防护等含错技术支持和保障。
启动一个节点作为内存本地 , 向即将转变为数据本地的另一节点借 出一个页帧。内存本地将该页帧移动到 保留表并忽略它 , 直到数据本地将其释放或发生故障。
1 3 逻 物理 级共 享的交 互 .
总的来讲 , 两类共享主存方法是独立且并发运作 的。
() 1 页帧可能同时被借用和输出, 即数据本地在过分的存储压力下 , 可能在借用的页帧内缓冲页面。 () 2 页帧可能同时被借出并重新输入到内存 本地 , 这种情况会在数据本地向缺页客户节点主存上放置
1 2 主存 页 的物理 级共享 .
逻 辑级共 享设计 描述 了文件数 据共享有 一个 主要 的约束 j所 有 页 面必须 在其 数据 本地 缓 冲。如 果 该 2, 设 计约束 了存 储在 数据本 地 内存 的所有 页面 , 系统负载平衡 将会 很差 , 在使 用进程 中不 能将页 面放置在更 好 的位置 , 而这 是提 高 C .U CN MA机 器性能 所需要 的。物理 级 共享 将 解决 这 一 问题 。利 用扩 展 的 pd 机制 来 fs
收 稿 日期 :0 81-2 20 .00
作者简介 : 金丽娜(98)女 , 17. , 吉林省九台市人, 长春大学现代教育技术中心助理实验师, 主要从事计算机应用及维护方面的研究。
第6 期
金丽娜 : CN MA结构计算机 含错 技术 研究 C .U
2 9
该页面。为 了有效地支持该 C U A优化 , CN M 虚存系统在重新输入一个借用页面时, 重新使用以前的 p s f 而 d
2 2 进程 间的依 赖 关 系对 含错 区域 划分 的影 响 .
有些应用程序的进程之 间会采用消息交换 、 共享数据 区等来实现交互功能 , 使得进程 间存在依赖关系。 这种依赖关系会导致某个进程的故障所造成的错误会很快被传播到依赖进程 , 这是含错必须解决的问题。 含错技术的基础是快速的故障检测与诊断, 一旦故障发生 , 就要立即禁止相应进程的消息发送到临界区访 问 操作 , 避免故障产生的错误向依赖进程传播。然而 , 如果故 障破坏 了临界区数据 , 或其发送 的错误消息已被
关键 词 : CN M 主存 共享 ; C — U A; 含错技 术
中图分 类 号 :P 3 T 38
文献标识码 : A
0 引
言
目前 , 高性 能并行计 算机技 术无论 在理论研究 还是 在商业 应用上 都有 了长足 的进步 , 成果 被广泛应 用 于
仿真、 通信、 金融、 气象等各个领域。其中, 基于分布式共享存储技术的高速缓存一致性非对称存储访问 C — C N M C ce oe IeN ——u iⅡ e o ce ) U A( ah hrl o g  ̄c n 0nM m r Acs 计算机一直备受关注… , f y s 且众多高性 能计算机制造 商都有基于 C .U A结构的商用产品 , IM,r , P S I CN M 如 B Ca H ,G 等。相对于其它体系结构 的计算机, CN — y C -U MA结 构计算 机 的优点是 易于编 程 、 性能 高 , 缺点是 Cce ah 一致 性 协 议硬 件 设计 复杂 、 协议 处理 开 销较大 , 影 响 了共 享存 储 系统的 可扩 展性 , 许多 系统在设计上 支持 大规模 、 可扩 展 , 是实 际使用 时采用 中 、 但 小规模 分 区 使用 , S I 司的 Oii 0 0等 ] 如 G公 r n 0 g2 。本 文主要关 注于 中 、 小规模 应用 的 C . U A结 构计 算 机 的主存 共享 CN M