AFS在高能物理计算系统中的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
技术的巨大进步 , 高能物理研究产生的数据量 越来越大, 以中国科学院高能物理研究所( 以下 简称高能所) B S 的 E 实验为例 , 在未来 5 年内, 将有近 5 B的数据产 生。为了分析海量 的原 P
利 用 AF S统 一管理 用户 并提 供用户 目录 , 实现
更安全 的用户管理 和跨平 台、 跨网域的文件共
由于集群系统被用户共 享使用 , 一旦某 一
个用户的帐号出现问题 , 就可能给其他用户的
存储技术。
44 0
数据安全带来严重的威胁 。然而在传统的集群
系统 中, 无论是 NI 服务, S 还是 L A D P服务 , 其 安全性都不尽如人意 , 由用户带来的诸如弱 口 令、 弱加密方式等安全问题越来越突出, 恶意攻 击或入侵行为越来越成为集群 系统面临的严重 问题。因此 , 集群 系统要求有一种安全性更高 的用户管理模式, 以提升整个集群系统 的安全
NF S网络文 件 系统 。 1 4 集群 wk.baidu.com统要 求更 高的 数据安 全性 .
A S提供了基于 K reo 的用户身份认 F ebrs 证 机 制和基 于 AC AcesC nrl i ) L( cs o to Ls 的访 t 问控制模式 , 不但在通讯 、 身份认证和信息保存 等方面全面采用了数据加密技术, 而且将身份 认证与文件访问控制结合起来 , 能够实现更加 细腻的访 问控制粒度 , 提供 比传统文件系统更
11 集群用 户数量 较 多 , 求提供统 一的帐户 . 要 管理 系统
户的统一管理、 数据安全管理、 文件共享管理 、
以及 文件 一致 性 等方 面 , 规模 集 群 系统 都 面 大 临着 严重 的挑 战 。
集群系统拥有强大的计算资源 , 往往被大
量 用户 共 享 使 用 。但 是 随着 用 户 量 的 不 断 增
频繁。因此 , 提供高可用的数据共享能力 、 保持数据文件的安全性 和一致性 、 保证数 据访 问的效 率是高
能物理计算环境 中必须解决 的问题 。论文将 A S F 分布式文件系统应用于高能 物理 计算 系统 中 , 不仅能 够提供较高安全水平的用户 管理 功能, 能够提供跨 网络 、 而且 跨平 台的文件共享 功能 , 并有效地 控制用 户文件副本 。同时 , 科学的配置 A S的复制卷也提高 了整个计算环境数据调用 的效率 。 F
性能 。
组成 , 拥有 A S F 所有 的服务 和组件, 能够实现 A S的全部功能。A S通过统一规则 的全局 F F 名 字 空 间 将不 同 C l虚 拟 化 成 一个 庞 大 的全 el 局文件系统 , 用户可以在全球任意地方通过唯
一
的逻辑路径访问某一个 A S目录, F 具有非常
的性能瓶颈 , 急需要一种能够支持大规模并发 数据访问的用户集中管理模式 。 12 集群 系统 要 求用 户 管 理具 备 更高 的安 全 .
性
基 金 项 目:本 项 目 由 国 家 8 3 计 划 项 目 6 20 A 1 2 和 中国科学院知识创新工程重大项 0 6 A0 AI 0 目 K C 一Y J X1 w一1 课题 资助 。 7 作者简 介: 许冬 ( 9 7 , , 17 一)男 中国科学 院高能物理 研究所工程师, 中国科学 院研究生 院硕士研 究生 , 主 要研究方向 : 分布式 文件 系统 , 大型集 群技 术及海量
优越 的共享能力。
13 集群系统要求提供较高的数据共享能力 . 随着高能物理数据规模 的扩展 , 数据分析 工作的压力越来越大 , 高能物理研究领域普遍 采用 了分工合作的方式开展研究 。这种分工合 作必须以强大的数据共享能力为基础。特别是 在高能物理计算中经常使用的函数库和分析程 序, 由于直接决定分析结果的正确与否 , 其共享 就显得更加重要。但 目前传统的集群系统一般 采用 N S网络文件系统共享存储资源, F 其数据 共享 局 限于 局域 网 内部 , 且没 有 提供 统 一 的名 字空间, 用户在开发数据分析程序时 , 对函数库 和程序 的调用就无法指定 固定 的路径, 程序的 通用性不强 , 以, 所 高能物理计算 的需求必然要 求 采 用 一 种 共 享 能 力 更 好 的 文 件 系 统来 替 代
第3卷 第 3 0 期
21 0 0年 3 月
核电子学与探测技术
Nu la l to i cerE e rnc c s& D tcinTeh oo y eet c n lg o
V0 0 No 3 L3 .
Ma . 2 1 r 00
A S在 高 能 物理 计算 系统 中的应 用 F
加, 用户管理的难度也越来越高 , 集群系统需要 将大量的用户实行集中管理 。在高能物理计算 系统中, 传统的以 NI I A S或 P管理用户的模 D 式在 大 规模 并 发数 据访 问情 况 下 , 出现 了严 重
本文介绍了高能所将 A S FE 分布式文件
收稿 日期 :0 00 —3 2 1-20
享。
1 需求分析
把 A S分布式文件系统应用于高能物理 F 始数据, 在高能物理研究领域普遍采用 了集群 技术作为数据处理和数据分析 的手段。近些年 计算系统中, 主要是基于如下因素 : 来, 随着大规模集群系统 , 甚至超级集群系统的 不断出现 , 集群管理难度越来越高 , 特别是在用
许 冬h ,闫晓飞 , 。 程耀东 陈 刚 , , 于传 松
(. 1中国科学院高能物理研究所 , 北京 104 ; 中国科学 院研究生 院, 0092 . 北京 104) 009
摘要 : 高能物理 的科学计算是典型 的数据密集型计算 , 作业对数据的依赖 程度较 高, 数据调用非常
关键词 : 集群 ; F ; A S 用户管理 ; 共享 ; 复制卷 中图分类号 : T 3 1 P 9 文献标识码 : A 文章编 号 : 0 5 -94 2 1 ) 30 4 —6 2 8 3 (0 00 —4 00 0
系统应用 于集群 计算 系统 的方 案 。该方 案通过
随着高能物理研究的高速发展和相关探测
利 用 AF S统 一管理 用户 并提 供用户 目录 , 实现
更安全 的用户管理 和跨平 台、 跨网域的文件共
由于集群系统被用户共 享使用 , 一旦某 一
个用户的帐号出现问题 , 就可能给其他用户的
存储技术。
44 0
数据安全带来严重的威胁 。然而在传统的集群
系统 中, 无论是 NI 服务, S 还是 L A D P服务 , 其 安全性都不尽如人意 , 由用户带来的诸如弱 口 令、 弱加密方式等安全问题越来越突出, 恶意攻 击或入侵行为越来越成为集群 系统面临的严重 问题。因此 , 集群 系统要求有一种安全性更高 的用户管理模式, 以提升整个集群系统 的安全
NF S网络文 件 系统 。 1 4 集群 wk.baidu.com统要 求更 高的 数据安 全性 .
A S提供了基于 K reo 的用户身份认 F ebrs 证 机 制和基 于 AC AcesC nrl i ) L( cs o to Ls 的访 t 问控制模式 , 不但在通讯 、 身份认证和信息保存 等方面全面采用了数据加密技术, 而且将身份 认证与文件访问控制结合起来 , 能够实现更加 细腻的访 问控制粒度 , 提供 比传统文件系统更
11 集群用 户数量 较 多 , 求提供统 一的帐户 . 要 管理 系统
户的统一管理、 数据安全管理、 文件共享管理 、
以及 文件 一致 性 等方 面 , 规模 集 群 系统 都 面 大 临着 严重 的挑 战 。
集群系统拥有强大的计算资源 , 往往被大
量 用户 共 享 使 用 。但 是 随着 用 户 量 的 不 断 增
频繁。因此 , 提供高可用的数据共享能力 、 保持数据文件的安全性 和一致性 、 保证数 据访 问的效 率是高
能物理计算环境 中必须解决 的问题 。论文将 A S F 分布式文件系统应用于高能 物理 计算 系统 中 , 不仅能 够提供较高安全水平的用户 管理 功能, 能够提供跨 网络 、 而且 跨平 台的文件共享 功能 , 并有效地 控制用 户文件副本 。同时 , 科学的配置 A S的复制卷也提高 了整个计算环境数据调用 的效率 。 F
性能 。
组成 , 拥有 A S F 所有 的服务 和组件, 能够实现 A S的全部功能。A S通过统一规则 的全局 F F 名 字 空 间 将不 同 C l虚 拟 化 成 一个 庞 大 的全 el 局文件系统 , 用户可以在全球任意地方通过唯
一
的逻辑路径访问某一个 A S目录, F 具有非常
的性能瓶颈 , 急需要一种能够支持大规模并发 数据访问的用户集中管理模式 。 12 集群 系统 要 求用 户 管 理具 备 更高 的安 全 .
性
基 金 项 目:本 项 目 由 国 家 8 3 计 划 项 目 6 20 A 1 2 和 中国科学院知识创新工程重大项 0 6 A0 AI 0 目 K C 一Y J X1 w一1 课题 资助 。 7 作者简 介: 许冬 ( 9 7 , , 17 一)男 中国科学 院高能物理 研究所工程师, 中国科学 院研究生 院硕士研 究生 , 主 要研究方向 : 分布式 文件 系统 , 大型集 群技 术及海量
优越 的共享能力。
13 集群系统要求提供较高的数据共享能力 . 随着高能物理数据规模 的扩展 , 数据分析 工作的压力越来越大 , 高能物理研究领域普遍 采用 了分工合作的方式开展研究 。这种分工合 作必须以强大的数据共享能力为基础。特别是 在高能物理计算中经常使用的函数库和分析程 序, 由于直接决定分析结果的正确与否 , 其共享 就显得更加重要。但 目前传统的集群系统一般 采用 N S网络文件系统共享存储资源, F 其数据 共享 局 限于 局域 网 内部 , 且没 有 提供 统 一 的名 字空间, 用户在开发数据分析程序时 , 对函数库 和程序 的调用就无法指定 固定 的路径, 程序的 通用性不强 , 以, 所 高能物理计算 的需求必然要 求 采 用 一 种 共 享 能 力 更 好 的 文 件 系 统来 替 代
第3卷 第 3 0 期
21 0 0年 3 月
核电子学与探测技术
Nu la l to i cerE e rnc c s& D tcinTeh oo y eet c n lg o
V0 0 No 3 L3 .
Ma . 2 1 r 00
A S在 高 能 物理 计算 系统 中的应 用 F
加, 用户管理的难度也越来越高 , 集群系统需要 将大量的用户实行集中管理 。在高能物理计算 系统中, 传统的以 NI I A S或 P管理用户的模 D 式在 大 规模 并 发数 据访 问情 况 下 , 出现 了严 重
本文介绍了高能所将 A S FE 分布式文件
收稿 日期 :0 00 —3 2 1-20
享。
1 需求分析
把 A S分布式文件系统应用于高能物理 F 始数据, 在高能物理研究领域普遍采用 了集群 技术作为数据处理和数据分析 的手段。近些年 计算系统中, 主要是基于如下因素 : 来, 随着大规模集群系统 , 甚至超级集群系统的 不断出现 , 集群管理难度越来越高 , 特别是在用
许 冬h ,闫晓飞 , 。 程耀东 陈 刚 , , 于传 松
(. 1中国科学院高能物理研究所 , 北京 104 ; 中国科学 院研究生 院, 0092 . 北京 104) 009
摘要 : 高能物理 的科学计算是典型 的数据密集型计算 , 作业对数据的依赖 程度较 高, 数据调用非常
关键词 : 集群 ; F ; A S 用户管理 ; 共享 ; 复制卷 中图分类号 : T 3 1 P 9 文献标识码 : A 文章编 号 : 0 5 -94 2 1 ) 30 4 —6 2 8 3 (0 00 —4 00 0
系统应用 于集群 计算 系统 的方 案 。该方 案通过
随着高能物理研究的高速发展和相关探测