基于信息栅格资源描述方法探究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

现代物业・新建设 2012年第11卷第7期现代建设 Modern Construction
栅格中拥有着数量巨大、存在形式多样、在地理上广域分布并且功能上各异的资源。

为了使这些资源能够被用户更加方便和高效地使用就必须将资源进行统一表征,当一个资源加入栅格时,栅格采用一定的方法对资源的特征进行合理地描述,例如资源的类别、有限期限、性能指标、资源的所有者信息等。

当用户申请某种资源时,将会提出资源请求,通过栅格的资源组织与发现系统来寻找合适的资源。

1 栅格资源表征描述
栅格的发展先后经历了萌芽期,早期实验阶段,伴随着OGSA标准制订的出台正式进入了发展阶段。

在OGSA中提出了“服务”的概念,所有的资源都被抽象成服务,以服务的形式发布和存在,原本对资源的描述即被转化为对服务的表征,表征通过合理的描述来实现。

因此,本文首先从底层资源的角度出发,深入研究了其采用的资源描述表征方法。

常用的栅格资源描述表征技术主要有:Globus项目中提出的资源表征描述语言——RSL;WebService服务主要采用的网络服务描述语言WSDL;以及栅格方面资源采用的描述框架RDF。

1.1 栅格资源描述语言——RSL
在Globus项目设计中,采用了一种更加简单易行的栅格资源描述语言RSL。

Globus组织是一直致力于研究和实现信息栅格的一个稳定结构,致力为用户提供可靠、远程、普遍的并且更为一致性的高性能栅格资源。

通过RSL 描述在Globus的资源管理框架中完成不同组件同时工作,从而完成各自负责的管理模块功能。

RSL为其实现设计了一个通用框架性质的语法描述,实现了更加复杂的资源描述来和其他的系统组件有效协调地工作[1]。

1.1.1 RSL语言的语法结构和相关的重要属性
RSL的语法结构是从轻量级的目录访问协议提炼出来,可以简称其为LDAP[2,3]中的字符串查询,“关系”是它最为基本的语法,通过其中定义好的关系来把属性和属性值有机联系。

每一个<属性,属性值>的这种键值对来控制相关参数从而实现对资源的多种操作。

如下图1.1中所示的是通过一个简单的RSL例子来有效说明RSL基本语法格式。

& ( count = 4 )
( executable = b.file )
( directory=/cuntry/hello )
( arguments=argl”arg2” )
图1.1 RSL基本语法的简单例子
当中,“&”操作符被用来表示RSL描述脚本的开始,“&”同样被Globus用去实现合取式的资源请求,假设是多重请求的方式,那么就使用“+”符号来作为其真正开头;“(count=*)”通常被用来表示资源请求中所需的处理器个数;“(executable=b.file)”表示将要执行文件名称是“b. file”;“(directory=/ cuntry/hel1o)”是请求目标文件所在的实际目录;“(arguments = argl” arg2”)”用作可执行程序的命令行参数,假设处于单个参数中间出现空格就需用这个双引号去把整个的参数都括起来。

下面表1.1当中就列举了几个在栅格系统作业管理中常用的RSL属性。

基于信息栅格的资源描述方法探究
程嘉麒1 姜月秋2
(1.沈阳理工大学研究生学院,辽宁 沈阳 110168;
2.沈阳理工大学理学院,辽宁 沈阳 110168)
摘 要:信息栅格中资源的发现依赖于资源的合理描述,统一和规范的表征描述是高效资源发现的坚实基础。

目前资源描述语言有多种,本文针对栅格资源自身的特点,对主流的资源描述方法进行对比分析,选出最适合栅格资源特点的资源表征语言。

关键词:信息栅格;资源描述;XML;分类元数据;资源发现
中图分类号:G623.58 文献标识码:A 文章编号:1671-8089(2012)07-0056-03
– 56 –
程嘉麒,等:基于信息栅格的资源描述方法探究
表1.1 栅格资源管理作业中常用的RSL属性
属性的名称相关的含义
Count值的属性需要被指定的资源数量,默认值初始值1
Executable的属性指定那些即将由远程机器执行的文件名称属性值
Directory的属性指定的路径,此路径被作为请求作业默认的路径
Arguments的属性值执行程序中出现的命令行的参数,一旦其中存在空格那么就将整个的参数通过双引号括起来
Environment的特征属性执行中需要的环境变量和设置的属性值等
Stdin的特征属性位于远程机器上来实际运行的文件所定义的名称
1.1.2 通过RSL语言进行栅格资源描述出现的局限性
(1)无法实现很好的扩展性:在Globus中采取一种本地和全局相互协作模式下的双层次结构模型,每一种栅格资源分配管理的实现都可以在本地资源管理工具体现。

而当前只有Condor等近6种本地资源管理的工具可以被Globus来支持,这种情况使得Globus的资源管理模型的扩展受到了很大限制,就连RSL的扩展性同样被限制在一个很小的范畴内。

(2)可使用的范围较小:RSL更擅长于对计算资源和资源请求进行描述,不能够被广泛使用,并且目前主要被应用于Globus项目中,在其他的一些栅格项目中还没有被有效地支持。

1.2 WSDL——万维网服务描述中被广泛采用的描述语言
WSDL是由微软、IBM两大巨头联合制订出的一种被广泛用于描述Web网络服务的XML语言,它可以有效地用于提高分布式应用之间的互操作性能。

它阐释了一系列自定义的标记符号,从而达到并实现描述的接口独立出实现的具体平台,这样就可以实现跨越平台的调用。

1.2.1 WSDL语法的具体结构
Web服务描绘通过WSDL服务描述组成一组网络的端点,消息对的操作通过这些端点实现。

WSDL服务描述中主要包含有以下关键内容:实现了操作和对应消息的抽象定义,控制这些消息之间绑定的具体相关协议,所绑定的一个网络端点的具体规范[4,5]。

如表1.2中所示列出了若干WSDL定义的几个相关元素。

表1.2 WSDL描述过程中主要关联的一些元素
Types 属性值定义了实现过程中的数据类型
Message 属性值详细的规范和定义了使用的消息模型Operation操作属性值定义实际过程中请求和相应的相关消息PortType 属性值对操作集合进行封装
Binding 属性值端口与具体网络协议之间的映射关系,例如SOAP协议
Port 端口属性值定义绑定和具体访问构成的单个服务访问节点
Service 服务属性值元素及它所定义的<Port>以及元素囊括在网络上服务实现的实际位置
1.2.2 使用WSDL描述栅格资源体现出来的局限性
(1)比较差的通用性能:本身WSDL的设计目标并不能很好地描述栅格资源,为了满足栅格变化的需求和满足语义栅格的实际需要,凸显出WSDL没有良好的通用性能。

WSDL实际上不能很好地胜任描述栅格的资源,它的主要能力是对粗粒度的服务访问接口进行描述和表征。

(2)不完备规范及协议:在Web描述领域内使用WSDL 进行描述已达到很成熟的阶段,然而对于栅格资源的描述方面,WSDL一定要根据栅格的特点定义一定的行为以及相应的规范,才能达到较好的效果。

1.3 栅格资源的描述框架——RDF
RDF资源描述框架实质上是一个资源描述的具体标准,它的提出者是万维网的W3C。

其主要作用是用来表述资源底层的元数据信息。

目前栅格领域内存在着若干种元数据的概念,一般来说,元数据就是用于表述数据的数据,譬如常见的网页标题、作者、出版社、修改和上传时间以及版权和许可信息等,都是元数据。

万维网资源的具体描述信息被RDF借助XML语言所替换,资源的表征手法也多种多样。

譬如,我们不仅限于采用XML这种单一的形式来描述资源,也有很多其他方式方法来描述。

1.3.1 在RDF中采用的数据模型
一个RDF文件里面有许多个栅格资源描述,每个资源描述有许多语句,每个语句都是资源、属性以及属性值组成的三元组,RDF图就是由这些构成的,用来描述资源或两个资源之间的关联。

RDF凭借自身的概念模型,通过相应的值和特定性质来描绘两个资源之间的关联。

然而,RDF其实不提供专有的机制描述两个资源之间的性质。

RDF只提供表述元数据的模型,没有定义任何特定语义。

所以,RDF实质上描述元数据是用与具体领域的无关机制。

R D F模型的三部分:R e s o u r c e、P r o p e r t y和Statement。

(1)R e s o u r c e:资源,就是所有R D F描述的信息。

RDF标识机制的基础是统一资源标识符(Uniform Resource Identifier,简称URI),URI本身可以扩展,所以所有资源都能用它描述。

例如,所有栅格的标识均可以采用grid://#.#.#被囊括到URI里。

(2)Property:属性,用来描述栅格资源的关系和特性。

每个属性都有自己的意义,定义自己的允许值,定义资源类型和其他属性的关联。

资源集合包含属性集合,属性本身可以是资源。

(3)Statement:语句、资源以及该资源的属性和属性值组成了一个RDF的语句。

RDF陈述分别由主体(Object)、谓词(Predicate)和客体(Subject)[6]三个主体部分组成。

RDF模型有三元组和图形两种表示方法:
(1)三元组表示法
{主体(Subject),谓词(Predicate),客体(Object)}
– 57 –
– 58 –
现代物业・新建设 2012年第11卷第7期
现代建设 Modern Construction
(2)图形表示法,如下图1.2所示。

图1.2 RDF图形示意图箭头代表属性,矩形代表属性值,椭圆代表资源以下面这样一个简单的句子为例:
开放栅格服务体系架构OGSA是现今栅格领域的主流架构。

它的英文表示为:OGSA is a mainstream architecture of information grid.
这个语句中包含了这几个部分:资源:information grid;属性:architecture;属性值:OGSA
在这里我们可以使用有向图来表示陈述。

在这些图标中,椭圆框表示栅格资源,箭头代表栅格属性,属性值字符串在矩形框中。

用图解法来表示如图1.3所示。

图1.3 RDF图示例
1.3.2 RDF描述栅格资源的特点
从上面能够总结出RDF在栅格描述时的特点有:(1)通用性广泛
资源表述时应用与领域要相关联。

例如,对书的描述和对Web站点的描述应不同,即使用不同的词汇表。

RDF只有基础词汇表,没有定义表征资源的词汇表,只定义标准和规则,在不同应用领域描述资源的词汇表时必须遵循这些规则。

所以,可以用任何词汇来描述任何资源。

(2)智能和准确性
RDF采用结构化XML数据,所以RDF在查找栅格资源时能更精确地理解元数据,资源的查找从而变得更智能准确,成功避免发生资源查找经常返回无关结果的情况。

(3)全面综合性
属性可以是资源,RDF中的资源属性也是资源,资源陈述也可以是资源,都可以用RDF描述,这样可以将多个描述全面综合,有利于发现资源。

2 栅格资源描述方法的比较分析
由上述讨论可以得出:RSL针对性强但通用性差,不能实现栅格资源多样性的需求;WSDL是针对web服务设计的栅格描述语言,只适用于描述抽象动态系统服务的访问接口,不能较好描述栅格资源;RDF(Resource Description Framework)是处理元数据最基本的方式,从栅格资源种类多且结构不同可知,有许多需处理的栅格数据存在于栅格应用环境中,而元数据能把不同类型数据
变成相同类型的数据。

RDF解决了如何用XML标准语法来逐一描述资源对象的问题,使描述资源的元数据信息变成能用计算机理解的信息。

如果把XML看作是元数据语言标准化的规范,那么RDF可以被认为是基于描述元数据标准语义的规范。

用XML语法准确定义结构化的规范是RDF协助搭
建语义协定和语法编码之间的桥梁,因此能提高元数据的互操作能力。

虽然RDF描述框架并没有对语义进行规范,但其拥有为资源表征,表达语义结构的潜力。

由此看来,RDF是开放的元数据描述架构,适合用来描述栅格资源。

参考文献:
[1] 朱莹,吴军华,等.网格资源描述技术的比较研究[J].微
计算机信息,2006(12):176-178.
[2] Timothy H, Mark S. LDAP: Programming Directory-Enabled Applications with Lightweight Directory Access Protocol[M]. Canada:Macmillan Technical Publishing,1997.
[3] Donnelly M. An Introduction to LDAP[EB/OL].
http://ldapman.ogr/articles/intro_to_ldap.html, April 2000.
[4] 王艳峰,王峰,王恩海.网格资源描述与发现[EB/OL].
/grid/paperppt/get/get08.ppt,November 2002.
[5] 朱莹.基于分类元数据的网格资源描述和发现研究[D].南
京工业大学硕士学位论文,2006.
[6] 马燕.基于网格社区的教育资源管理研究[D].西南大学博
士学位论文,2008.
[7] 朱凌.基于资源类型的P2P网格资源分层发现模型与算法
研究[D].浙江工业大学硕士学位论文,2008.。

相关文档
最新文档