教育资源元数据目录服务的设计.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教育资源元数据目录服务的设计
摘要随着网络教育资源的急剧增长,如何有效地提供教育资源查找服务,成为一项重要而迫切的研究课题。
教育资源同网格资源一样具有海量、异构、广域分布等特性。
本文基于教育信息共享需求,在一个统一的信息网格资源空间模型基础上,提出了一个元数据层次化结构模型。
介绍了教育资源元数据目录服务的设计,实现教育资源透明访问的目标。
关键词教育资源;信息网格;元数据;资源透明访问;层次化体系结构
中图法分类号TP393
The Design of Metadata Catalog Service about Educational Resources
Abstract With the increase of the amount s of educational resources , it has become an important research issue to provide users with effective service of educational resources search. Unfortunately, traditional information retrieval cannot answer the challenge of the issue , on account of the complex characters of educational resources , such as vast character , distributed character and heterogeneous character. A layered architecture of metadata based on the information grid resource space model is int- roduced to realize the goals of transparently accessing resources. Finally, a metadata catalog service that is designed with this metadata architecture, as well as its application in the design and implementation of educational information grid middleware are introduced.
Key words educational resources; information grid;metadata; transparently accessing resources; layered architecture
1 引言
教育资源是教育信息化和网络教育的基础。
一方面,教育资源分布广、数量大、层次不一;另一方面,教育资源种类繁多,形态各异。
由于各种异质教育资源之间缺乏互操作性,众多资源成为离散、孤立的“信息孤岛”。
在这种情况下,如何有效地提供教育资源查找服务,也就成为一项重要而迫切的研究课题。
传统的检索技术无论从资源覆盖度、检索精度等诸多方面来看,都无法应对海量、异构、广域分布的教育资源查找问题[1]。
于是,需要一种新的资源查找方法帮助用户从大量教育资源的集合中获取想要的资源。
网格技术是近年来逐渐兴起的一个研究热点。
利用网格技术实现信息的共享、管理和信息
服务的系统称为信息网格。
信息网格是要把整个因特网上的各种资源整合成一台巨大的计算机,从而实现海量、异质、广域分布资源共享与协同工作[2]。
因此,可以利用网格技术来解决教育资源查找问题。
目前存在两种网格资源查找方法,一种是采用资源路由表的机制发现和定位网格资源,如中国科学院计算技术研究所的织女星网格[3]。
另一种是基于元数据的资源查找方法。
考虑到目前教育资源元数据规范已经逐渐进入一个相对成熟的阶段,所以本文将采用第2种方法实现教育资源的查找。
2 元数据目录
元数据是描述数据的数据,数据网格中的所有元数据构成了元数据目录,它采用统一的结构来描述元数据。
元数据目录为用户身份认证、数据定位、访问控制、数据复制等提供支持。
元数据可以分为系统元数据(system metadata)、副本元数据( replica metadata)和应用元数据(application metadata)。
系统元数据主要是关于网格自身结构的信息, 比如, 网络互联情况、存储系统的容量和使用策略等。
副本元数据主要是关于数据副本的信息, 比如, 文件与具体存储系统之间的映射信息。
应用元数据主要是关于与具体应用相关的文件的逻辑结构或语义的信息, 比如, 数据的内容和结构、获取数据的必要条件等。
元数据的管理包括元数据的命名、发布和访问,并为用户提供统一的访问接口。
网格中的所有元数据构成元数据目录。
在元数据目录中,应该尽量采用统一的结构来描述元数据,这对于应用元数据而言比较困难,主要是因为不同应用的元数据之间的差别比较大。
目前,关于应用元数据的描述主要有两条途径: 一方面,有关应用领域的科学家对各自领域的元数据的描述进行了详细规定[4];另一方面, 采用XML 语言对应用元数据进行描述。
目前国际上许多国家和地区都成立了专门从事教育信息标准化工作的组织,致力于教育资
源元数据描述规范的研究。
其中, 学习技术标准委员会IEEE LTSC (Learning Technology Standards Committee) 的学习对象元数据模型( learning object metadata ,LOM) 影响较大,是当前最重要的关于教育资源的数据模型。
我国现代远程教育技术标准化委员会就是以LOM为核心,进行了一系列的本地化工作,形成了我国的教育资源元数据规范——《教育资源建设技术规范》[5](以下简称《规范》)。
《规范》规定了教育资源属性标注标准,即呈献教育资源时,所应提供的属性(包括必须属性、可选属性和扩展属性) ,称为教育资源元数据,如资源名称、资源关键词、资源制作者等等。
如下给出XML格式的操作系统课件元数据片断:
〈metadata〉
〈descri ption〉基于MINIX 的操作系统课件
〈/descri ption〉
〈keywords〉操作系统〈/ keywords〉
〈author〉网络学院〈/ author〉
〈publisher〉中南大学〈/ publisher〉
〈learning context〉大学本科〈/ learning context〉
〈coverage〉计算机〈/ coverage〉
〈dif f icul ty〉4〈/ dif f icul ty〉
〈typical learning time〉108 学时〈/ typical learning time〉
┆
〈/ metadata〉
随着应用的不断发展, 网格也在不断发展, 元数据在不断增多, 其结构也日趋复杂。
为了保证在网格规模不断扩大的情况下, 仍然提供高效的元数据服务, 元数据目录应该采用具有良好可扩展性的层次式分布式结构, 这需要构建一个统一的信息网格资源空间模型。
3 元数据的层次化结构模型
为了对信息网格资源的描述、组织、定位、变更以及资源的透明访问等问题进行研究,需要根据信息网格的资源构成特征构建出信息网格资源空间模型。
资源空间模型是用统一的资源视图定义、共享和管理各种Web 资源的模型。
资源空间模型主要体现了以下思想: ①统一的资源抽象;②统一的资源划分和规范;③统一的资源操作;④统一的资源视图。
图2 信息网格元数据的层次化结构模型
资源空间模型包括3 级模式:用户级、逻辑级和语义级。
用户级模式是一个反映在资源浏览器中的二维空间;逻辑级模式是一个反映资源空间统一视图的n 维空间;语义级模式定义基于语义的资源表示和组织机制。
由于信息网格资源空间模型对资源的多层抽象,使得描述信息资源不同抽象形式的元数据也形成一种层次化的结构体系,如图2 所示。
通过信息网格元数据的层次化结构设计,可以比较有效地支持网格系统实现资源透明访问的目标,因为分层描述的思想可以通过不同层元数据之间的转换把资源实现的具体细节封装起
来,使得应用程序可以按照自己熟悉的分类和组合方式对资源进行访问。
4 教育资源元数据目录服务的设计
分布式目录服务能够用来描述网格的结构化特征, 如将散乱的网络拓扑结构隐含统一在目录的层次中, 支持远程目录信息的访问, 以及类似目录结构的、层次递增的信息存储方式。
教育信息网格中间件中元数据目录按照元数据层次化结构体系进行设计,元数据目录服务
在元数据目录基础上为信息集成服务提供资源信息。
资源提供者通过系统提供的接口,主动将资源元数据信息发布到目录服务器上。
系统自动匹配目录服务器上的元数据,发现和定位实际的资源实体,返回给资源需求者。
元数据目录服务逻辑结构,以及与系统其他部分的关系如图3 所示。
图3 教育信息网格元数据目录服务
元数据目录从逻辑上看包括物理层元数据目录、逻辑层元数据资源和视图层元数据目录三个层次,通过这三层目录可以对物理层、逻辑层和视图层元数据进行检索和访问。
元数据目录为应用程序或最终用户呈现出统一的网格资源虚拟视图,而实际的信息访问则
是通过信息集成服务和协议转换器共同完成的,因此元数据目录服务最为重要的作用是实现虚
拟视图到逻辑资源的分解,从逻辑资源到物理资源的转换,而正是由于目录服务所提供的这种转换工作使得教育信息网格能够为最终用户和应用程序提供基于虚拟视图对物理资源进行透明的访问。
下面我们简要介绍基于元数据的教育信息网格资源访问的过程:
(1) 程序开发人员或最终用户在虚拟视图中选择或定制满足应用需要的虚拟视图。
通过信息网
格交互界面提出访问请求。
(2) 信息网格交互界面将带有虚拟视图和查询条件的访问请求传递给信息集成服务。
信息集成
服务将请求解析后发送给元数据目录服务进行处理。
(3) 元数据目录服务根据请求中所引用的虚拟视图名查询虚拟视图目录,获取虚拟视图元数据
值。
然后根据元数据对请求进行合法性检查。
检查正确后,系统根据虚拟视图中的引用情况和其他访问需求分解出相关的业务对象、条件约束、组合规则、安全属性等相关访问信息。
(4) 元数据目录服务查找到所有相关业务对象信息, 根据业务对象和条件约束在业务对象可调
用实体集中选取合适的数据实体集合。
(5) 元数据目录服务获取所有数据实体集以及相关存储系统的所有信息,并将该信息传送到信
息集成服务。
(6) 信息集成服务负责构建本次访问请求的查询任务序列,并通过相应存储系统的封装器将每
一个查询任务传递到存储系统中执行。
(7) 信息集成服务负责调度查询任务,收集所有查询结果,根据组合规则对信息进行集成加工
后返回给应用程序或最终用户。
6 总结
实现信息网格资源的透明访问,描述资源结构、内容、访问方式的元数据非常重要。
但目前大多数研究工作对网格系统中不同元数据类型之间的约束和关联,以及元数据体系的结构设计
并没有提出比较系统化的方法。
我们在信息网格的研究和实践过程中,结合已有网格系统元数据设计思想,在信息网格资源空间模型的基础上,提出了一种元数据层次化结构模型,并将其运用
到教育信息网格中间件系统的设计和实现中。
通过分析和实验发现这种设计方法可以比较有效地帮助信息网格系统实现位置透明、命名透明、异构透明、并行透明和模式变更透明等资源透明访问的目标。
参考文献
1 王继成, 邹涛, 杨小江, 等. 基于Internet 的信息资源发现技术与实现. 计算机研究与发
展, 1999 , 36 (11) : 1369~1374
(Wang Jicheng , Zou Tao , Yang Xiaojiang , etal. The technologyand implementation of resource discovery on Internet. Journal of Computer Research and Development (in Chinese) , 1999 , 36(11) : 1369~1374)
2 Ian Foster , Carl Kesselman , Steven Tuecke1 The anatomy of the grid : Enabling
scalable virtual organizations1 International Journal of Supercomputer
Applications , 2001 , 15 (3) : 200~222
3 董方鹏, 龚奕利, 李伟, 等1 网格环境中资源发现机制的研究. 计算机研究与发展, 2003 ,
40 (12) : 1749~1755
(Dong Fangpeng , Gong Yili , Li Wei , et al1 Research on resource discovery mechanisms in grids1 Journal of Computer Research and Development (in Chinese) , 2003 , 40
(12) : 1749~1755)
4 M Baldonado, C Chang, L Gravano et al. The stanford digital library metadata arch-
itecture. International Journal D igital Libraries, 1997, 1 (2) : 108~ 121
5 全国信息技术标准化技术委员会教育技术分技术委员会. 教育资源建设. http ://
20211201941248 , 2002203215
(Chinese Educational Technology Standardization Committee. Construction of
educational resources ( in Chinese ). http ://20211201941248 , 2002203215)
6 W Yeong, T Howes, S Kille. Lightweight directory access protocol. RFC 1777, 1995.
/rfc/rfc1777.txt
7 [美]A Silberschatz , H F Korth , S Sudarshan , 杨冬青, 唐世渭等译. 数据库系统概
念(第4 版). 北京: 机械工业出版社, 2002
(A Silberschatz , H F Korth , S Sudarshan1 Database System Concepts , Fourth Edition1
Now York : McGraw2Hill , 2002)
8 李伟,徐志伟.一种网格资源空间模型及其应用.计算机研究与发展,2003 ,40(12):1756~1762
(Li Wei , Xu Zhiwei1 A model of grid address space with applications. Journal of Computer Research and Development( in Chinese), 2003 , 40 (12) : 1756~1762)
9 A Rajasekar , R Moore1 Data and metadata collections for scientific applications.
European High Performance Computing Conf , Amsterdam , Holland , 2001
10 孙霞,郑庆华.教育资源元数据语义扩展查找方法的研究.计算机研究与发展,2004,41(12):
2170~2174
(SUN Xia and ZHENG Qing-Hua. Educational Resources Search Based on Metadata
Expanded Semantically. JOURNAL OF COMPU TER RESEARCH AND DEVELOPMENT,
2004,41(12):2170~2174)
11 廖华明,程伯羽,刘新周,虎嵩林,刘欣. 信息网格中元数据层次化结构模型的研究和应用.
计算机研究与发展,2003,40(12):1694~1699
(LIAO Hua-Ming , CHENG Bo-Yu , LIU Xin-Zhou , HU Song-Lin , and LIU Xin. Research on a Layered Architecture for the Metadata with Applications in Information Grid.
JOURNAL OF COMPU TER RESEARCH AND DEVELOPMENT, 2003,40(12):1694~1699)
12王意洁,肖侬,任浩,卢锡城. 数据网格及其关键技术研究. 计算机研究与发展,2002,39(8): 943~947
(WANG Yi-Jie, XIAO Nong, REN Hao, and LU Xi-Cheng. RESEARCH ON KEY TECHNOLOGY IN DATA GRID. JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT,2002,39(8): 943~947) 13 查礼,徐志伟,林国璋,刘玉树,刘东华,李伟. 基于LDAP 的网格监控系统. 计算机研究与发
展,2002,39(8):930~936
(ZHA Li, XU Zhi-Wei, LIN Guo-Zhang, LIU Yu-Shu, LIU Dong-Hua, and LI Wei. A LDAP BASED MONITORING SYSTEM FOR GRID. JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT, 2002,39(8):930~936)。