网格计算概述与应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

网格计算概述与应用
张海瑞
【摘要】网格计算是一个重要的新领域,是继万维网之后出现的一种新型网络计算平台,目的是为用户提供一种全面共享包括网页在内的各种资源的基础设施,有别于传统的分布式计算.本文定义了这个新领域,详细叙述了网格计算的定义、特点、体系结构和主要功能,分析了网格计算在当今业务中的应用,现状和发展前景.
【期刊名称】《甘肃高师学报》
【年(卷),期】2013(018)002
【总页数】4页(P17-20)
【关键词】网格;网格计算;网格系统;网格应用
【作者】张海瑞
【作者单位】兰州城市学院信息工程学院,甘肃兰州 730070
【正文语种】中文
【中图分类】O6-3
1.引言
网格这个词诞生于90年代中期,用来表示一个为高级科学与工程技术提出的分布式计算基础设施.网格是把整个因特网整合成一台巨大的超级计算机,实现计算资源、存储资源、数据资源、信息资源、知识资源的全面共享.网格被称作是第三代Internet,不仅包括计算机和网页,而且还包括各种信息资源,例如数据库、软件
和各种信息获取设备等,它们连接成一个整体,向用户提供一体化的服务.
网格计算是伴随着互联网而迅速发展起来的专门针对复杂科学计算的新型计算模式.在科学、工程和商业计算领域,有很多问题难以使用现有的超级计算机解决,如需要处理的海量数据资源分布在不同的地理位置,所需的特殊计算和输入输出设备等不是本地的.基于这种情况,网格计算技术被提了出来,它将网络上的各种资源,
包括超级计算机、大规模存储系统、个人计算机、各种设备等组织在一个统一的体系下,从而能够以非常方便的方法解决各种复杂的问题.
网格计算远远超越了传统的计算,从技术层面上来说,网格计算能够构建系统映像来虚拟化分布式计算和数据资源,例如处理能力、网络带宽和存储容量.一位网格
的用户实际上只能看到一个单一的大型虚拟计算机.
2.网格概述
2.1 网格计算的基本概念
网格是把地理位置上分散的资源集成起来的一种基础设施.通过这种基础设施,用
户不需要了解这个基础设施上资源的具体细节就可以使用自己需要的资源.分布式
资源和通信网络是网格的物理基础,网格上的资源包括计算机、集群、计算机池、仪器、设备、传感器、数据,存储设施、软件等实体,此外,这些实体工作时需要的相关软件和数据也属于网格资源.
美国阿尔贡国家实验室的资深科学家、美国著名的网格计算项目Globus的主持人之一Lan Foster,曾在1998年主编过题为《网格:一种新计算的基础设施的蓝图》[1]的一本书.他是这样描述网格:“网格是构筑在互联网上的一组新兴技术,
它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资源、功能和交互性.互联网主要为人们提供电
子邮件、网页浏览等通信功能,而网格功能则更多更强,能让人们透明地使用计算、存储等其他资源.”
网格把用通信手段连接起来的资源无缝集成为一个有机的整体.它给用户提供一种基于国际互联网的新型计算平台,在这个平台上对来自客户的请求和提供资源的能力之间进行合理的匹配,为用户的请求选择合适的资源服务,实现广域范围的资源共享[2].由此,资源共享是网格的根本特征,消除资源孤岛是网格的奋斗目标.
网格中包含主体和客体两种实体.网格主体是网格活动的驱动者,是具有自主活动能力的实体,网格中的活动指令都是由网格主体发出的.网格客体是网格中不能自主活动的实体,是网格活动进行的场所、操作实现的工具.网格客体需要网格主体的驱动才能进行相应的动作.网格系统中还包括表示网格主体和网格客体之间关系的网格策略.网格G可以看成是由网格主体S,网格策略P,网格客体O构成的一个集合 G={S,O,P}.
2.2 网格的分类
网格由于其分布范围广、功能强、用户群数量巨大,其功能也就比较丰富.我们可以从不同的角度出发,对网格进行分类.
(1)按网格客体分类
按照网格客体的不同层次,可将网格分为资源网格、信息网格和知识网格三个从低到高的层次,如图1所示.这里的资源网格包括计算网格和数据网格,它为上层应用提供数据层面的联通和共享.信息网格在网格操作系统之上,为上层应用提供信息的无缝共享.知识网格是网格的高层应用,主要功能是从底层的数据和信息中发掘、处理和应用知识.
图1 基于网格客体的层次分类结构
(2)按网格主体分类
按照主体的分类方法就是把网格分成面向不同应用领域的网格.一般有科学研究网格、地震网格、游戏网格、教育网格、制造网格等许多种,这里不能一一列举.这样分类的网格其服务对象的要求比较集中,都属于专用网格.比如科学研究网格把
一些精密的实验仪器(天文望远镜、粒子加速器和超级计算机等)所产成的数据与广大的用户连接起来,给世界范围内的科研人员提供良好的研究环境.
2.3 网格的特点
基于因特网的网格计算支持属于不同管理域的计算机节点参与计算和资源共享.因此,一个性能优良的网格计算系统必须具备以下特点:
(1)异构性网格可以包含多种异构资源,包括跨越地理分布的多个管理域.构成网格计算系统的超级计算机有多种类型,不同类型的超级计算机在体系结构、操作系统及应用软件等多个层次上可能具有不同的结构.
(2)可扩展性网格计算系统初期的规模较小随着超级计算机系统的不断加入,系统的规模随之扩大.由此可能带来的一个问题是随着网格资源的增加而引起的性能下降以及网格延迟,网格必须能适应规模的变化.
(3)可适应性在网格中,具有很多资源,资源发生故障的概率很高.网格的资源管理或应用必须能动态适应这些情况,调用网格中可用的资源和服务来取得最大的性能.网格计算系统由于地域分布和系统的复杂使其整体结构经常发生变化,网格计算系统的应用必须能适应这种不可预测的结构.
(4)不可预测性动态和不可预测的系统行为.在传统的高性能计算系统中,计算资源是独占的,因此系统的行为是可以预测的.而在网格计算系统中,由于资源的共享造成系统行为和系统性能经常变化.
(5)多级管理域由于构成网格计算系统的超级计算机资源通常属于不同的机构或组织并且使用不同的安全机制,因此需要各个机构或组织共同参与解决多级管理域的问题.
2.4 网格体系结构
网格体系结构就是关于如何建造网格的技术.它给出了网格的基本组成与功能,描述了网格各组成部分的关系以及它们集成的方式或方法,刻画了支持网格有效运转的
机制[3].目前比较重要的网格体系结构有两个,一种是5层沙漏结构,另一种是开放
网格服务结构OGSA(Open Grid Services Architecture).
2.4.1 五层沙漏结构
五层沙漏结构是以协议为中心的模型,它由以下几部分构成,如图2所示.
(1)构造层局部控制的界面.控制局部的资源,向上提供访问这些资源的接口. (2)连接层支持便利的安全的通信.实现相互的通信,定义了核心的通信和认证协议,用于网格的网络事务处理之中.
(3)资源层共享单一资源,实现对单个资源的共享.
(4)汇聚层协调各种资源.
(5)应用层是用户需求的具体体现.在网格操作系统的支持下,网格用户可以使用
其提供的工具或环境开发各种应用系统.
图2 五层沙漏结构
在这种层次结构中,每层都有自己的服务、API(Application Program Interface)和 SDK(Soft Development Kit),或者服务、API和SDK中的部分.上层协议的实
现调用下层提供的功能,网格内的全局应用都通过协议提供的结构调用网格管理软件的功能.
2.4.2 开放网格服务体系结构
开放网格服务体系结构(OGSA)是以服务为中心的模型,它是一个由节点和连线
构成的框[4].
开放网格服务体系结构包含:纤维层、联络层、资源使用层、协作层、应用层共5个层次.其中:纤维层用于远程调用及控制,它是整个网格系统的基础.联络层(Connect ivity Layer)提供查询网格服务、通讯服务和安全控制[5].开放网格服务体系结构的两大技术支撑为网格技术和Web service,它的功能通过服务接口实现.它是目前最新的网格体系结构,被称为下一代的网格体系结构.
3.网格系统的主要功能
3.1 信息管理
3.1.1 网格信息
网格是一个把分布式资源集成起来供网格主体使用的系统,其中客体和主体的数量都很大.把一个主体和合适的客体联系起来需要网格信息管理机构的支持.网格信息管理模块是网格系统的中心模块,是网格中主体和客体联系的纽带,任何网格活动都是基于网格信息管理提供的信息进行的.网格信息管理包括三个类型的角色:信息提供者、信息中介者(broker)、信息请求者.网格资源和用户加入网格时向信息中介者注册自身的相关信息,并在信息发生变化时更新相关信息,注册在中介者处的信息供信息需求者查询.下面将介绍网格信息管理的信息及几种常见的信息管理机制.
网格中的物理资源都经过了虚拟化,隐藏了资源的大部分物理特性,但在资源的实际使用中,用户还是要知道关于资源物理特性的信息,比如处理器的速度、内存空间的大小、操作系统的版本等,以便选择合适的资源.在OGSA网格体系结构出现以后,资源更是被封装为服务提供给用户,网格服务的信息管理更是成为网格信息管理研究的重点.
3.1.2 网格信息管理系统的功能
网格信息管理系统提供信息的提供、获取和管理,其基本功能包括信息注册、信息更新、信息查询、信息注销、信息分发.[6]
信息注册是信息被使用的第一步,信息注册中心是注册信息的存放处,它需要严格的安全措施以保证只有合法的用户才能向其注册真实的信息.注册过程可以由人工驱动,也可以由处于网格管理体系下的应用、服务或设备注册.
信息更新是信息管理的一个基本操作.动态信息需要按一定的规律更新,如周期性更新、超出设定阈值后的更新等.静态信息在注册之后,由于情况的变化也可能需
要删除或者修改等更新操作.
信息查询是信息服务最基本的功能,信息管理系统需要为用户提供良好的查询方式和友好的查询接口.查询结果用于指导网格上的各种活动,如网格服务的发现,就需要根据信息查询等结果,选择合适的网格服务.
信息注销将信息从注册中心撤除,该操作只能由特殊的用户完成,如该信息的注册者、注册该信息时指定的注销者以及网格社区的管理员.当资源拥有者不想将资源向网格用户提供时,他可以注销该资源的信息.但在很多情况下,资源已不可用,但是信息提供者又没有主动注销相应的信息,网格中就会产生大量的垃圾信息,因此需要有垃圾信息处理机制处理这些垃圾信息,提高网格信息服务的性能和信息的准确性.
信息发布完成的任务有两类,一类是把一条信息从一个注册中心发布到可能需要的多个注册中心,另一类是把一条新产生的信息发布到需要该信息的潜在使用者那里.信息的发布方式类似于社会生活中的商品,可以分为两种,一是消费者主动到注册中心发现信息,另一种是向可能的用户推销.
3.2 资源管理
网格资源纷繁复杂、种类多、信息量大,如何有效地管理好网格中的各种资源是一项十分繁杂的工作.资源管理包括资源的发现、描述、定位、注册、分配、监测、更新和信息发布等.
要实现高性能计算和共享异构网格资源,必须提供统一的资源管理机制.统一资源管理模型负责用户与网格计算环境的交互,提供与网格计算系统的统一出入口.要组织网格计算的资源,通常使用单一映象文件系统来实现.单一映象文件系统将地理上分散的异构资源映象成一个单一入口的虚拟机器.目前,构造单一映象文件系统一般使用虚拟目录服务技术,将各种分散的地理资源映射到逻辑的文件系统上.目录服务是指一个存储着用于访问、管理或配置网络资源信息的特殊数据库,它把
网络环境中的各种资源信息(计算资源:IP地址、可使用软件、系统管理者、连续的网络、操作系统名称和版本号、存储系统信息、系统负荷、进程信息、内存信息、任务队列等;网络资源信息:网络带宽、网络协议、网络延迟、网络的逻辑拓扑结等;基础设施信息:主机信息、资源管理者等)都作为目录信息.在目录树结构中分层存储,对这些信息可以存储、访问、管理并使用,它采用动态可扩展的框架来管理网格计算环境中各种资源的静态和动态信息,保证了灵活性和动态性. 3.3 数据管理
3.3.1 网格数据
数据是网格中的一种重要资源,具有可复制、可移动、可压缩、可加密等特性.网格上许多数据的数据量非常大,且通常为分布式存储,需要专门的管理机制来管理网格上的数据,如数据传输、数据存储、副本管理等.
虽然数据也是一种资源,但这种资源与其他网格资源相比,具有一些与众不同的特点:
(1)网格中数据的量是巨大的网格计算,特别是数据密集型的众多科学和工程计算,通常会需要处理大量的数据,如美国宇航局的卫星每天都将处理和生成超过2TB的数据,全球气候变暖模拟实验也产生TB数量级的数据.
(2)数据资源是网格应用或程序之间联系的纽带网格应用领域中的程序需要访问和产生大量的数据,不同的程序之间也需要传输大量的数据,以实现信息的交互和协调的工作.
(3)数据资源具有可无限复制的特点只要通过合法的用户请求,网格数据资源就可以被复制成指定的多个备份.
(4)数据资源具有特殊的存储机制网格中的数据资源可以创建多个副本,并存于不同的地方,用户请求该数据时,网格管理机构在原始数据和多个备份之间选择合适的数据副本供用户使用
3.3.2 数据管理的功能
数据管理是网格系统中重要的模块,它要为网格用户提供透明地共享使用网格上存储资源和数据资源的手段,为用户提供透明地访问、存储、传输和管理数据的界面,使用户能够方便地实现数据共享.
(1)数据实例
网格中的数据可以用数据文件或数据库的形式存在,为了隐藏以不同形式存储的数据的具体细节,提供一个统一的接口,网格中引入了“数据实例”这个新的概念.
数据实例是网格上数据管理的基本单位,它可以是一个数据文件或其中的一部分,也可以是一个数据库或其中的部分数据记录,还可以是数据实例的组合,通过数据实例的属性就可以访问相应的数据.
(2)数据传输
数据传输将数据从源节点传输到目的节点,这是网格数据管理的基本功能之一.用
户作业所需的输入数据、应用运行产生的结果数据、交换运算过程中的中间数据都需要数据传输的支持.将数据下载到本地,然后开始应用是普遍可见到情况,在某
些情况下,如因本地存储空间的限制而不能将所有数据下载到本地后再使用时,数据传输将会更加频繁.数据传输需要满足传输速度、数据完整性、容错性的要求. (3)数据存储
数据存储机制直接影响着数据的访问.通常而言网格数据分布存储在网格中不同资
源的存储介质中,这是因为网格中数据量很大,单个个人或组织所拥有的存储资源容量有限,而且他们拥有的计算资源能力有限,不一定有能力不断处理快速增长的数据,另外分布存储可避免传输带宽的限制带来的问题.网格数据分布存储在不同
位置的不同设备中,并具有不同的特点,数据管理模块为用户提供一个统一的数据视图、统一的访问接口,用户不需要了解数据对象的具体底层实现机制.
4.网格计算的应用
目前除学术机构研究网格技术以外,政府和企业也投入到网格系统的构建和网格计算应用中.网格计算应用范围广泛,涉及科学研究领域和生活领域的各个方面. (1)网格计算在科研领域的应用
在科学研究领域,网格技术可以辅助科学家完成重大领域的科学研究.网格计算技术除具备超级计算能力以外,还将不同地域的资源整合在一起,使科学工作者能够紧密合作,充分利用共享的资源(如大型的昂贵的仪器设备等).网格计算技术在美国,首先是在生命科学领域,正在成为现实.在物理学研究方面,德国Max Planck引力物理研究所与德国和美国多个机构合作,利用网格的超级计算能力,共同完成了模拟黑洞的项目.
(2)网格计算在企业及居民日常生活中的应用
网格计算的商业应用前景广阔.网格计算环境能够提高或拓展企业内所有计算资源的效率和利用率,通过对这些资源进行共享、有效优化和整体管理,使各企业解决以前难以处理的问题,最有效地使用他们的系统,满足客户要求并降低他们计算机资源的拥有和管理总成本.网格计算支持所有行业的电子商务应用.例如,飞机和汽车等复杂产品的生产要求对产品设计、产品组装和产品生命周期管理进行计算密集型模拟.中国国家计算网格简称织女星网格(VegaGrid),该项目前取得的一些研究成果已经开始应用到如税务这样的重要行业.
5.小结
网格计算系统的标准化工作还需要更进一步.现有网格系统虽然在本系统内部实现了分布资源的一致存储和利用,但是网格系统之间的联网还没有统一的标准.仅网格资源的表示,各系统都采取了不同的表示方法.因此,要实现Internet上资源的无缝计算,必须解决跨越网格的问题.
参考文献:
[1]FOSTER I,KESSELMAN C.Grid:Blueprint for a New Computing
lnfrastructure [M].Morgan:Morgan 2Kauf 2man,1998.
[2]FOSTER I,KESSELMAN C,TUECKE S.The Anatomy of the Gr id:Enabling Scalable Virtual Organizations[J].International Journal of Super computer Applications,2001,15(3):200-222.
[3][4]孙培德,胡月仙.网格计算的研究进展及应用前景[J].计算机时代,2003,(1):125.
[5]唐志敏,徐志伟等.网格技术专题[J].计算机研究与发展,2002:39(3):897-980.
[6]罗作民,张景等.网格计算及其关键技术综述[J].计算机工程与应用,2003:30.。

相关文档
最新文档