并行空间分析算法研究进展及评述概要

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第27卷第6期2011年11月地理与地理信息科学

G e o g r a p h y a n d G e o -I n f o r m a t i o n S c i e n c e V o l .27N o .6

N o v e m b e r

2011收稿日期:2011-05-18;修订日期:

2011-08-22基金项目:

江苏高校优势学科建设工程资助项目;国家基础科学人才培养基金能力提高项目(J 0830518作者简介:王结臣(1973-,男,博士,教授,主要从事地理信息系统理论与应用研究。E -m a i l :h o t m a i l w a n g

@y a h o o .c o m.c n 并行空间分析算法研究进展及评述

王结臣,王豹,胡玮,张辉

(南京大学地理信息科学系,江苏南京210093

摘要:作为G I S 的核心功能之一,空间分析逐步向处理数据海量化及分析过程复杂化方向发展,以往的串行算法渐渐不能满足人们对空间分析在计算效率、性能等方面的需求,并行空间分析算法作为解决目前问题的有效途径受到越来越多的关注。该文在简要介绍空间分析方法和并行计算技术的基础上,

着重从矢量算法与栅格算法两方面阐述了目前并行空间分析算法的研究进展,

评述了在空间数据自身特殊性的影响下并行空间分析算法的发展方向及存在的问题,探讨了在计算机软硬件技术高速发展的新背景下并行空间分析算法设计面临的机遇与挑战。关键词:并行计算;空间分析;并行G I S

中图分类号:P 208文献标识码:A 文章编号:1672-0504(201106-0001-05

空间分析是G

I S 的核心功能之一,也是G I S 区别于一般信息管理系统的显著特征之一。作为衔接空间数据处理与应用模型的重要部分,空间分析通过对原始数据的特征观察、分析和处理,获得更多的

经验和知识,并以此作为空间行为的决策依据[

1]

。在G I S 应用迅猛发展的今天,G I S 空间分析已成为处理地理科学领域中各种地理对象分析的重要方法。然而,随着应用的深入,数据海量化、构架网络化、处理实时化等要求日益提高,对空间分析功能在计算效率、

性能、处理能力等方面的要求也越来越高。并行计算是将一项大的数据处理与数值计算任务(或任务的局部分解为多个可相互独立、同时进行的子任务,并通过这些子任务相互协调的运行,实

现快速、

高效的问题求解[2]

。近年来网络、高性能计算机、多核计算机等的推广应用为其提供了硬件支撑,并行算法等理论技术的发展为其提供了软件、理论支撑,这些技术已开始应用于包括G I S 应用在内的诸多领域。然而,

由于并行技术发展时间不长,因此G I S 核心空间分析功能的并行化也处在发展初期。为了较好地认识并行计算技术对改进空间分析算法的作用,本文在简单介绍并行计算方法的基础上对并行空间分析算法作了综合性的回顾与探讨。

1并行计算方法

并行计算是计算数学与新一代计算机相结合的产物,其主要研究内容包括并行计算机、并行算法、并行程序设计和并行应用等。相比于串行计算,并行计算有其明显的特点:多个处理器执行部件(执行

核协作,共同完成某一项任务,各个执行部件的处理工作可分布在相同的计算机上(M P P /S M P /多核处理器,也可分布在不同的计算机上。理论上,并行计算具有将计算能力从单个处理器无缝扩展到无

限多个处理器的潜力[

3]

。大量计算任务被分配到多个分处理器上将获得更快的处理速度,

其巨大的数据计算和处理能力优势使并行计算成为计算机领域的研究热点之一。在并行计算方面,

并行体系结构、并行软件和并行算法三者缺一不可,其中并行算法是并行计算的核心和瓶颈技术。

并行算法是指在各种并行机上求解问题和处理数据,其本质是把多任务映射到分处理机中执行,或将现实的多维问题映射到具有拓扑结构的多处理机上求解。为了尽可能实现计算的高效率,

并行算法需通过增加单位时间的算法复杂性来减少整体的时间复杂性,达到将时间复杂性转化为空间复杂性的目的。并行算法经过多年的发展,目前已形成一些基本设计方法,

常见的并行计算策略有分治策略、平衡树方法、倍增技术、流水线技术及加速级联策

略[4]

。此外,为便于并行算法的设计与理论分析以

及为并行计算提供软硬件系统设计的简易界面,近30年来,针对不同类型的并行计算机提出了多种并行计算模型,如P R AM 及其改进模型、V L S I 和B S P

模型等,以及与网络并行计算密切相关的C 3和L o g

P 模型。其中,P R AM 是广泛使用的抽象并行计算模型,B S P 模型提供了简单和可定量分析程序运

行时间的成本函数,C 3

和L o g

P 模型考虑了通信和同步等因素,形成了更贴合实际的并行计算模型[

5]

2并行空间分析方法

并行空间分析方法是G I S空间分析方法与并行计算的结合,致力于通过空间分析算法的并行化解决空间数据处理的速度与质量问题。G I S数据具备空间信息容量大、地理分布广、时效性强、多源异构等特征,为了有效组织多源的相关数据进行综合分析,以建立响应速度快、计算能力强和空间数据高效组织与管理的新机制来认知、模拟、预测和调控自然地理环境和社会经济过程,客观上要求大力发展空间分析并行计算方法。另外,大力发展并行空间分析方法也有主观上的可行性。其一,网络并行、多核处理器、可视化并行编程及分布式G I S等技术的发展,为空间

分析的并行计算提供了条件;其二,以往对空间分析算法的改进多通过建立空间索引、数据分组、高速缓冲技术、数据结构优化及其他组合优化技术来提高算法性能,这些方案中大多渗透着并行计算中常用的分组、分治等思想,利于算法的并行化。

此外,并行空间分析还要考虑G I S的特殊性,其影响主要包括:1算法因素:G I S 中并非所有的空间应用及其关键算法均可实现并行化,这受限于空间应用算法本身的特征。2数据因素:包括空间数据的复杂程度、相关性程度和数据量大小等。3实现因素:已有的并行化算法设计与实现大多是基于M I M D并行计算机系统,使用P VM或M P I并行计算软件,而空间数据模型的并行特征将着眼于空间数据模型本身

相关文档
最新文档