海洋地理信息系统
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1卷第1期计算机学报Vol. 1 No. 1 2015年5月CHINESE JOURNAL OF COMPUTERS 5. 2015
空间抽样方法在海洋地理信息系中的研究
郑宗生徐首珏
(上海海洋大学信息学院,上海201306)
摘要海洋大数据的真实、可靠,对于掌握海洋环境情况、有效监测和维护具有十分重要的作用。运用传统的抽样方法来对海洋数据质量进行检测变得尤为困难。因此,针对海洋空间数据空间位置不准确、空间数据采集多源、空间数据格式多样性、空间数据逻辑不一致等特点,本文对空间抽样的方法做了总结与讨论。
关键词空间抽样方法;系统抽样方法;空间相关性;灰度共生矩阵
The Research of Spatial Sampling Method in Marine Geographic
Information System
ZHENG Zongsheng XU Shoujue
(College of information, Shanghai Ocean University, Shanghai 201306)
Abstract The trueness and reliability of ocean big data take a greatly important role in the master of the marine environment and the effective monitoring and maintenance. It is particularly difficult to use traditional sampling methods to detect marine data quality. This paper summarizes and discusses the spatial sampling methods used in the ocean big data which has the feature of inaccurate in spatial location, multi-source in spatial data collection, diversity in spatial data format and inconsistent in spatial data logicality.
Key words spatial sampling method; systematic sampling method;spatial correlation
2016年5期1引言
抽样调查是海洋探索、资源评估、环境检测等问题研究的重要手段。以简单随机抽样、分层随机抽样、系统抽样和整群抽样为核心的经典抽样调查方法已广泛应用于社会、自然、经济、人文等各个领域,其理论体系建立在样本完全独立的前提条件下[1、2]。空间抽样方法是对具有空间相关性的各种资源与监测对象进行抽样设计的基础。在几大经典抽样方法的基础上,王劲峰等人针对地理空间进一步探索了分层抽样方法,更提出了三明治抽样模型。
然而,对于海洋分布的各种资源,由于海洋大数据多为空间数据,具有空间相关性,又存在着空间位置不准确、空间数据采集多源、空间数据格式多样性、空间数据逻辑不一致等数据质量问题,因此运用传统的抽样方法来对海洋环境检测变得尤为困难。
针对海洋空间数据的特点,本文以经典抽样方法为基础,分析适合海洋环境数据质量检测的空间抽样方法,同时指出改领域研究所面临的主要问题。
2 空间抽样的发展
1895年,在瑞士伯尔尼举办的国际统计学会(ISI)第五届大会上,挪威统计学家凯尔(A.N.Kiaer)提出用代表性样本方法来代替全面调查,被认为是抽样调查历史的开端。经过一百多年的研究,抽样调查已形成为一门成熟的统计学分支学科,
随着我国经济体制从计划经济向社会主义市场经济的转变以及统计制度的深化改革, 20 年多年来,抽样调查作为统计调查的一种重要方法及获取统计资料的重要手段,日益受到政府各部门、企业、学术界与社会公众的重视,它的应用无论从广度还是深度都有了极大的发展[6]。
地统计学最早是矿物学家D.R.krige 将其应用于南非金矿的查找,这个方法是由Matheron 提出来的[1, 2]。七十年代提出了托普勒第一定律:任何事物之间都有相关性,相距近的事物比相距远的事物之间更加相关[3],对这种相关性的研究和量化构成了空间统计理论的基础,一大批学者对空间相关性和空间变异等问题做了大量的研究,奠定了空间统计、空间数据分析的基础,基于样本不独立假设的空间抽样调查技术得以迅速发展,在生态、海洋、渔业、林业、农业、人口健康调查、环境、土壤以及水资源等方面得到了广泛的应用。在国内,绝大多数抽样调查都是基于经典抽样,王劲峰研究员及其所带领的研究团队是较早地开
2016年5期
展空间抽样技术方面研究的学者,也有学者在土地调查抽样设计时考虑了空间结构。
传统抽样中,抽样对象一般不具有空间位置概念。在抽样时,每个对象被分配一个编号以便于区别不同的抽样对象。但是对换任意2 个编号对象,并不影响抽样结果。空间抽样和传统抽样技术最大的差别就在于,空间抽样调查对象具有地理空间坐标,并且如果改变空间对象的位置,则改变了抽样调查总体,影响抽样调查结果。空间抽样调查对象的地理空间坐标和属性值共同构成标识空间对象的二个特征属性。空间抽样理论对这二个属性之间关系进行研究。下面将介绍空间抽样涉及的几个问题。3.空间抽样的研究现状
3.1国内空间抽样方法研究
李连发提出了空间抽样框架,以及如何在地理数据上进行抽样调查的一整套方法和理论,阐述了空间的抽样设计思想,同时充分利用之前的各种资料,结合空间特征,确定样本大小。其关键思想是在抽样中考虑了空间数据的相关性,并且利用公式量化相关性,提高了抽样的效率。牛文杰提出了基于先验信息的kriging 方法研究,这种方法利用了原有的目标相关信息,这种信息相对精度较低,但是能够反映目标的趋势变化。王劲峰提出“三明治” 空间抽样模型。这种
模型利用了抽样对象在空间上的变异特征,考虑了自然和资源环境领域研究调查中数据具有相关性的特点。同时根据抽样对象特征进行分层,采用分层抽样。但是在最后结果表达时,通过均值和误差传递,能够在调查者感兴趣的区域内汇报结果。这种方法既利用了抽样对象的自然属性,也考虑到了实际工作中需要根据行政区域汇报统计结果的现状,为此类问题提供了一个很好的解决方案。
赵雪慧介绍了小区域估计方法及其发展现状[5],分析了实际调查抽样中如何设计和调查采用的方法,提出在抽样中,要注意整体考虑抽样误差,而不仅仅是抽样方法的误差。其提到的小区域抽样是一种新的估计方法,从本质来说,还是将类似的观测数据放到一起考虑,考虑某种程度上的一致性。赵宪文研究组从利用遥感进行林业调查的角度探讨了样本分布、样本大小与林业调查结果精度的关系[6]。
3.2国外研究现状
随着地理空间事物普遍存在自相似性及其相关理论的深入研究,样点选择的研究已逐渐由专家知识主观指定过渡到通过优化决策模型自动选择。这可以有效保证其科学性,即对同一片调查区域的多次采样,其结果具有某一置信水平的可比性(专家的主观判断不具有这一特性),基于优化决策支持的样本设计可以有效避免基于主观判