GIS空间数据不确定性与质量控制的研究现状
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
)*** 年 - 月在香港召开了国际空间数据质量 研讨会 $ 参加会议的有来自中国 、 美国、 英国、 德国、
日本、 加拿大、 澳大利亚等十几个国家和地区的近
$#$
测
绘
工
程
第 !" 卷
!"" 名专家和学者。会议总结了目前 #$% 空间数据
质量不确定性研究的最新成果, 它代表了目前这一 领域的研究现状。归纳起来有如下几个主要方面:
!"# 已经发展成为一种产业。与其它工业产品 一样 $!"# 产品也必须有质量管理和质量控制。为 此 $ 美国数字制图数据标准委员会 (%&’&’#) 制定 了数字制图数据标准 (蒋景瞳等译 ( 美国国家数字 制图数据标准 $ 测绘出版社 $)**+ ) $ 对数字制图的数 据质量做了规定 $ 我国国家测绘局也制定了有关质 量标准 (国家测绘局 ( 数字地形图产品质量标准 $ 讨 论稿; 李佐清 (“ 数字地形图产品质量标准” 编写说 明) $ 论述了 !"# 数据库开发项目的质量控制方法 $
行了卓有成效的研究。 所以本主题依然是一段时间 内的研究热点, 并将会把研究成果在 #$% 软件平台 上模块化。 在这一主题的研究中, #55+<=1-+ 基于数 理统计原理, 总结和发展了全球数据集的不确定性 模型,认为不确定性模型研究将受来自数据质量、 数据处理方法以及用户对数据质量接收程度的挑 战; 85H*.+ I(.(J19 等研究了通过图形简化来减小 位置误差的模型; 童小华、 刘大杰等提高和完善了 圆曲线、缓和曲线的误差模型; >=*?K*9 等针对不 同的 #$% 实体给出了不确定性模型; 史文中等在三 维 #$% 中模拟了空间实体的可靠性; A2 C19、 01K19 并采 L2 等采用控制点的高程来估计 D:’ 的精度, 用误差图表示了误差的分布和大小; M=1-19 C1 和陈 军等则从理论和实践两个方面给出了 DN’ 精度的 估计方法, 其中包括误差识别、 误差量测、 误差传 播、 误差管理和减少误差的方法; %)(OO(9 P5<Q 等采 用蒙特 卡 骆 (’59)( >*.-5 ) 模拟法研究了平坦地形
/0(1&230++ 用令人信服的实例说明了不考虑空间
数据误差所带来的严重后果。 第 二 阶 段 二 十 世 纪 八 十 年 代 %"#$ 数 据 的 质 量与不确定性研究,为 "#$ 系统的开发者和用户 所认可并得到真正的重视。 "#$ 数据质量研究的内 容除了继续采用统计学原理建立空间数据的误差 模型之外 % 开始进行影象分类和判读过程中的误差 分析。 比如: “! —误差 !,45 年%6)7*890: 引入著名的 带” ,以后被许多学者发展; !,4; 年 , <277&23), (!,4,) 对空间数据误差 这 一 领 "&&’()*+’ 和 "&=0+ 和 域内的重要研究成果进行了 总 结 ; 607’ (!,45) (!,44) 注意到遥感影象误差分类会导致面积 >0? 估算的偏差; (!,4B) 将 C0==0 系 6&:30+@& 和 /A0’ 数引入遥感 % 用于评判航空象片或卫星象片的解译 结果与验证数据是否一致。 第 三 阶 段 二 十 世 纪 九 十 年 代 以 来 %"#$ 应 用 技术的成熟使得 "#$ 应用范围更加广阔 % 越来越多 的专家和学者开始从事有关 "#$ 空间数据质量与 不确定性的理论研究及其应用。 这一阶段的研究发 展非常迅速%并取得了许多显著成果。 (!44,) 对 "#$ 数据误差的主要来源进 D7&:&EE (!,,5) 对 "#$ 数据采集 行了总结。F)0=0 和 <&88+A7 的一类方法 (直接采集) 和二类方法 (间接采集) 涉 及的数据质量问题进行了讨论。 史文中 (!,,G) 按数 据处理过程分析了数据误差的累计过程 % 把地形图 的误差分为五类 % 即地形图的位置误差、 地形图的 属性误差、 时域误差、 逻辑不一致性误差、 不完整性 误差;他将数据转换和处理误差分为数字化误差、 格 式 转 换 误 差 和 不 同 "#$ 系 统 间 数 据 转 换 误 差 ; 利用 "#$ 数据进行各种应用分析时的误差 % 又分为 数据层叠加时的冗余多边形误差和数据应用时由 应用模型引起的误差。 由于地图数字化方法成为建立 "#$ 空间数据 库的重要方法 % 因而许多学者在地图数字化数据的 误差来源、 误差性质、 误差模型以及数字化误差对
&)数据质量信息包含的内容和表达 #$% 空 间 数 据 是 一 个 #$% 应 用 系 统 可 Biblioteka Baidu 运 行
的保证。从数据作为产品的角度来看, 应该对空间 数据的质量有一个恰当的描述,也称为质量信息, 用户可以根据质量信息来选择适合自己应用范围 和应用质量要求的数据产品。 这一研究内容包括质 量信息的分类以及包含的内容、质量信息的获取、 质量信息的组织管理和元数据 (’()*+*)* ) 对质量 信息的表示等。例如 ,*-+(./ 等分析质量应该具有 的内容,以及与已有数据标准和规范之间的关系;
"#$ 空间要素的影响方面进行了实验和理论研究。 如 <&+8@0’ (!,,H) 研究了手工数字化的统计性质 % 通 过实验分析 % 得出了手工数字化误差的统计分布与
正态分布有显著差异的结论:史文中、刘文宝 (!,,;) 、 朱光、 张宝钢 (!,,;) 等应 用 时 间 序 列 分 析 方法初步探讨了地图曲线数字化误差的性质; 童小 华、 刘大杰 (!,,4) 等通过实验和统计检验方法进一 步分析了数字化误差 % 认为其统计分布不一定是正
介绍了过程控制表和流程跟踪的管理手段。
,
!"# 空间数据不确定性和质量控制研究 现状
!"# 数 据 质 量 与 不 确 定 性 的 研 究 是 目 前 !"#
比较重要的基础理论之一。 从手工数字化数据采集 质量到扫描数字化数据质量 $ 从矢量数据误差模型 研究到影象数据分类和分析质量研究 $ 从空间位置 数据质量研究到空间属性数据质量研究 $ 从数据误 差传播分析到数据误差模型的可视化 $ 从模拟数据 不确定性分析到批量数字产品生产的质量控制和 抽样检验等的变化可以看出 $!"# 数据质量不确定 性研究的对象越来越广、 内容越来越多。
收稿日期: $%%%,*%,*( 作者简介: 刘大杰 [*&.%\ A, 男, 同济大学教授, 博士导师。
!"# 空间数据不确定性和质量控制研究 的几个阶段
!"# 空间数据质量与不确定 性 研 究 的 发 展 可
以分为三个阶段: 第 一 阶 段 在 !"# 诞 生 不 久 的 二 十 世 纪 六 七 十年代,人们在开发 !"# 作为数字制图的许多工 具时, 发现为了取得好的商业利润就必须注意 !"# 的质量问题。当时 !"# 数据质量的研究主要采用 数理统计学的原理对制图和图形操作运算的质量 与精度进行分析。如: 在六 L?5G523 和他的同伴们, 十年代初首先采用统计学讨论分析制图的问题; 在
!"# 空 间 操 作 运 算 方 面 , *&+& 年 =Q91G17 建 立 了 一 个拓扑匹配误差的公式; *&-/ 年, #M5;R89 提出了一 种估计从矢量到栅格数据转换精度的方法; *&-(
第!期
刘大杰等: "#$ 空间数据不确定性与质量控制的研究现状
L-L
年 %"&&’()*+’ 给 出 了 检 验 多 边 形 叠 置 过 程 中 产 生 的无意义多边形的统计量运算。尤其是在 !,-. 年%
*
!"# 的空间数据是基础;非空间数据是内涵, 是地理单元的纵深描述。随着 !"# 产业的兴起和 发展, !"# 的建立及其功能的改善,对 !"# 空间数 据质量等基础理论问题提出了更高的要求。 !"# 的 质量主要是指空间数据的质量, !"# 的空间数据主
要来源于直接数字测量系统、遥感与摄影测量系 统、 局域和广域差分 !’# 系统、 手工数字化和扫描 数字化系统等。 !"# 空间数据的不确定性可以看作 是一种广义的误差, 它包括可度量和不可度量的误 差, 也包括数据值和概念上的误差。空间数据的随 机性, 数据与概念的复杂性、 模糊性和不完整性, 都 可以视作不确定性问题的内容。因此, !"# 空间数 据的质量和质量控制的研究与不确定性的研究密
数据采集是空间信息系统项目中最昂贵的部 分。 !"# 系统中数据采集的费用占总项目费 用 的 所以近年来, (%P。 !"# 数据质量问题以及由此产生 的 !"# 数据质量控制技术成为国内外学术界研究 的热点问题之一。 切相关。 既需要应用经典的误差分析与测量平差理 论进行处理和研究, 还需要应用各种新的理论来研 究不确定性的表达、 度量及质量控制方法。
态分布 % 而可能是由正态分布与拉普拉斯分布组合 而成的 IJ 分布%或者是 = 范分布 (!K=K5) 。 数据误 差性质和分布的探讨为 "#$ 空间数据处理方法的 进一步研究打下了良好的基础。 根据空间要素间的几何关系对空间数据进行 几何纠正 % 是削弱系统误差和随机误差影响的有效 方法 % 这种几何纠正通常是按最小二乘平差方法进 行的。刘大杰与孟晓林 (!,,;) 、 童小华 (!,,4) 等对 规则图形数字化数据的最小二乘平差处理方法作 了研究, 提出应用最小二乘平差的残差来给出成果 的精度指标% 为数字化数据质量控制提出依据。 空间目标的位置误差模型 (或称不确定性模 型) 的研究可分为两个部分 % 一是点状目标的误差 模型 % 一是线状目标的误差模型。点状目标的误差 模型在传统的测量中已有较深入的研究 % 如点的误 差传播、 误差椭圆、 误差椭球及点位误差等。 由于线 是 "#$ 的非常重要的目标特征 % 因此对线的误差模 型的研究随着 "#$ 的发展在不断深入。 "#$ 线目标 的误差模型 (或不确定性模型) 主要可分为两种 % 即 置信域模型及线的 ! 带模型。
第 *% 卷 第 * 期
测 绘 工 程
S1GK*%= T1K* L)WK= $%%*
$%%* 年 U 月
VT!"TVVW"T! XQ #6WSVY"T! )TZ L)’’"T!
!"# 空间数据不确定性与质量控制的研究现状
刘大杰, 刘 春
(同济大学 测量与国土信息工程系, 上海 $%%%&$ ) 摘要: !"# 空间数据不确定性和质量控制的研究是 !"# 基础理论问题研究中的一个重要内容。文中具体介绍 了对该问题研究的几个阶段, 对目前这一理论问题的研究现状作了简要介绍, 并对 !"# 数据质量控制的策略提出 一些看法。 ;空间数据质量;不确定性 关键词: 地理信息系统 (!"# ) 中图分类号: ’$%( 文献标识码: ) 文章编号: ($%%* ) *%%+,-&.& %*,%%%+,%/
!"# $%&%’( )* +#(#&,-"./0 )/ 1/-#,%&./%2 )* $3&%.&4 5&%& &/6 7’&4.%2 8)/%,)4 ./ 9:$
!"# $%&’() , !"# *+,!012345 625789:5;<= #>?23>?5 $%%%&$= @>52?A ;<(%,&-%= 0>8 98:8?9B>523 1C D2B89;?52;< ?2E FD?G5;< B12;91G 1C :H?;5?G E?;? 5: B12:5E898E ?: ?2 5IH19;?2; J?:5B ;>819< 52 !"#K #1 :8789?G H>?:8: 1C ;>5: 5::D8 ?98 52;91EDB8E 52 E8;?5G 52 ;>5: ;>8:5:= ?2E ?B;D?G5;< 1C ;>8 ?B?E8I5B 98:8?9B>523 52 !"# 5: J958CG< 35782K L8?2;5I8= C?B523 ;1 ;>8 :;?;D: FD1 1C !"# ?HHG5B?;512= :1I8 1H52512: ?98 HD; C19M?9E 12 ;>8 :;9?;8358: 1C E?;? FD?G5;< B12;91GK >#2 ?),6(= !8139?H>5B 52C19I?;512 :<:;8IN OD?G5;< 1C :H?;5?G E?;?N 62B89;?52;<