关于地理编码几个问题的思考
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
笔者以为, 就广义的地理编码概念而言, 它 基 本 内 涵 是 对 地 理 对 象 进 行 空 间 位 置 标 识 、计 算 和处理的过程, 这里的地理对象可以是具有一定 地理意义和实用意义的地理实体( 如某大厦) 、地 理要素类、地理区域和范围( 如行政 区 域 、街 道 、 影像象素等) 等。地理编码通过对地理对象在确 定的参考系中按一定的规则赋予唯一的和可识 别的代码, 从而唯一的确定地理对象的空间位 置, 也就是说建立地理对象与代码之间的映射关 系, 它可以是地理对象与地址的映射, 也可以是 地理对象与坐标系统的映射。而就较为狭义的地
[ 关键词] 地理编码; 地址编码; 地理格网; 基础地理信息
[ 中 图 类 分 号 ] P204
[ 文献标识码] B
[ 文 章 编 号 ] 1007- 3000( 2007) 02- 3
经过十几年的不懈努力, 我国已基本建立了 国家、省和城市多层级、多 尺 度 和 多 种 数 据 构 成 的基础地理信息数据库, 生产和更新了海量的以 4D 为 主 体 的 基 础 地 理 信 息 数 据 及 其 数 据 产 品 。 随着 GPS、GIS、数字地图、车载导航、网上地图和 其他信息技术的发展和应用, 基础地理信息共享 和 服 务 领 域 将 不 断 扩 大 。 如 何 提 供 更 好 的 、更 加 广泛基础地理信息应用和服务, 已成为目前和今 后一段时间需要我们努力解决的问题, 这也是建 立信息化测绘体系的主要内容之一。
56
·北京测绘·
2007年第 2 期
分类与代码, 增加地理实体类, 在属性数据中加 入地址信息等, 对基础地理信息数据进行再组织 和再加工, 实现面向地理实体的地址编码数据。 笔者以为这可以成为地理编码的另一种方法。
( 2) 在地理编码的三个要素中, 地理对象决 定着参考系统的采用和编码规则的确定, 也决定 着地理编码采用的方法。地理对象应尽可能只是 一种, 或者是地理实体, 或是地理区域, 多种地理 对象同时进行地址编码时, 会因为地理概念、地 理区域与实体在空间的关系中的相关性等产生 问题, 影响地址编码规则的实现。
[ 4] 李琦, 罗志清等.基于不规则格网的城市管理格网体 系和地理编码[ J] .武汉大学学报 信息科学版, 第 30 卷 第 5 期, 2005.5。
Consider ing on Some Questions of Geocoding
XUE Ming1, XIAO Xue- nian2
( 1. Shannxi Geomatics Center of SBSM, 2. Research Institute of Standardization SBSM )
3 几点认识
( 1) 尽管通常的基础地理信息也是广义上的 地理编码过程的实现, 虽然它是面向地理信息类 的数据组织, 但在基础地理信息中也直接或间接 的包含一定的地址信息, 基础地理信息分类中也 包含着大量具有地理实体意义的类, 也与目前地 址编码实例中地理实体的分类具有较多的相同 和 相 近 。 我 们 可 以 通 过 扩 展 、补 充 基 础 地 理 信 息
参考文献
[ 1] 江州, 李琦. 地理编码(Geocoding)的应用研究[ J] . 地 理与地理信息科学, 第 19 卷 第 3 期, 2003.5;
[ 2] 刘颖.地理信息系统的建立?.黑龙 江 气 象 [ J] , ??1995 年;
[ 3] 沈 汀.基 于 INS/GPS 数 据 的 机 载 SAR 图 像 地 理 编 码 系 统 研 究 [ J] . 电 子 与 信 息 学 报 , 第 23 卷 第 1 期 , 2001.1?;
KeyWor ds: Geocoding; address- coding; Geo- girde; fundamental geographic information
( 上接第 58 页)
据是以电子文件形式进行了备份, 所以可以重复通 讯使用, 不必多次重复手工输入, 提高了工作效率。
5 结束语
( 3) 明确最小地理对象( 或称最小地理单元ຫໍສະໝຸດ Baidu 的划分, 对于地理编码的实现也具有不可忽视的 作用, 试想以城市管理的每一个部件( 一个信箱、 信号灯等) 作为最小地理对 象 和 以 街 道 、单 位 为
最小地理对象的地理编码将会存在很大的不同。 最 小 地 理 对 象 尽 可 能 不 可 再 分 、 相 互 不 重 叠 、或 在一个工作平面上可以连续分割空间且不交叉 应该是最小地理对象划分的基本原则。
54
·北京测绘·
2007年第 2 期
关于地理编码几个问题的思考
薛明 1, 肖学年 2
( 1、国家测绘局陕西基础地理信息中心, 陕西 西安 710054; 2、国家测绘局测绘标准化研究所, 陕西 西安 710054)
[ 摘 要] 讨论了地理编码的内涵、地理编码方法和相关的几个问题, 提出了一些思考和看法。
[收稿日期] 2007- 05- 08 [作者简介] 薛明(1968- ),女,汉族,陕西西安人, 高级工程师, 主要从事地理信息理论与技术研究, 网站管理。
2007年第 2 期
·北京测绘·
55
理编码概念来说, 它的内涵也就是目前常用的定 义, 即地理编码( Geocoding) 又称为地址匹配( ad- dress- matching) , 指建立地理位置坐标与给定地 址一致性的过程, 也是指在地图上找到并标明每 条地址所对应的位置。这里的地址已较为明确的 指代为街道地址、行政区域 等 , 其 地 理 对 象 也 明 确为地理实体。
( 2) 地理实体地址编址的地理编码 这种地理编码采用地理实体与地址建立直 接关联的方法, 建立地理实体的地址属性。它是 针对地理实体的一种传统意义上的地理编码, 它 将 地 址 、门 牌 、建 筑 物 名 、企 事 业 单 位 名 称 等 空 间 位置的自然语言描述转化为地址编码, 实质就是 建立地理实体与地址( 空间位置) 的一一对应关 系, 也是对地理对象的二维地理位置编码 ( 实 体→地址) 和解码( 地址→实体) 。它一般建立在 基于坐标的空间参考系中。 这种 方 法 应 用 较 多 , 行 业 标 准 “市 政 监 管 信 息化 地理编码”( 征求意见稿) 和北京市地方标准 “北 京 市 地 址 数 据 库 的 建 设 规 范 ” 中 几 是 采 用 这 种编码方式的代表, 尽管它们在编码实现上采用 的具体方法还存在一些不同。文献 4 中所采用的 以地籍为基本单元的不规则格网编码方式, 笔者 以为实质上也应属于地理实体地址编址的地理 编码方法, 只是对象的空间范围相对大一些。 这种方式的优点在于它的编码方式易于被 大家接受, 而且符合人们惯用的思维方式, 推广 容易。缺点在于我国现在的地址使用的不规范性 以及中文地址本身的不规范性和重复性, 使得这 种编码方式存在技术上的难点以及可能存在潜 在的错误及漏洞, 类似地址数据的标准化及其标 准化处理工作量也是非常大的。而且由于我国地 域辽阔, 这种方式由于地址数据的特殊性而存有 一定的地域局限性, 不利于推广。
2 地理编码的方法
一般来说, 地理编码主要有以下两种方式: ( 1) 基于地理格网的地理编码。地理格网是 按一定的数学规则对地球表面进行分割, 形成彼 此邻接又不交叉的多个多边形 ( 四边形、三角 形), 并赋予标识符( 即地理编码), 这些多边形 ( 格网单元) 之间的空间关系是隐含的[4]。 基于地理格网的地理编码采用地理对象与 地址通过格网建立相对关联的方法, 建立地理对 象的地址属性。实质是对地理对象的二维地理位 置编码( 实体→地理位置、格网坐标) 和 解 码 ( 地 理位置、格网坐标→实体) 。其实就是表示地理实 体在地理格网中位置定位信息( 直接指明或者给 定一个大小视地理编码精度而定的范围) , 当建 立格网之后, 地理对象与编码( 格网标识) 之间的 对应关系被唯一的确定了。美国、英国、澳大利亚 等国家就是建立国家格网后以此种编码方式为 社会提供各种地理实体基于位置的服务的。 基于地理格网的地理编码是一种适用性最 广泛的地理编码方法。从地理编码的几个要素来 说, 几乎每一种地理对象都可以采用基于格网的 地理编码方法; 而地理格网本身就是一种基于地 理 标 识 符 的 间 接 空 间 参 考 系 [ 4] 。 这种方法的优点在于定位精确, 精度可以根 据需要较为自由的控制, 例如美国的编码精度可 以控制在 1m- 10km 之内, 特殊应用甚至可以达到
对于具有更加广泛的应用范围的基于空间 位置的信息服务, 以及基于地理空间基础框架的 国民经济各种信息的有效整合等而言, 现有的以 基础地理信息要素类作为地理信息的分类与编 码、数据组织和信息标识的基础地理信息数据, 与应用需求相比存在一定的适用性差别。一方面 国 民 经 济 各 部 门 与 行 业 多 是 根 据 各 自 特 点 、面 向 一定的地理区域和地理实体对象进行信息的组 织 、统 计 和 计 算 ; 另 一 方 面 , 面 对 我 们 生 活 的 环 境, 具有明确名称或地址的地理实体更符合人们 对地理现象的认识和习惯。因此, 应用地理编码 成为一种较为有效的解决方法, 其应用研究也得 到越来越多的重视。而地理编码是一个相对比较 抽象的概念, 对不同的地理编码的对象与实现技 术存在一些不同方法, 本文通过对地理编码认识 与实现中的一些问题的探讨, 提出自己的一些看
法, 为地理编码的应用提供参考。
1 地理编码的内涵
对地理编码的定义和描述目前有以下几种。在 ArcInfo 中对地理编码的定义是指在地理特征中加 入地址属性, 从而通过输入地址即能确定一个空间 位置。在 MapInfo 中, 所谓地理编码是指根据各数 据点的地理坐标或空间地址(如省市、街区、楼层、 房间等), 将数据库中数据与其在地图上相对应的 图形元素一一对应的过程[1]。根据“维基百科”的定 义, 地理编码是将地理坐标( 例如经纬度) 赋予街 道地址还有其他点位和地理特征的过程。有专家 认为地理编码是为识别点、线、面等目标的位置和 属性而设置的编码方法[2]。另外也有专家对完成机 载或星载的原始图像的地理坐标计算和标识, 以确 定图像的位置和方向的过程也成为地理编码[3]。
mm 级别。格网建立以后, 各级之间关系明确、使 用方便。而且格网经均匀裁切, 可以无缝拼接。缺 点在于较难精确记录点状和线状地理实体, 难以 建立地理对象之间的空间拓扑关系。它需要建立 一 整 套 严 密 的 从 大 地 基 准 、参 考 椭 球 、投 影 方 式 、 首 选 格 网 的 规 定 、格 网 原 点 、格 网 划 分 规 则 、格 网 标识编码以及格网精度等各个方面去描述的格网 系统, 需要综合考虑包括确定编码的最小地理对 象或单元在内的多种因素。而且这种方式要由人 们接受和使用, 尚需一定时间的推广和宣传。
Abstr act: The paper describes some question of Geocoding ,include meaning of Geocoding, method of Geocoding and orthe.Some opinions have been bring forward.
通过实践证明, 当放样点数较多或放样相对 集中时, 利用此方法进行坐标放样, 不仅减少了 人为因素的影响, 自动化程度高, 放样点位准确
地理编码的实现应具备几个要素, 一是必须 明确需要编码的地理对象, 地理对象不同则实现 的方法不同; 二是必须有确定的参考系统, 可以是 基于坐标的或是基于地理标识的, 地址就是一种 建立在地理标识参考系下使用自然语言描述地理 位置的参考系统; 三是必须有唯一的编码规则。
同时, 在实现地理编码的过程中我们应该更加 注意的问题在于地理编码也是一种数据组织、数据 模型建立或是已有数据重新组织的过程。它也是一 种地理空间的间接参考系, 是整合多源空间信息资 源的一个重要环节[4], 成为基础地理信息数据作为 空间基础框架整合信息资源的重要手段。
[ 关键词] 地理编码; 地址编码; 地理格网; 基础地理信息
[ 中 图 类 分 号 ] P204
[ 文献标识码] B
[ 文 章 编 号 ] 1007- 3000( 2007) 02- 3
经过十几年的不懈努力, 我国已基本建立了 国家、省和城市多层级、多 尺 度 和 多 种 数 据 构 成 的基础地理信息数据库, 生产和更新了海量的以 4D 为 主 体 的 基 础 地 理 信 息 数 据 及 其 数 据 产 品 。 随着 GPS、GIS、数字地图、车载导航、网上地图和 其他信息技术的发展和应用, 基础地理信息共享 和 服 务 领 域 将 不 断 扩 大 。 如 何 提 供 更 好 的 、更 加 广泛基础地理信息应用和服务, 已成为目前和今 后一段时间需要我们努力解决的问题, 这也是建 立信息化测绘体系的主要内容之一。
56
·北京测绘·
2007年第 2 期
分类与代码, 增加地理实体类, 在属性数据中加 入地址信息等, 对基础地理信息数据进行再组织 和再加工, 实现面向地理实体的地址编码数据。 笔者以为这可以成为地理编码的另一种方法。
( 2) 在地理编码的三个要素中, 地理对象决 定着参考系统的采用和编码规则的确定, 也决定 着地理编码采用的方法。地理对象应尽可能只是 一种, 或者是地理实体, 或是地理区域, 多种地理 对象同时进行地址编码时, 会因为地理概念、地 理区域与实体在空间的关系中的相关性等产生 问题, 影响地址编码规则的实现。
[ 4] 李琦, 罗志清等.基于不规则格网的城市管理格网体 系和地理编码[ J] .武汉大学学报 信息科学版, 第 30 卷 第 5 期, 2005.5。
Consider ing on Some Questions of Geocoding
XUE Ming1, XIAO Xue- nian2
( 1. Shannxi Geomatics Center of SBSM, 2. Research Institute of Standardization SBSM )
3 几点认识
( 1) 尽管通常的基础地理信息也是广义上的 地理编码过程的实现, 虽然它是面向地理信息类 的数据组织, 但在基础地理信息中也直接或间接 的包含一定的地址信息, 基础地理信息分类中也 包含着大量具有地理实体意义的类, 也与目前地 址编码实例中地理实体的分类具有较多的相同 和 相 近 。 我 们 可 以 通 过 扩 展 、补 充 基 础 地 理 信 息
参考文献
[ 1] 江州, 李琦. 地理编码(Geocoding)的应用研究[ J] . 地 理与地理信息科学, 第 19 卷 第 3 期, 2003.5;
[ 2] 刘颖.地理信息系统的建立?.黑龙 江 气 象 [ J] , ??1995 年;
[ 3] 沈 汀.基 于 INS/GPS 数 据 的 机 载 SAR 图 像 地 理 编 码 系 统 研 究 [ J] . 电 子 与 信 息 学 报 , 第 23 卷 第 1 期 , 2001.1?;
KeyWor ds: Geocoding; address- coding; Geo- girde; fundamental geographic information
( 上接第 58 页)
据是以电子文件形式进行了备份, 所以可以重复通 讯使用, 不必多次重复手工输入, 提高了工作效率。
5 结束语
( 3) 明确最小地理对象( 或称最小地理单元ຫໍສະໝຸດ Baidu 的划分, 对于地理编码的实现也具有不可忽视的 作用, 试想以城市管理的每一个部件( 一个信箱、 信号灯等) 作为最小地理对 象 和 以 街 道 、单 位 为
最小地理对象的地理编码将会存在很大的不同。 最 小 地 理 对 象 尽 可 能 不 可 再 分 、 相 互 不 重 叠 、或 在一个工作平面上可以连续分割空间且不交叉 应该是最小地理对象划分的基本原则。
54
·北京测绘·
2007年第 2 期
关于地理编码几个问题的思考
薛明 1, 肖学年 2
( 1、国家测绘局陕西基础地理信息中心, 陕西 西安 710054; 2、国家测绘局测绘标准化研究所, 陕西 西安 710054)
[ 摘 要] 讨论了地理编码的内涵、地理编码方法和相关的几个问题, 提出了一些思考和看法。
[收稿日期] 2007- 05- 08 [作者简介] 薛明(1968- ),女,汉族,陕西西安人, 高级工程师, 主要从事地理信息理论与技术研究, 网站管理。
2007年第 2 期
·北京测绘·
55
理编码概念来说, 它的内涵也就是目前常用的定 义, 即地理编码( Geocoding) 又称为地址匹配( ad- dress- matching) , 指建立地理位置坐标与给定地 址一致性的过程, 也是指在地图上找到并标明每 条地址所对应的位置。这里的地址已较为明确的 指代为街道地址、行政区域 等 , 其 地 理 对 象 也 明 确为地理实体。
( 2) 地理实体地址编址的地理编码 这种地理编码采用地理实体与地址建立直 接关联的方法, 建立地理实体的地址属性。它是 针对地理实体的一种传统意义上的地理编码, 它 将 地 址 、门 牌 、建 筑 物 名 、企 事 业 单 位 名 称 等 空 间 位置的自然语言描述转化为地址编码, 实质就是 建立地理实体与地址( 空间位置) 的一一对应关 系, 也是对地理对象的二维地理位置编码 ( 实 体→地址) 和解码( 地址→实体) 。它一般建立在 基于坐标的空间参考系中。 这种 方 法 应 用 较 多 , 行 业 标 准 “市 政 监 管 信 息化 地理编码”( 征求意见稿) 和北京市地方标准 “北 京 市 地 址 数 据 库 的 建 设 规 范 ” 中 几 是 采 用 这 种编码方式的代表, 尽管它们在编码实现上采用 的具体方法还存在一些不同。文献 4 中所采用的 以地籍为基本单元的不规则格网编码方式, 笔者 以为实质上也应属于地理实体地址编址的地理 编码方法, 只是对象的空间范围相对大一些。 这种方式的优点在于它的编码方式易于被 大家接受, 而且符合人们惯用的思维方式, 推广 容易。缺点在于我国现在的地址使用的不规范性 以及中文地址本身的不规范性和重复性, 使得这 种编码方式存在技术上的难点以及可能存在潜 在的错误及漏洞, 类似地址数据的标准化及其标 准化处理工作量也是非常大的。而且由于我国地 域辽阔, 这种方式由于地址数据的特殊性而存有 一定的地域局限性, 不利于推广。
2 地理编码的方法
一般来说, 地理编码主要有以下两种方式: ( 1) 基于地理格网的地理编码。地理格网是 按一定的数学规则对地球表面进行分割, 形成彼 此邻接又不交叉的多个多边形 ( 四边形、三角 形), 并赋予标识符( 即地理编码), 这些多边形 ( 格网单元) 之间的空间关系是隐含的[4]。 基于地理格网的地理编码采用地理对象与 地址通过格网建立相对关联的方法, 建立地理对 象的地址属性。实质是对地理对象的二维地理位 置编码( 实体→地理位置、格网坐标) 和 解 码 ( 地 理位置、格网坐标→实体) 。其实就是表示地理实 体在地理格网中位置定位信息( 直接指明或者给 定一个大小视地理编码精度而定的范围) , 当建 立格网之后, 地理对象与编码( 格网标识) 之间的 对应关系被唯一的确定了。美国、英国、澳大利亚 等国家就是建立国家格网后以此种编码方式为 社会提供各种地理实体基于位置的服务的。 基于地理格网的地理编码是一种适用性最 广泛的地理编码方法。从地理编码的几个要素来 说, 几乎每一种地理对象都可以采用基于格网的 地理编码方法; 而地理格网本身就是一种基于地 理 标 识 符 的 间 接 空 间 参 考 系 [ 4] 。 这种方法的优点在于定位精确, 精度可以根 据需要较为自由的控制, 例如美国的编码精度可 以控制在 1m- 10km 之内, 特殊应用甚至可以达到
对于具有更加广泛的应用范围的基于空间 位置的信息服务, 以及基于地理空间基础框架的 国民经济各种信息的有效整合等而言, 现有的以 基础地理信息要素类作为地理信息的分类与编 码、数据组织和信息标识的基础地理信息数据, 与应用需求相比存在一定的适用性差别。一方面 国 民 经 济 各 部 门 与 行 业 多 是 根 据 各 自 特 点 、面 向 一定的地理区域和地理实体对象进行信息的组 织 、统 计 和 计 算 ; 另 一 方 面 , 面 对 我 们 生 活 的 环 境, 具有明确名称或地址的地理实体更符合人们 对地理现象的认识和习惯。因此, 应用地理编码 成为一种较为有效的解决方法, 其应用研究也得 到越来越多的重视。而地理编码是一个相对比较 抽象的概念, 对不同的地理编码的对象与实现技 术存在一些不同方法, 本文通过对地理编码认识 与实现中的一些问题的探讨, 提出自己的一些看
法, 为地理编码的应用提供参考。
1 地理编码的内涵
对地理编码的定义和描述目前有以下几种。在 ArcInfo 中对地理编码的定义是指在地理特征中加 入地址属性, 从而通过输入地址即能确定一个空间 位置。在 MapInfo 中, 所谓地理编码是指根据各数 据点的地理坐标或空间地址(如省市、街区、楼层、 房间等), 将数据库中数据与其在地图上相对应的 图形元素一一对应的过程[1]。根据“维基百科”的定 义, 地理编码是将地理坐标( 例如经纬度) 赋予街 道地址还有其他点位和地理特征的过程。有专家 认为地理编码是为识别点、线、面等目标的位置和 属性而设置的编码方法[2]。另外也有专家对完成机 载或星载的原始图像的地理坐标计算和标识, 以确 定图像的位置和方向的过程也成为地理编码[3]。
mm 级别。格网建立以后, 各级之间关系明确、使 用方便。而且格网经均匀裁切, 可以无缝拼接。缺 点在于较难精确记录点状和线状地理实体, 难以 建立地理对象之间的空间拓扑关系。它需要建立 一 整 套 严 密 的 从 大 地 基 准 、参 考 椭 球 、投 影 方 式 、 首 选 格 网 的 规 定 、格 网 原 点 、格 网 划 分 规 则 、格 网 标识编码以及格网精度等各个方面去描述的格网 系统, 需要综合考虑包括确定编码的最小地理对 象或单元在内的多种因素。而且这种方式要由人 们接受和使用, 尚需一定时间的推广和宣传。
Abstr act: The paper describes some question of Geocoding ,include meaning of Geocoding, method of Geocoding and orthe.Some opinions have been bring forward.
通过实践证明, 当放样点数较多或放样相对 集中时, 利用此方法进行坐标放样, 不仅减少了 人为因素的影响, 自动化程度高, 放样点位准确
地理编码的实现应具备几个要素, 一是必须 明确需要编码的地理对象, 地理对象不同则实现 的方法不同; 二是必须有确定的参考系统, 可以是 基于坐标的或是基于地理标识的, 地址就是一种 建立在地理标识参考系下使用自然语言描述地理 位置的参考系统; 三是必须有唯一的编码规则。
同时, 在实现地理编码的过程中我们应该更加 注意的问题在于地理编码也是一种数据组织、数据 模型建立或是已有数据重新组织的过程。它也是一 种地理空间的间接参考系, 是整合多源空间信息资 源的一个重要环节[4], 成为基础地理信息数据作为 空间基础框架整合信息资源的重要手段。