地理实体编码技术与方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、地理编码技术与方法——注意的问题
1、一种地理对象 在地理编码的三个要素中, 地理对象决定着参考系统的采用和编码规 则的确定, 也决定着地理编码采用的方法。地理对象应尽可能只是一 种, 或者是地理实体, 或是地理区域, 多种地理对象同时进行地址编码 时, 会因为地理概念、地理区域与实体在空间的关系中的相关性等产 生问题, 影响地址编码规则的实现。 2、明确最小地理对象 明确最小地理对象( 或称最小地理单元)的划分, 对于地理编码的实现 也具有不可忽视的作用, 试想以城市管理的每一个部件( 一个信箱、 信号灯等) 作为最小地理对象和以街道、单位为最小地理对象的地理 编码将会存在很大的不同。最小地理对象尽可能不可再分、相互不重 叠、或在一个工作平面上可以连续分割空间且不交叉应该是最小地理 对象划分的基本原则。
三、地理实体编码存在的问题
国家《地理实体数据规范》中指出: 地理实体数据使用地理实体标识码、图元的标识码、
信息分类码三类编码。 编码时,尽量采用已有国家标准或行业标准,必要时
地理对象:地理实体、地理要素类、地理区域和范围等。 地理对象在确定的参考系中按一定的规则赋予唯一的、可 识别的代码,唯一地确定地理对象的空间位置,建立地理 对象与代码之间的映射关系,它可以是地理对象与地址的 映射,也可以是地理对象与坐标系统的映射。
二、地理编码技术与方法
地理编码技术:编码、解析、地址匹配 (1)编码的基本规则和编码方式; (2) 智能语义解析算法,智能化中文地址模糊匹配算法 实现自然语言的地址和标准地址编码数据库的智能 匹配,获得最精确的地理编码和地理坐标; (3) 编码器、解析器和匹配器 根据编码方案规则或者是既有标准进行地理编码; 根据编码规则对输入的实体进行解析; 根据地理编码去识别、定位、寻址等。
ElemID:0001 ClasID: DataVersion: LifeCycle:
EntiID:230101 Name:**县
EntiID:G102000000 Name:京哈线
ElemID:0003 ClasID: DataVersion: LifeCycle:
ElemID:0003 ClasID:420100 DataVersion: LifeCycle:
一、地理编码技术的概念——名词解释
图元 Geometry Element 现实世界现象的抽象,在空间数据库中通常表达为点、 线、面图元。
地理实体 Geo-Entity 现实世界中独立存在、可以唯一性标识的自然或人工地 物。
地理网格geographical grid 按照一定的数学规则对地球表面进行划分而成的格网。
行信息的整合、统计和计算; 定位:基于空间位置的信息服务; 寻址:地址解析器:寻址位置。
一、地理编码技术的概念——定义
广义地理编码:地理对象空间位置标识、计算和处理的过程, 狭义的地理编码:即地址匹配(Address Matching),
指建立地理位置坐标与给定地名地址一致性的过程,这里的地址已较 为明确的指代为街道地址、行政区域等,其地理对象也明确为地理实 体。
二、地理编码技术与方法——几个要素
1、明确地理对象 明确需要编码的地理对象, 地理对象不同则实现的方法不同;
2、确定的参考系统 可以是基于坐标的或是基于地理标识的, 地址就是一种建立在地理
标识参考系下使用自然语言描述地理位置的参考系统; 3、唯一的编码规则 地理编码也是一种数据组织、数据模型建立或是已有数据重新组织的 过程。它也是一种地理空间的间接参考系, 是整合多源空间信息资源 的一个重要环节, 成为基础地理信息数据作为空间基础框架整合信息 资源的重要手段。
优点:定位精确,精度可控制。 缺点:难以建立地理对象之间的空间拓扑关系,需要建立一整套严密的
从大地基准、参考椭球、投影方式、格网的规定、格网原点、格网 划分规则、格网标识编码以及格网精度等各个方面去描述的格网系 统,需要考虑包括确定编码的最小地理对象或单元在内的多种因素。
二、地理编码技术与方法
2、基于地理实体的地理编码 采用地理实体与地址建立直接关联的方法,建立地理实体的地址
一、地理编码技术的概念——名词解释
ElemID:0001 ClasID:420100 DataVersion: LifeCycle:
ElemID:0002 ClasID:420100 DataVersion: LifeCycle:
ElemID:0002 ClasID: DataVersion: LifeCycle:
图来自百度文库层
实体层
ElemID:0004 ClasID: DataVersion: LifeCycle:
图元层
实体层
一、地理编码技术的概念——为什么?
标识:如身份证;更新、关联、共享、交换等 识别:定量信息可以被计算机直接识别,而定性信息通
过一种编码方法输入计算机中; 整合:地址空间范围(即行政区,人口普查区,街道)内进
属性。将地址、门牌、建筑物名、企事业单位名称等空间位置的自然 语言描述转化为地址编码,实质就是建立地理实体与地址( 空间位置) 的一一对应关系, 也是对地理对象的二维地理位置编码 ( 实体→地址) 和解码( 地址→实体)。它一般建立在基于坐标的空间参考系中。 如 “市政监管信息化 地理编码”。 优点:易于被大家接受,符合人们惯用的思维方式 缺点:在于中文地址本身的不规范性和重复性,使得这种编码方式存在 技术上的难点。
二、地理编码技术与方法
1、基于地理格网的地理编码 地理格网是按一定的数学规则对地球表面进行分割, 形成彼此邻接 又不交叉的多个多边形 ( 四边形、三角形), 并赋予标识符( 即地理 编码)。采用地理对象与地址通过格网建立相对关联的方法, 建立地 理对象的地址属性。实质是对地理对象的二维地理位置编码( 实体 →地理位置、格网坐标) 和解码( 地理位置、格网坐标→实体)。其 实就是表示地理实体在地理格网中位置定位信息( 直接指明或者给 定一个大小视地理编码精度而定的范围), 当建立格网之后, 地理对 象与编码( 格网标识) 之间的对应关系被唯一的确定了。