移动地理信息系统中的多源异构数据融合模型_李文闯
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图 1 对象信息模型
1. 2 基于 EXIF 的数据结构设计 对象信息模型中数字图像有着比一般属性和空间位置数
据复杂的物理结构。目前,移动采集设备拍摄存储静态图片 的一般类型是联合图像专家小组 ( Joint Photographic Experts Group,JPEG) ,JPEG 档 案 交 换 格 式 ( JPEG File Interchange Format,JFIF) 定义了许多标记用来区分和识别图像数据及其 他相关信息,相比其他采用固定格式文件头记录的方式,很容 易扩充记录信息而不影响兼容性,正是在这样的基础之上产 生了 EXIF。目前,多数厂商的数码相机都采用 EXIF 来记录 数码相机拍摄过程中所采集的一系列相互联系的拍摄信息, 如拍摄时的光圈、快门、拍摄日期时间等。
1 多源异构数据融合模型
1. 1 实体对象信息模型 所采集信息依赖于被采集实体而存在,包括空间信息、文
本或数字描述的属性信息、图像或视频描述的静态或动态属 性信息。空间信息细分为空间对象类别、空间形状及位置坐 标、空间拓扑关系、维数等; 属性信息细分为空间实体唯一识 别码、实体静态描述信息、行为和功能、衍生信息等。对象信 息模型如图 1 所示。
摘 要: 为了提高移动地理信息系统在野外数据采集过程中对多源异构数据的组织管理效率,在分析现有方法 局限性和数据自身结构的基础上,提出一种基于可交换图像文件( EXIF) 原理以数字图像为载体融合空间位置信息和 一般形式属性的数据模型。该模型将关联的空间位置和一般属性嵌入到数字图像的物理结构中,从而实现关联数据 的高度整合。基于该模型设计开发了野外数据采集系统,系统应用于农业资源管理与决策分析领wenku.baidu.com,验证了模型的 有效性和实际效果。
0 引言
随着空间信 息 技 术 的 快 速 发 展,其 应 用 领 域 不 断 扩 展。 行业管理应用的不断深化对信息内容提出了更高的要求,需 要空间位置、一般属性和表现形式直观丰富的多媒体数字图 像等多源异构数据融合的野外数据采集技术。集多媒体和空 间信息获取及通信为一体化的移动智能终端设备的发展为移 动数 据 采 集 地 理 信 息 系 统 ( Geographic Information System, GIS) 中多源异构数据的高效融合提供了可能。
第9 期
李文闯等: 移动地理信息系统中的多源异构数据融合模型
2673
范围较大,因此仅仅用空间位置信息进行标识不适用于数据 采集,即便是不同空间位置的图像,描述的依然可能是同一实 体,一般智能终端 GPS 接收到的位置信息精度在 10 ~ 15 m, 同一位置多次获取的位置信息也不同。可见,在数字图像中 仅仅标识空间位置信息只能表达该图像拍摄时的地理位置, 无法满足数据采集的实际需要。
基于此,本文从采集的空间实体出发,根据数字图像、空 间及 一 般 属 性 结 构 的 不 同,设 计 基 于 可 交 换 图 像 文 件 ( EXchangeable Image File,EXIF) 原理的多源异构数据融合 模型,将相关的空间位置和一般属性写入数字图像中,完成此 类关联数据的高度整合。同时,开发了应用于农业资源管理 和决策分析领域的野外数据采集系统,尝试将该数据模型进 行应用。
目前,在采集系统中关于数字图像、空间位置和一般属性 的组织关联主要有以下 3 种模式: 1) 基于中间文件模式。利 用中间文件描述数字图像与空间位置信息及其他一般属性之 间的映射来实现外部关联[1 - 5],比较常用的是采用可扩展标 记语言( Extensible Markup Language,XML) 文件存储空间位 置信息、一般属性以及相对应的图像路径字符串,美国环境系 统研究所公司的 Shapefile 文件格式就采用了类似方式实现, 这种模式在一定程度上解决了多源异构数据关联的问题,但 是却将同一对象的描述信息存储在多个文件当中,组织过程
直接写入数字图像中。IFD 图像文件目录是一个字节长度可 变的信息块,TAG 标记是 TIFF 文件的核心,在图像文件目录 中定义了要用的所有图像参数,目录中的每一目录条目包含 图像的一个参数[14 - 15]。EXIF 规范对 IFD 中的一些标签给出 了初始化的功能预留,但是有相当比例的标签功能在日常应 用中并未体现,可以合理挖掘利用。
Key words: mobile Geographic Information System ( mobile GIS ) ; data collection; multi-source heterogeneity; EXchangeable Image File ( EXIF) ; data fusion
doi: 10. 3724 / SP. J. 1087. 2012. 02672
移动地理信息系统中的多源异构数据融合模型
李文闯1,2 ,章永平2 ,潘瑜春2*
( 1. 首都师范大学 信息工程学院,北京 100048; 2. 国家农业信息化工程技术研究中心,北京 100097) ( * 通信作者电子邮箱 panyc@ nercita. org. cn)
Abstract: In order to enhance the organization and management efficiency of multi-source heterogeneous data in field data collection process for mobile Geographic Information System ( GIS) , based on the analysis of the limitations of the existing methods and structural features of the data, a new kind of fusion model based on EXchangeable Image File ( EXIF) was proposed in which the digital image was used as carrier to fuse the information of spatial location and general attributes. In the proposed model, associated spatial information and general attributes were embedded into digital image to achieve the purpose of being highly integrated. A field data collection system was designed and developed based on the model, and applications of this system in the fields of agricultural resources management and decision analysis verify the validity and actual result of the model.
关键词: 移动地理信息系统; 数据采集; 多源异构; 可交换图像文件; 数据融合 中图分类号: TP311. 12 文献标志码: A
Multi-source heterogeneous data fusion model in mobile geographic information system
Journal of Computer Applications 计算机应用,2012,32( 9) : 2672 - 2674,2678
ISSN 1001-9081 CODEN JYIIDU
2012-09-01 http: / / www. joca. cn
文章编号: 1001 - 9081( 2012) 09 - 2672 - 03
收稿日期: 2012-03-26; 修回日期: 2012-05-09。 基金项目:“十二五”国家科技支撑计划项目( 2011BAD04B) 。 作者简介: 李文闯( 1989 - ) ,男,河南南阳人,硕士研究生,主要研究方向: 嵌入式空间信息系统; 章永平( 1978 - ) ,男,江苏句容人,工程 师,硕士,主要研究方向: 基于网络的地理信息系统、移动地理信息系统; 潘瑜春( 1971 - ) ,男,安徽歙县人,研究员,博士,主要研究方向: 地理 信息系统工程。
中不断对中间文件进行读写操作势必导致数据冗余、管理过 程繁琐、安全性降低等问题,而且多文件模式本身也存在子文 件丢失导致数据完整性遭破坏的隐患。2) 基于关系数据库 模式。利用关系数据库外键方式将数字图像保存路径与空间 位置及其他属性信息进行关联[6 - 9],相比中间文件模式,利用 关系数据库管理系统无疑能提高数据安全性和数据存取的易 操作性,但是关系数据库实质上只是另外一种意义上的中间 文件,同样无法很好解决数据管理繁琐和冗余的问题,而且一 旦图像文件进行迁移就需要重新维护关联关系,这将增大了 数据维护的难度。3) 简单的数字图像中融入空间位置信息 模式[10 - 12]。该模式有效地改善了前述两种模式的缺陷,但在 外业采集过程中依然基于前两种模式实现,只是在采集后进 行了全球定位系统( Global Positioning System,GPS) 信息和图 像的融合,且其前提是 GPS 信息和数字图像必须近同时获 取,但实际上两者采集时间差并不确定。另外,图像是对被采 集对象实体属性的一种形象直观描述,空间位置是实体对象 的空间信息,两者都依赖于被采集实体而存在,图像和空间位 置是通过实体实现关联的。很明显,对于较大的实体,其空间
采集系统中数据融合必然以被采集实体为核心,实体的 唯一标识是实现将数字图像、空间位置及一般属性无缝有机 融合的纽带,融合模型首先的关键是将以上各种数据进行有 效组织,设计可行的数据结构和内容。
每个 JPEG 格式的图像文件可以存储不多于 65 535 字节 的 EXIF 信息,足以满足日常数据采集过程中图像信息所对 应的空间位置及一般属性的存储。如 JPEG 图像文件目录中 TAG 为 010E、010F、0110、8298 的标签项,其数据类型为美国 信息互 换 标 准 代 码 ( American Standard Code for Information Interchange,ASCII) ,且组件大小在 JPEG 图像整体 EXIF 容量 约束之外并没有单独的限制,因此除了用 GPS IFD 存储 GPS 信息外可将一般属性适当组织后存储在上述结构段中。数据 结构设计如图 2 所示。
LI Wen-chuang1,2 , ZHANG Yong-ping2 , PAN Yu-chun2*
( 1. College of Information Engineering, Capital Normal University, Beijing 100048, China; 2. National Engineering Research Center for Information Technology in Agriculture, Beijing 100097, China)
EXIF 的数 据 结 构 采 用 签 图 像 文 件 格 式 ( Tagged Image File Format,TIFF) 存储信息,由三个部分组成,分别为图像文 件头 ( Image File Header,IFH) 、图 像 文 件 目 录 ( Image File Directory,IFD) 以 及 IFD 所 指 向 地 址 存 储 的 图 像 数 据[13]。 EXIF 只使用了两个 TIFF IFD,分别称作 IFD0 和 IFD1,但定义 了三个自己的 IFD 作为 IFD0 的扩展记录,分别为: EXIF IFD, GPS IFD,Interoperability IFD,其中 GPS IFD 用于存储地理坐 标信息,具有 GPS 标识功能的数码相机便是将 GPS 位置信息