GIS数据库模式匹配技术研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
元素 的
i(l et f e m n 是前一个元素的孩子) e
ad sh d ) /将 该元素做为前一个 dA i ( ;/ Cl
元素 的孩 子
i e et f l n 是前一个元素的兄弟) (m
ad sii ( ; 将该元素作为前一个 dAS lg )/ bn /
兄弟 }
第l 0期
吕 娜 : I 数据库模式匹配技术研究 GS
23 相 似 度与 阈值 .
3 1
rt nt/ 返 回新 生成 的模 式树 的根 节点 er ;/ u
}
在进行模式匹配时, 通过 比较两个输入模式相 关元素的相似度 , 找出其中相互匹配的元素 , 推导出 这些元素间的映射关系 , 再根据用户给 出的模式 的 最小相似度 ( 阈值) 来进行判 断。如果它们 的相似 程度大于这个 阈值 , 则认为它们为同一个地理对象 ; 反之 , 则认为它们不是同一个地理对象。 在元素与元素之间的相似度 , 具体表现于两个 方面 : 语意 相 似度 和结 构 相似 度 。所谓 语 意相似度 ,
讨论 。
关键词 : 模式匹配 ; 模式树 ; 意与结 构相似度 ; 语 权重
中图 分 类 号 :2 8 P0
随着空间信息技术的 日益发展与成熟 , 越来 越 多 的部 门与单 位纷纷 建立 起 了 面 向各 自需 求 的 GS I
应用 系统 。 由于各个 系统 之 间所 承载 的数据存 在来
模 式树 通过算 法 生成 , 体描 述如下 : 具
, ’
源与格式的差异 , 导致 了地理信息交互与共享的困
难 。为 了解决 这一 问题对 GS研 究 与生产 带来 的不 I
利影 响 , 总结相关技 术发展 的基础 上 , 在 根据 G S空 I 间数据 的特点 和应 用背 景 , 出一 种 便 于 实 现 的数 提 据模式 匹配方 法 , 细 讨论 了其 中关 键 步骤 的解 决 详
t e ot= r tgt eR o( ;/ r Ro e o .e re o )/ 得到模 o T t
式树 的逻辑根 结点 元素
方式来判断其中是否存在同名实体 , 不仅需要极大 的 比较 次数 ( N) 而 且对 于 不 同种类 的实 体 , M , 很
难设 计 它们之 间 的 比较 规 则 。 因此 , 先 要 对 待 匹 首 配空 间数据 进行 各 自独 立 的要 素 分 组 有不 同来 源或格式 的空间数据 , 可以利 用其空间与属性 两方面特征 , 来确定两个要素之
间的共同实体。详细介绍 了关 于 GS I 数据库模式匹配的实施框 架 、 给出了匹配方法 的步骤 、 法及 已所实现的模式 算
匹配详细流程 , 包括语 意与结构相似度判断 以及权 重的设 置 , 最后 , 匹配过程 中包 含 的不 确定 因素进行 了分析与 对
2 1 模 式树 的生成 .
GS I 空间数据库 中, 描述相 同地理对象 的数据 文件在形式组织上可能千差万别 , 但是其模式结构 却相互类似 : 包含与被包含是两个层次间元素基本 的关系 , 于是将模式结构转化成一个清晰元异意的 模式树 , 以方便各个元素的遍历 , 进一步进行 2 个模 式相 应元 素之 间的 匹配 。 :
{
●
’
-
2 模式 匹配与流程
所谓模式匹配 , 即是通过指定的匹配算法 , 对两 个模式 中的每一个元素进行一一对应 的分析和 比 较, 通过对元素间相似程度的判断, 来确定 2 个模式 是否描述同一地理对象 , 以达到方便数据流通与共 享等 目的。 匹配流程大概可以分为下面几个步骤 :
包 括三 个方 面 : 元素命 名 中是 否包 含 同义词 、 近义 词 的成分 ; 素命 名是 否有缩 写 与简 写关 系 ; 素本 身 元 元
模式树生成之后 , 即可 以设定规则与算法 , 2 对 个G L M 实例模式进行 匹配了。 22 模式 树 的遍历 与 元素 匹 配 . 模式树的匹配 , 主要是通过对两棵树的遍历, 对 其每个节点元素进行一对一的对 比过程 。对于分别 处在 2 棵树中的 2 个节点 , 对其进行相似度的判断。
’
途径 , 并证实 了其有效 性 与可 实施 性 。
t e = b i t e() r e u dr l e
1 实施框架
GS I 数据库中对于空间实体的存储 , 划分为点、 线、 面三种遵循拓扑关系的要素类型。假设待匹配 的两个空间数据中各有 M和 N个空间要素( 包括点
要 素 、 要素 与面要素 ) 如 果直 接 采 取两 两 比较 的 线 ,
t nwt e t e ot ; 建立模式树根结 = e e(r Ro)/ r e /
、
一
点
。
e et t tog (ot ;  ̄ 历模式文件 l n s p r h r )/ t m e h n o /
要素分别归类 , 以减少算法时间消耗 , 简化对象匹配
规则。
并取出模式中所有元素, 如果元素类型为基本类型 , 则将该元素直接看成时结点。 一 ..
B i te S i ce aoao )/ u d e( tn s m Lctn / 根据模式文 lr rg h i 件 的 目录建 立模式 树
{ 的根结 点 rt o o gt : m Ro (ce aoa e ce a ot shm Le- Sh
tn ; 通过解析函数解析模式文件并得 到该模式 i )/ o /
第2 6卷
第 1 0期
甘肃科 技
Ga s ce c n c oo y n u S in e a d Te hn lg
f 2 No 1 .6 .0 Ma . 2 1 y 0 0
21 00年 5月
GI 据 库 模 式 匹配技 术研 究 S数
吕 娜
( 甘肃省地图院 , 甘肃 兰州 7 00 ) 30 0 摘 要: 作为与传统数据库的显著区别之一 , I GS数据库不仅存储 空间实体 的属性信息 同时存储其特有的空 间信 还
i(l et f e m n 是前一个元素的孩子) e
ad sh d ) /将 该元素做为前一个 dA i ( ;/ Cl
元素 的孩 子
i e et f l n 是前一个元素的兄弟) (m
ad sii ( ; 将该元素作为前一个 dAS lg )/ bn /
兄弟 }
第l 0期
吕 娜 : I 数据库模式匹配技术研究 GS
23 相 似 度与 阈值 .
3 1
rt nt/ 返 回新 生成 的模 式树 的根 节点 er ;/ u
}
在进行模式匹配时, 通过 比较两个输入模式相 关元素的相似度 , 找出其中相互匹配的元素 , 推导出 这些元素间的映射关系 , 再根据用户给 出的模式 的 最小相似度 ( 阈值) 来进行判 断。如果它们 的相似 程度大于这个 阈值 , 则认为它们为同一个地理对象 ; 反之 , 则认为它们不是同一个地理对象。 在元素与元素之间的相似度 , 具体表现于两个 方面 : 语意 相 似度 和结 构 相似 度 。所谓 语 意相似度 ,
讨论 。
关键词 : 模式匹配 ; 模式树 ; 意与结 构相似度 ; 语 权重
中图 分 类 号 :2 8 P0
随着空间信息技术的 日益发展与成熟 , 越来 越 多 的部 门与单 位纷纷 建立 起 了 面 向各 自需 求 的 GS I
应用 系统 。 由于各个 系统 之 间所 承载 的数据存 在来
模 式树 通过算 法 生成 , 体描 述如下 : 具
, ’
源与格式的差异 , 导致 了地理信息交互与共享的困
难 。为 了解决 这一 问题对 GS研 究 与生产 带来 的不 I
利影 响 , 总结相关技 术发展 的基础 上 , 在 根据 G S空 I 间数据 的特点 和应 用背 景 , 出一 种 便 于 实 现 的数 提 据模式 匹配方 法 , 细 讨论 了其 中关 键 步骤 的解 决 详
t e ot= r tgt eR o( ;/ r Ro e o .e re o )/ 得到模 o T t
式树 的逻辑根 结点 元素
方式来判断其中是否存在同名实体 , 不仅需要极大 的 比较 次数 ( N) 而 且对 于 不 同种类 的实 体 , M , 很
难设 计 它们之 间 的 比较 规 则 。 因此 , 先 要 对 待 匹 首 配空 间数据 进行 各 自独 立 的要 素 分 组 有不 同来 源或格式 的空间数据 , 可以利 用其空间与属性 两方面特征 , 来确定两个要素之
间的共同实体。详细介绍 了关 于 GS I 数据库模式匹配的实施框 架 、 给出了匹配方法 的步骤 、 法及 已所实现的模式 算
匹配详细流程 , 包括语 意与结构相似度判断 以及权 重的设 置 , 最后 , 匹配过程 中包 含 的不 确定 因素进行 了分析与 对
2 1 模 式树 的生成 .
GS I 空间数据库 中, 描述相 同地理对象 的数据 文件在形式组织上可能千差万别 , 但是其模式结构 却相互类似 : 包含与被包含是两个层次间元素基本 的关系 , 于是将模式结构转化成一个清晰元异意的 模式树 , 以方便各个元素的遍历 , 进一步进行 2 个模 式相 应元 素之 间的 匹配 。 :
{
●
’
-
2 模式 匹配与流程
所谓模式匹配 , 即是通过指定的匹配算法 , 对两 个模式 中的每一个元素进行一一对应 的分析和 比 较, 通过对元素间相似程度的判断, 来确定 2 个模式 是否描述同一地理对象 , 以达到方便数据流通与共 享等 目的。 匹配流程大概可以分为下面几个步骤 :
包 括三 个方 面 : 元素命 名 中是 否包 含 同义词 、 近义 词 的成分 ; 素命 名是 否有缩 写 与简 写关 系 ; 素本 身 元 元
模式树生成之后 , 即可 以设定规则与算法 , 2 对 个G L M 实例模式进行 匹配了。 22 模式 树 的遍历 与 元素 匹 配 . 模式树的匹配 , 主要是通过对两棵树的遍历, 对 其每个节点元素进行一对一的对 比过程 。对于分别 处在 2 棵树中的 2 个节点 , 对其进行相似度的判断。
’
途径 , 并证实 了其有效 性 与可 实施 性 。
t e = b i t e() r e u dr l e
1 实施框架
GS I 数据库中对于空间实体的存储 , 划分为点、 线、 面三种遵循拓扑关系的要素类型。假设待匹配 的两个空间数据中各有 M和 N个空间要素( 包括点
要 素 、 要素 与面要素 ) 如 果直 接 采 取两 两 比较 的 线 ,
t nwt e t e ot ; 建立模式树根结 = e e(r Ro)/ r e /
、
一
点
。
e et t tog (ot ;  ̄ 历模式文件 l n s p r h r )/ t m e h n o /
要素分别归类 , 以减少算法时间消耗 , 简化对象匹配
规则。
并取出模式中所有元素, 如果元素类型为基本类型 , 则将该元素直接看成时结点。 一 ..
B i te S i ce aoao )/ u d e( tn s m Lctn / 根据模式文 lr rg h i 件 的 目录建 立模式 树
{ 的根结 点 rt o o gt : m Ro (ce aoa e ce a ot shm Le- Sh
tn ; 通过解析函数解析模式文件并得 到该模式 i )/ o /
第2 6卷
第 1 0期
甘肃科 技
Ga s ce c n c oo y n u S in e a d Te hn lg
f 2 No 1 .6 .0 Ma . 2 1 y 0 0
21 00年 5月
GI 据 库 模 式 匹配技 术研 究 S数
吕 娜
( 甘肃省地图院 , 甘肃 兰州 7 00 ) 30 0 摘 要: 作为与传统数据库的显著区别之一 , I GS数据库不仅存储 空间实体 的属性信息 同时存储其特有的空 间信 还