基于相似度综合的本体自适应映射方法研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘 要: 异构数据集成领域大量应用了本体研究方法 . 该文针对混合本 体模型映射存在 的不足提 出了 自适 应
混合本体模型, 通过计算各种不 同相似度获得相似度综合 的计算 方法 . 出了 自适应映射 的定 义和计算方法用 以 提
解决本体之间是否要进行映射的问题 .
关键词 : 异构数据 ; 本体 ; 相似度 ; 自适应
替换 以及相 邻字符 的互换 .
计算方法. 设 输入两 个字 符 串 sr tl和 s 2 它们 的长度 分别 为 , , t , r m 它们 的编 辑距 离用 ei s lsr) 示 , dt t ,t 表 (r 2
再设 Sm (tls 2 为编辑 距离计 算得 出的相 似度 , 可定 义语法 距离相 似度 : i s ,t ) r r 则
异构 数据集成 中 , 由于传 统 的公共数 据模型 在解决异 构数据 的语 法异构 方面存 在缺 陷 . 因此 , 究者 研
引入“ 本体” 来描述异构数据 , 解决语义异构问题 . 相对于传统的模式集成方法 , 基于本体的异构数据集 成能 够更好地解 决语义 异构 性 , 自动化地 实现数据 共享 和再 用 . 体 在异 构数 据集 成 中 的作用 包括 更 本
21 0 0年 1 月 2
广西师 范学院学报 : 自然科学版
J u n l fGu n x e c e sE u a in Un v r i : tr l ce c d t n o r a a g i a h r d c t ie st Na u a in e E i o o T o y S i
中图 分 类 号 : 3 1 1 1 TP 1 .3 文 献标 识 码 : A
在计 算机相 关 领 域 中 , 体 用 于 知 识 表 达 和 共 享 . rbr定 义 本 体 为 概 念 化 的 明确 “ 范 说 本 G ue 规
明” 卫 . u 伴随知识工程、 多智能体系统、 语义 we 等领域 的本体应用 , b 本体建模语言成为研究热点 . 在
种信息都 可 以用 于映射 发现 , 如元 素名 称 、 例 元素 描述 、 实例 、 分类 结构 以及 约束 等 . 因此 , 于相 似 度 综合 计 基 算实现本体 映射 的方法 就是根 据 每个 元 素 的特征 , 计算 多个不 同方 面 的相 似度值 , 将 多种 相似 度计 算结 果 按 再 照一定 的权 重组合 起来综 合 考虑 , 以得到 符合 映射 关 系 的元素对 . 用 多 种方 法 进 行计 算 可 以 提高 本 体 映 射 采 准确度 , 免出现 因为某 种计算 方 法 出现较 大 误差 而 影 避
两方 面 .
()利用本 体来描 述和表 达数据 源 的内容 . 1 因为本 体提供 了一 个丰 富 的 、 先定 义好 的词汇语 义 预 表 , 确地描述 数据 源 的概 念及其 之 间的关 系 . 能精 ()本体可 以作 为查询模 型 . 户提交 一个针对 本体 的查询 , 基于语 义定义 , 以 自动将针对 2 用 系统 可 本体 的查询转化 为针对 数据 源的查询 . 在 目前基 于本体 的数据集 成 中 , 通常有三 种实现 方法 : 一本体方 法 、 单 多本 体方法 和混合方 法 . 常用 的为 混合本体 的模 型 - , 图 1所示 . 4如 J
据集 成的重要过 程 .
在本 文 中 , 出 了一种 称 为 “ 提 自适应 混 合本 体 模 型 ” 来
解决 异构 数据集成 的映射 问题 . 该模 型 中包 括多个 局部 本
图 1 混 合 本体模 型
体和一个 统一 的全 局本 体 , 与混合 本体模 型有所 区别 的是 , 模型除 在局部本 体与全 局本体 之间进行 但 该
D c2 1 e.00
Vo 27 No. 1 4

第2 7卷 第 4 期
文章 编号 :0 2 7 3 2 1 )4—0 0 1 0 —8 4 (0 0 0 10—0 5
基 于 相 似 度 综 合 的本 体 自适 应 映 射 方 法 研 究
谢雄程 , 刘之家 , 蓝贞雄
( 西师 范学 院 计 算机 与信息工程 学 院, 广 广西 南宁 50 0 ) 30 1
响映射结果 . 图2 自适应混合本体模型
2 1 基 于语 法距 离的相似度计算 .
基 于语 法 的相 似度计 算方 法 是针 对本 体 的概 念 、 属
性的语法特征进行相似度计算 . 由于概念的名称 , 属性名称等在具体实现上都是字符串, 因此引入“ 编 辑距离” 概念 , 它是为两个字符串之间转换所需要的最小数 目的单元编辑操作 , 包括字符的插入、 删除、
自适应映射本体模 型
在基 于本体 的异 构数 据 集 成方 法 中 , 涉及 到 本体 的构 建、 本体 问映射 以及本 体 查询 等 关键 技 术 . 体 构建 是 进 本
行本体映射 的基础 , 本体映射是解决本体之间语义异构实 现数据集成 的关键 , 体 查 询是 利 用本 体 映 射结 果实 现相似度综合的本体 自适应映射方法研究
・0 1 1・
2 相 似度 综 合 的计 算
在本体 之间建 立语 义 关联 , 实现 本体 映射 , 关键在 于发现相 同或相似 的元素 间 的映 射关 系 , 似 度计 算 是 相
本体映射 的 中发 现 映射 关 系 的重 要方 法 . 体 中的 各 本
s 胁 (t s )= ma O x( , ) , () 1
映射外 , 局部本体之间采用一种 自 适应算法进行映射 , 这就表示局部本体之间并不总是需要映射的, 如
图 2所 示 .
收稿 日期 :0 0 9 1 2 1 一O —2
作者简介 : 谢雄程(9 2 )男 , 17 一 , 讲师 , 研究网络与信息技术 (xhn @1 3cm) x ceg 6 .o
相关文档
最新文档