基于本体和相似图的概念语义相似度计算

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

序 。按此方式建 立 的 ( S G D,, )所有形 式概 念 的集合
表示为 ( S G 称 做形 式 背 景 ( S G D, , ), D, , )的 概念
格。
近年来 , 本体在 知识共 享 、 能信 息检 索 、 智 数字 图
书馆 、 语义 We b和信息 集 成等 方 面有着 广泛 的应 用 , 对实现知识 的重用 和共享 、 提高 系统 间互相通讯 、 互操
度计算是计算句子相似度的基础 。概念相似度是一个
主观性较强 的概念 , 有非常 明确 的客观标 准可 以衡 没
量 。目前 , 概念语义相似 度计算 已广泛 应用 在数 据挖 掘、 信息提取 、 自动问答系统 、 文本 分类 、 索等诸 多领 检 域, 成为 当今人工智能领域研究的一个热点。
T ersl f p ldcs hwsh o u t nrsl r iet a t u nsbet e u g n. hs to f c v r o — h eut o pi aeso ec mpti utae d n c wi hma ujc v d metT i me d ie et ef n s a e t a o e s il h i j h s i oc
念 , E 若 。
, ( ,Ⅳ )被称 为 ( , 2 则 ,I Ⅳ )的子概
念 , ,2 ( N )被称 为 ( 。N )的超概 念 , 作 (f, M ,。 记 J。 j l
1 预备知识
1 1 本体 ( no g ) . O tl y o
N )≤ ( , 2 偏 序关 系 ≤ 称 为形 式概 念之 间 的 I Ⅳ ),
对集合等定义提 出概 念语义 相似 度计算 方 法 , 最后 通 过一个应用实例验证算法 的可行性 。
涵 。形式背景 ( S G D, , )所 有形 式概念 的集 合表 示 为
( SG 。 D, , )
D f io : e n i 4 对于 ( 。N )和 ( , 2 i tn 肘 ,。 Ⅳ )两 个概
支持用户在给定数据 的基础上进行领域分析 和建模 。 F A作为一 种 对人 工世 界进 行 建模 的工具 无 可 C
替代的优势 , 它具 有 分析 能力 、 述 能力 和 图形 化 能 描
性的集合 , 集合 Ⅳ是 S的子集 Ⅳ S, 具有 中所有属 性的对 象的集 合可以表示为 Ⅳ : ={d£DIVs∈N,
接 近的结 果 。
关 键词 : 领域本 体 ; 式概 念分 析 ; 似图 ; 相似 度 形 相 语义 中图分类 号 : i9 Tt 1 3 文献 标识 码 : A 文章 编 号 :63 6 9 2 1 )8 00 — 4 17 —2 X(0 10 — 11 0
Co c p e a tc S mi rt mp t to s d o t lg n e tS m n i i l i Co u a i n Ba e n On o o y a y
ie so o i noo ya d F d a fd man o tlg CA o c mp t h e n tcsm lrt y ted fnt n ftesm lrga ha d c n iaeatiue t n t o uetesma i i ai b e i o so i a rp n a dd t t b tss . i y h i i h i r e
多年来 , 对概念的语义 相似性 计算 的研究 一直属
的方法 , 该方法 以概念之 间路径 的长短 作为衡 量语义
距离的长短 , 通过计算两个 概念 之间 的语 义距 离来实 现概念语义相似度 的计 算 , 方法简 单 、 该 直观 , 但忽 略
了影 响语义距 离的其他很 多因素 J 。
第2 卷 l
第8 期
计 算 机 技 术 与 发 展
COMP ER ECHNOL UT T OGY AND DEVE LOP MENT
2 1 年 8月 01
Vo | 1 N . l2 o 8 Au . 2 1 g 01
基 于 本体 和 相 似 图的概 念 语 义 相似 度计 算
D f io : e nt n 本体 中的概念 间存在 多种语义关 系 , i i 5 例如 I 是 ) , at f 部分 ) w o ( S A( l pr o( , hl 整体 ) rle - e ,e t ad ns( es 相关 ) s iry 相似 )等 , 中 , 似关系定 义 , i li ( m at 其 相
于 自然语言处理领 域的基础 课题 , 中文信 息处 理应 是
用 中迫切需要去解决 的关键技术 。传统 的基于本体 的 概念语义相似 度计算 方 法主要 分 为 2种 “ : 一种 是 基于信息论 的方法 , 该方 法利 用信息 论来计 算 2个 概 念共享信息 的程度 , 具有较高 的理论严谨性 , 但是只能
ssb t e o c psWa r p e .By a ay g teta i o a o u t n me o sa d mo iy gtepo lmsi e 。itg ae e i ewe nc n e t Sp o osd l  ̄n d t n c mp ti td n d f i rbe nt m n e rtst n h r i l a o h n h h h
作、 可靠性 的能力有 很大 的意 义。本体 的哲 学本原 可
2 概念语义相似 度的计 算
2 1 相似图的定义 .
以理解为对一个 系统的说 明或 者解 释 , 是对 客观存 在
的现实本 质 的抽 象。不 同 的人 对本 体有 着 不 同 的理
解, 现在 广 为认 可 的是 由 B r 提 出 的一 种 观 点… : os t
百度文库
基金项 目: 陕西省 自然科学基础研 究计划 基金资助项 目( 0 5 1 ) 20 F 1 ; 陕西省教育厅专项科研计划基金资助项 目( 5K 3 ) 宝鸡 文理学 0 J 17 ;
院院级重点科研项 目( K 0 6 ) Z 1 17
作者简介 : 张晓孪 (9 8 , , 17 -) 女 陕西宝鸡人 , 讲师 , 硕士 , 主要研 究方 向为人工智能 ; 王西锋 , 讲师 , 硕士 , 主要研究方 向为 网络信息
e p e ma t i lr t o u t n a d g tt e c o s e n tc e s lsfo u r ’r q e t . ts n c smi i c mp t i i a y a o n e h l s ts ma i sr u t r m s s e u ss e e
Re  ̄mn mg t e e it d c n e tmo e i g i e sa d t o s o e t e s ma t i lrt o u t n meh o m a o c p n y c h x s o c p d l d a n o l a c mp t v e n t i i e n c smi i c mp t i t o i f r lc n e ta a - i a y a o d n l
处理。
() 2 两者强 调 的内容 不一样 , 前者 强 调概 念 的内 涵, 后者认为概念 的外延和 内涵都很重要 , 概念分别 将
从 内涵和外延两方面进行描述 ;

12・ 0
计算机技术 与发展
第2 l卷
() 3 目的不同 , 前者支持知 识密集 型应用 , 后者是
D f io : e n i 2 D和 表示对象 的集合 , 中 是 D i tn 其 的子集 M D , 合 肘 中的所有对象具有 的共 同属性 集 可 以表示为 : s∈SI d s S表示属 ={ dE M, G }; V
粗略地量化概念之 间的语义 相似度 , 不能实 现概念 语
义相似度 的细致 区分 ; 另一 种方法 是基 于语义距 离
形式 , 是人们认识世界 的基础 和一种形 式化 的规 范说 明, 以将概念看作 汉语语 言文 字 中的词语 …。词语 可
是汉语最基本 的语 法和语义 的单位 , 词语 的语义 相似
领域本体 和形式 概念 分析虽 然两者 不 同 , 它们 但
收稿 日期 :0 1 O — 3 修回 日期 :0 1 0 —1 21一 1 1 ; 2 1— 4 4
建立都是对概念进行建模 , 主要有三个方面 : 差异 () 1 两者建模的对象不 同 , 前者 为现实建模 , 后者
为人工世界建模 ;
AbtatR sac nc net ma t i lr o u t ni oeo emot ai adi ot tu jcsn at ca itlg ne src: eerhO o cp e s ni s ai c mpt i n fh s bs n mp rn bet i r f i el ec . c mi t y ao s t c a s i ln i i
Ke r s:o ywo d d mmno tlg f r l o cp ay i;i l rp noo y;oma c n e ta lss smi g a h;sma tcsm lrt n r a e n i i ai i y
O 引 言
概念就是反 映事物类 的本质属性及其分子 的思维
,, ) 其中 E D, S 如果满足 E =, ,=E, , , 且 则
E称 为形式概 念 ( , E,)的外延 , 称 为 形式 概念 的 内 ,
思想和形式概念分析 ( oma C net n yi, C F r l o cp a s F A) Al s 的思想计算 F A 中 的概 念语 义相 似度 。首先 分析 了 C 领域本体 中的相似关 系 , 然后 结合 相似 图和候 选属 性
a i ia r ph nd S m l r G a
ZHANG a — u n,W ANG - g Xio l a Xi  ̄n
( e ame t f o ue c ne B oi ol eo r &Sine B oi 20 6 C ia D pr n mp t S i c 。 aj C l g f t t oC r e e A s c c 。 aj7 11 。 hn ) e
张晓孪 , 王西锋
( 宝鸡文理学院 计算机科 学系, 陕西 宝鸡 7 11 ) 206
摘 要: 概念语 义相 似度 计算 的研究 是人 工智 能最 基础 和最重 要 的课题 之一 , 现 有 的概 念建 模 思想 和工 具 , 出一 种 借鉴 提
综 合的计 算形 式概 念分 析中概 念间 语义 相似度 的算 法 。 过分 析传统 的计算方 法 , 存在 的 问题 进行 改进 , 领域 本体 通 对 结合 和 F A的思 想 , 过相似 图 和候选 属性 对集合 等定 义计 算 F A中概念 间 的语义 相似 度 。 C 通 C 应用 实例 的结 果表 明计算结 果 与 人 类的 主观判 断基 本一致 。文 中的方 法对 概念 间语义 相似 度计算 是 可 行 的 , 用该 方 法 可 以获取 在 语义 上 和用 户请 求最 使
d s} G 。 D f io : 式概念简称 概念 , 一个 序偶 ( eni 3形 i tn 是 E,
力 。文 中的研究 目的在 于探索 F A 中概 念语 义相 似 C
度的计算方法 , 为进一步 的研究奠定基础 。 鉴于上述原 因 , 出 了一 种概 念语义 相似 度 的计 提 算 方法 , 借鉴现有概念的建模思想和工具 , 应用本体 的
相关文档
最新文档