基于本体和相似图的概念语义相似度计算

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

领域本体和形式概念分析虽然两者不同，它们但
收稿日期：０１Ｏ — ３修回日期：０１０ —１２１一１１；２１— ４４
建立都是对概念进行建模，主要有三个方面：差异（）１两者建模的对象不同，前者为现实建模，后者
为人工世界建模；
Ｔｅｒｓｌｆｐｌｄｃｓｈｗｓｈｏｕｔｎｒｓｌｒｉｅｔａｔｕｎｓｂｅｔｅｕｇｎ．ｈｓｔｏｆｃｖｒｏ — ｈｅｕｔｏｐｉａｅｓｏｅｃｍｐｔｉｕｔａｅｄｎｃｗｉｈｍａｕｊｃｖｄｍｅｔＴｉｍｅｄｉｅｅｔｅｆｎｓａｅｔａｏｅｓｉｌｈｉｊｈｓｉｏｃ
ａｉｉａｒｐｈｎｄＳｍｌｒＧａ
ＺＨＡＮＧａ — ｕｎ，ＷＡＮＧ－ｇＸｉｏｌａＸｉ￣ｎ
（ｅａｍｅｔｆｏｕｅｃｎｅＢｏｉｏｌｅｏｒ＆ＳｉｎｅＢｏｉ２０６ＣｉａＤｐｒｎｍｐｔＳｉｃ。ａｊＣｌｇｆｔｔｏＣｒｅｅＡｓｃｃ。ａｊ７１１。ｈｎ）ｅ
ｉｅｓｏｏｉｎｏｏｙａｄＦｄａｆｄｍａｎｏｔｌｇＣＡｏｃｍｐｔｈｅｎｔｃｓｍｌｒｔｙｔｅｄｆｎｔｎｆｔｅｓｍｌｒｇａｈａｄｃｎｉａｅａｔｉｕｅｔｎｔｏｕｅｔｅｓｍａｉｉａｉｂｅｉｏｓｏｉａｒｐｎａｄｄｔｔｂｔｓｓ．ｉｙｈｉｉｈｉｒｅ
支持用户在给定数据的基础上进行领域分析和建模。ＦＡ作为一种对人工世界进行建模的工具无可Ｃ
替代的优势，它具有分析能力、述能力和图形化能描
性的集合，集合 Ⅳ是Ｓ的子集 Ⅳ Ｓ，具有中所有属性的对象的集合可以表示为 Ⅳ ：＝｛ｄ￡ＤＩＶｓ∈Ｎ，
接近的结果。
关键词：领域本体；式概念分析；似图；相似度形相语义中图分类号：ｉ９Ｔｔ１３文献标识码：Ａ文章编号：６３６９２１）８００ — ４１７ —２Ｘ（０１０ — １１０
ＣｏｃｐｅａｔｃＳｍｉｒｔｍｐｔｔｏｓｄｏｔｌｇｎｅｔＳｍｎｉｉｌｉＣｏｕａｉｎＢａｅｎＯｎｏｏｙａｙ
ｅｐｅｍａｔｉｌｒｔｏｕｔｎａｄｇｔｔｅｃｏｓｅｎｔｃｅｓｌｓｆｏｕｒ ’ｒｑｅｔ．ｔｓｎｃｓｍｉｉｃｍｐｔｉｉａｙａｏｎｅｈｌｓｔｓｍａｉｓｒｕｔｒｍｓｓｅｕｓｓｅｅ
度计算是计算句子相似度的基础。概念相似度是一个
主观性较强的概念，有非常明确的客观标准可以衡没
量。目前，概念语义相似度计算已广泛应用在数据挖掘、信息提取、自动问答系统、文本分类、索等诸多领检域，成为当今人工智能领域研究的一个热点。
对集合等定义提出概念语义相似度计算方法，最后通过一个应用实例验证算法的可行性。
涵。形式背景（ＳＧＤ，，）所有形式概念的集合表示为
（ＳＧ。Ｄ，，）
Ｄｆｉｏ：ｅｎｉ４对于（。Ｎ）和（，２ｉｔｎ肘，。 Ⅳ ）两个概
Ｋｅｒｓ：ｏｙｗｏｄｄｍｍｎｏｔｌｇｆｒｌｏｃｐａｙｉ；ｉｌｒｐｎｏｏｙ；ｏｍａｃｎｅｔａｌｓｓｓｍｉｇａｈ；ｓｍａｔｃｓｍｌｒｔｎｒａｅｎｉｉａｉｉｙ
Ｏ引言
概念就是反映事物类的本质属性及其分子的思维
Ｒｅ￣ｍｎｍｇｔｅｅｉｔｄｃｎｅｔｍｏｅｉｇｉｅｓａｄｔｏｓｏｅｔｅｓｍａｔｉｌｒｔｏｕｔｎｍｅｈｏｍａｏｃｐｎｙｃｈｘｓｏｃｐｄｌｄａｎｏｌａｃｍｐｔｖｅｎｔｉｉｅｎｃｓｍｉｉｃｍｐｔｉｔｏｉｆｒｌｃｎｅｔａａ－ｉａｙａｏｄｎｌ
于自然语言处理领域的基础课题，中文信息处理应是
用中迫切需要去解决的关键技术。传统的基于本体的概念语义相似度计算方法主要分为２种 “ ：一种是基于信息论的方法，该方法利用信息论来计算２个概念共享信息的程度，具有较高的理论严谨性，但是只能
作、可靠性的能力有很大的意义。本体的哲学本原可
２概念语义相似度的计算
２１相似图的定义．
以理解为对一个系统的说明或者解释，是对客观存在
的现实本质的抽象。不同的人对本体有着不同的理
解，现在广为认可的是由Ｂｒ提出的一种观点… ：ｏｓｔ
念，Ｅ若。
，（，Ⅳ ）被称为（，２则，Ｉ Ⅳ ）的子概
念，，２（Ｎ）被称为（。Ｎ）的超概念，作（ｆ，Ｍ，。记Ｊ。ｊｌ
１预备知识
１１本体（ｎｏｇ）．Ｏｔｌｙｏ
Ｎ）≤ （，２偏序关系 ≤ 称为形式概念之间的Ｉ Ⅳ ），
，，）其中ＥＤ，Ｓ如果满足Ｅ＝，，＝Ｅ，，，且则
Ｅ称为形式概念（，Ｅ，）的外延，称为形式概念的内，
思想和形式概念分析（ｏｍａＣｎｅｔｎｙｉ，ＣＦｒｌｏｃｐａｓＦＡ）Ａｌｓ的思想计算ＦＡ中的概念语义相似度。首先分析了Ｃ领域本体中的相似关系，然后结合相似图和候选属性
ｄｓ｝Ｇ。Ｄｆｉｏ：式概念简称概念，一个序偶（ｅｎｉ３形ｉｔｎ是Ｅ，
力。文中的研究目的在于探索ＦＡ中概念语义相似Ｃ
度的计算方法，为进一步的研究奠定基础。鉴于上述原因，出了一种概念语义相似度的计提算方法，借鉴现有概念的建模思想和工具，应用本体的
ＡｂｔａｔＲｓａｃｎｃｎｅｔｍａｔｉｌｒｏｕｔｎｉｏｅｏｅｍｏｔａｉａｄｉｏｔｔｕｊｃｓｎａｔｃａｉｔｌｇｎｅｓｒｃ：ｅｅｒｈＯｏｃｐｅｓｎｉｓａｉｃｍｐｔｉｎｆｈｓｂｓｎｍｐｒｎｂｅｔｉｒｆｉｅｌｅｃ．ｃｍｉｔｙａｏｓｔｃａｓｉｌｎｉｉ
粗略地量化概念之间的语义相似度，不能实现概念语
义相似度的细致区分；另一种方法是基于语义距离
形式，是人们认识世界的基础和一种形式化的规范说明，以将概念看作汉语语言文字中的词语 …。词语可
是汉语最基本的语法和语义的单位，词语的语义相似
多年来，对概念的语义相似性计算的研究一直属
的方法，该方法以概念之间路径的长短作为衡量语义
距离的长短，通过计算两个概念之间的语义距离来实现概念语义相似度的计算，方法简单、该直观，但忽略
了影响语义距离的其他很多因素Ｊ。
处理。
（）２两者强调的内容不一样，前者强调概念的内涵，后者认为概念的外延和内涵都很重要，概念分别将
从内涵和外延两方面进行描述；
・
１２・０ ຫໍສະໝຸດ 计算机技术与发展第２ｌ卷
（）３目的不同，前者支持知识密集型应用，后者是
Ｄｆｉｏ：ｅｎｉ２Ｄ和表示对象的集合，中是Ｄｉｔｎ其的子集ＭＤ，合肘中的所有对象具有的共同属性集可以表示为：ｓ∈ＳＩｄｓＳ表示属＝｛ｄＥＭ，Ｇ｝；Ｖ
第２卷ｌ
第８期
计算机技术与发展
ＣＯＭＰＥＲＥＣＨＮＯＬＵＴＴＯＧＹＡＮＤＤＥＶＥＬＯＰＭＥＮＴ
２１年８月０１
Ｖｏ｜１Ｎ．ｌ２ｏ８Ａｕ．２１ｇ０１
基于本体和相似图的概念语义相似度计算
基金项目：陕西省自然科学基础研究计划基金资助项目（０５１）２０Ｆ１；陕西省教育厅专项科研计划基金资助项目（５Ｋ３）宝鸡文理学０Ｊ１７；
院院级重点科研项目（Ｋ０６）Ｚ１１７
作者简介：张晓孪（９８，，１７－）女陕西宝鸡人，讲师，硕士，主要研究方向为人工智能；王西锋，讲师，硕士，主要研究方向为网络信息
序。按此方式建立的（ＳＧＤ，，）所有形式概念的集合
表示为（ＳＧ称做形式背景（ＳＧＤ，，），Ｄ，，）的概念
格。
近年来，本体在知识共享、能信息检索、智数字图
书馆、语义Ｗｅｂ和信息集成等方面有着广泛的应用，对实现知识的重用和共享、提高系统间互相通讯、互操
张晓孪，王西锋
（宝鸡文理学院计算机科学系，陕西宝鸡７１１）２０６
摘要：概念语义相似度计算的研究是人工智能最基础和最重要的课题之一，现有的概念建模思想和工具，出一种借鉴提
综合的计算形式概念分析中概念间语义相似度的算法。过分析传统的计算方法，存在的问题进行改进，领域本体通对结合和ＦＡ的思想，过相似图和候选属性对集合等定义计算ＦＡ中概念间的语义相似度。Ｃ通Ｃ应用实例的结果表明计算结果与人类的主观判断基本一致。文中的方法对概念间语义相似度计算是可行的，用该方法可以获取在语义上和用户请求最使
Ｄｆｉｏ：ｅｎｔｎ本体中的概念间存在多种语义关系，ｉｉ５例如Ｉ是），ａｔｆ部分）ｗｏ（ＳＡ（ｌｐｒｏ（，ｈｌ整体）ｒｌｅ－ｅ，ｅｔａｄｎｓ（ｅｓ相关）ｓｉｒｙ相似）等，中，似关系定义，ｉｌｉ（ｍａｔ其相
ｓｓｂｔｅｏｃｐｓＷａｒｐｅ．Ｂｙａａｙｇｔｅｔａｉｏａｏｕｔｎｍｅｏｓａｄｍｏｉｙｇｔｅｐｏｌｍｓｉｅ。ｉｔｇａｅｅｉｅｗｅｎｃｎｅｔＳｐｏｏｓｄｌ￣ｎｄｔｎｃｍｐｔｉｔｄｎｄｆｉｒｂｅｎｔｍｎｅｒｔｓｔｎｈｒｉｌａｏｈｎｈｈｈ