基于WordNet和SUMO本体集成的自动语义检索及可视化模型
基于大模型的检索 综述
基于大模型的检索综述随着深度学习的快速发展,大模型在信息检索领域逐渐被广泛应用。
基于大模型的检索(retrieval)是指利用深度学习模型对查询与文档进行匹配,从而得出最相关的文档。
在过去的几年里,基于大模型的检索方法取得了令人瞩目的突破,相比传统基于词袋模型的检索方法,它能够从更多的语义信息中获取有效的匹配模式,因此能够取得更好的检索效果。
本文将对基于大模型的检索进行综述,介绍其相关技术、应用领域以及存在的挑战。
大模型在基于大数据集的自监督学习过程中被训练得到。
在这个过程中,模型会学习到语义信息的表示方法,并在此基础上进行检索的匹配。
目前应用最广泛的大模型是BERT(Bidirectional Encoder Representations from Transformers)模型。
BERT模型在2018年提出,其基本思路是通过预训练模型,让模型学习文本的语义关系,进而进行相关任务的微调。
BERT模型在自然语言处理领域取得了巨大成功,被广泛应用于文本分类、命名实体识别、意图识别等任务中。
在信息检索领域,BERT模型也被用于进行句子级别和文档级别的检索匹配。
传统的检索方法基于关键词的匹配,忽略了上下文和语义信息,而基于大模型的检索能够更好地捕捉语义信息。
一种典型的基于大模型的检索方法是通过计算查询和文档的相似性来进行排序,排序的结果即为最相关的文档。
这种方法主要使用了BERT模型的contextualized word embeddings,将查询和文档都映射到同一语义空间中进行比较。
除了BERT模型,还有一些其他的大模型可以用于检索任务,例如UniLM、XLNet和RoBERTa等。
这些模型在预训练过程中采用了不同的策略,进一步提高了模型的表达能力和泛化能力。
基于大模型的检索方法在许多应用领域都取得了显著的效果。
例如,在问答系统中,通过将用户的问题和候选答案进行匹配,基于大模型的检索方法能够找到最相关的答案。
基于本体的关联知识可视化检索模型
中 分 号t P06 圈 类 3. T 1
基 于本体 的关联知 识 可视( 浙江大 学计算机科 学与技术学院 ,杭州 302) 07 1
摘 要 :本体作为共享概念体 系的形 式化描 述 , 知识检 索方面可解决海量知识利用 问题 。为 此,在 已有研究成果 的基础 上,提 出一种 基 在
[ ywod lk o e g te a; noo y o tlg nt c o ;ea dk o e g ; i a zt n Ke r s wl er r vlo tlg ;noo yc s ut n rlt n wl e vs l a o n d ei o r i e d ui i DOI 1 . 6 /is. 0 —4 82 1 . .1 : 03 9jsn1 03 2 . 11 0 8 9 . 0 0 6
于本体 的关联知识 可视化检索模 型。该模型从 实用角度出发 ,关注知识源 之间的关联性和知识检索 的用户体验 ,改进传统 的本体构建及 维 护方法 ,提 出新 的知识检索 方法 。应 用实例 结果表明 ,该模型能够提升 用户获取 知识 的效率和质量 。 关健 两:知识检索 ;本体 ; 本体 构建 ;关联知识 ;可视化
O n o o y b s d Re a e n wl d eViu l a i n Re re a o e t l g - a e l t d K o e g s a i to t iv l z M dl
JA I NG ioj n L h hpn , I i i X a - , I a -ig L U S- u S y
l 概述
随着知识经济时代 的到来 ,各领域 的知识资源库越来越 大 ,与此 同时新知识 的创造速度也越来越快 ,如何有效地 利
如各学科领域 的主题词表、分类表 ,在此基础上确定领 域知 识本体的主要概念和概 念间的各种关系 ,构筑领域本体 的概
结合描述性文本的三维模型语义检索方法
结合描述性文本的三维模型语义检索方法王羡慧;覃征;庄春晓;张选平【摘要】To improve the retrieval performance of 3D model, concerning the problem that the semantic-based 3D model retrieval system is hard to support customers' subjective words, a 3D model semantic retrieval method based on content and descriptive text was proposed. This method constructed a semantic tree for 3D models firstly. Then, it calculated the similarity among the input and node of tree by the word statistics method, and got some 3D models from those nodes with high similarity,and a smaller 3D models set by semantic constraint. Finally, user input' s 3D model examples may match the shape similarity in the smaller set of 3D model through semantic constraint, and returned search results to users. The WordNet definitions of some words were as input in experiments. The experimental results on PSB show that this method performs better than the content-based 3D model retrieval method on recall-precision.%为了提高三维模型的检索性能,针对当前三维模型检索系统的语义检索功能无法支持用户的主观性描述文字的问题,提出一种基于内容和描述性文本结合的三维模型语义检索方法.该方法首先为三维模型构造语义树;然后,利用语料统计的方法,计算输入的描述性文本和语义树节点扩充信息的相关程度,将相关度较高的一部分节点的三维模型实例提取出来,得到一个经过语义约束的较小的三维模型集合;最后,使用用户输入的三维模型实例在这个经过语义约束的较小的三维模型集合里进行形状相似性匹配,依据匹配度的大小返回给用户三维模型检索结果.实验中,使用WordNet对一些名词的释义作为描述性文本输入.在普林斯顿大学的PSB三维模型数据集上的实验结果表明,该方法在大多数类别中的查准率-查全率性能好于传统的基于内容的三维模型检索方法.【期刊名称】《计算机应用》【年(卷),期】2011(031)001【总页数】6页(P1-5,36)【关键词】三维模型;语义检索;描述性文本;WordNet【作者】王羡慧;覃征;庄春晓;张选平【作者单位】西安交通大学计算机科学与技术系,西安710049;西安交通大学计算机科学与技术系,西安710049;清华大学软件学院,北京100084;西安交通大学计算机科学与技术系,西安710049;西安交通大学计算机科学与技术系,西安710049【正文语种】中文【中图分类】TP391.40 引言基于内容的三维模型检索[1-3]通过对视觉特征的相似性匹配来查找用户所需的三维模型。
基于本体的语义检索
基于本体的语义检索[1]杨月华, 杜军平摘要:本文对基于本体的语义检索进行了综述。
从自然语言处理、基于概念的方法以及基于本体三个方面来实现语义在信息检索中的集成和应用。
关键词:本体;语义;检索;信息检索传统的信息检索方法或搜索引擎,无论是关键字符的匹配,还是结合布尔逻辑运算提供更为复杂的查询表达方式,都是以关键词匹配为基础的。
这种方法有两种缺陷:检索结果只是在字面上符合用户的要求,实际内容往往偏离用户的需要。
用户输入的查询稍有偏差,检索系统就无法确定用户的真正需要,因而无法提供正确的结果。
为了解决这些问题,研究者尝试从语义的角度进行考虑,提出了各种新的方法和技术,也取得了很多的成果。
通常的研究主要从自然语言处理、基于概念的方法以及基于本体的思路三个方面来实现语义在信息检索中的集成和应用。
1994年Voorhees就曾提出基于本体的查询扩展,使用了本体中的概念进行查询扩展,并得出最有效的方式是利用本体中的同义词和特定的子类关系进行扩展。
此后,基于本体的查询扩展研究侧重于两个方面——基于结构化的方法和基于注释的方法。
前者着重从本体的结构信息中抽取出相似度衡量的依据,而后者则通过计算本体术语的定义中的重叠次数来衡量语义相似度。
Maki在2003年提出了基于本体结构的方法,基本的思想是利用本体中的路径来进行用户查询的扩展。
在本体的结构图中,每个概念的节点都与其他节点有连通的路径,因此对用户查询进行扩展时,可以选择与该节点连通的路径上的概念。
在对概念选择时,Maki提出利用一系列的关系边和概念节点之间相似度的方法来进行排序,优先选择与被扩展概念相似度大者。
而计算相似度的方法依赖于本体的结构,例如进行比较的概念之间路径的数量、长度以及路径中存在关系种类数、路径中节点种类等,都可以作为衡量的标准。
2004年,Navigli提出了基于本体注释的查询扩展方法。
该方法假定了在本体中相似的概念或术语也具有相似的定义,使用了WordNet中的概念并对其进行扩充了注释。
信息检索系统导论期末考试题库
一、选择题1.下列哪项不属于信息检索的关键技术?(B )A.信息抽取B.文本挖掘C.自动文摘D.链接分析2.TREC测试集主要包括3个部分,下列选项中不是TREC测试集的一部分的是:(C )A.主题B.文档集合C.关键词D.相关性判断3.对向量空间模型、布尔模型及概率模型的表述有误的一项是:(D )A.向量空间模型与布尔模型相比具有较大的优势B.向量空间模型无法揭示索引项之间的关系,因而向量空间模型在理论上还是不够完善C.布尔模型是最早提出的信息检索模型D.概率模型也称二值独立检索模型。
它是在向量空间模型的基础上为解决检索中存在的一些不确定性而引入的。
4 利用文献后面所附的参考文献进行检索的方法称为(A )A.追溯法B.直接法C.抽查法D.综合法5、逻辑“与”运算符是用来组配()A.不同检索概念,用于扩大检索范围B.相近检索概念,扩大检索范围C.不同检索概念,用于缩小检索范围D.相近检索概念,缩小检索范围6、在《中国学术期刊全文数据库》中,不可以进行()检索A.逻辑与B.逻辑或C.逻辑非D.位置7、若想在《中国学术期刊全文数据库》中提高检索结果的查准率,可使用()A.在结果中检索B.优先算符C.或者D.位置检索9、下列检索式中,哪一种属于逻辑“与”?( B )A.室内装饰+室外装饰B.音乐﹡教学C.神雕侠侣–电视剧D.火星︱金星10、下列不属于查询构造方法的是:()A 分类查询B 单一词查询C 布尔查询D 上下文查询11、PageRank算法的理论基础是随机冲浪模型,该模型描述了网络用户对网页的访问行为。
下列不属于用户访问行为特点的是:()A 用户选择的起始网页是固定的B 用户会从起始网页含有的超链接中随机选择一个页面继续浏览C 当用户沿着超链接前进了一定数量的网页后,可能会对本主题厌倦,这时用户会重新随机选择一个网页进行浏览D 用户会重复以上的过程若干次12、信息过滤系统是应用信息过滤技术处理信息的应用系统,下列对其特点的说法错误的是:()A 信息过滤系统是针对无结构的或半结构化的数据设计的信息系统,这与传统的数据库应用有着本质的区别B 信息过滤系统只处理文本信息C 信息过滤系统一般处理的数据为输入信息流D 信息过滤系统要包含一组对用户过滤需求的描述13、《中国学术期刊全文数据库》提供的文献内容特征检索途径有()A.机构B.篇名/关键词/摘要C.中文刊名D.作者14、维护倒排文件通常需要的操作有( D )文档或文档集合。
基于WordNet的本体澄清
ma a e n n p l aino n oo y Tos leti r be ,e s su e or pa etr a h e ia e rs n a n g me t d a pi t fo tlg . ov hspo lm sn ei sd t e lc em st elxc lrp e e t— a c o
ห้องสมุดไป่ตู้
的质 量, 多的工作 集中在概念 建模 , 很 但是 本体表 示这 个非常 重要 的方面一 直被 忽视 。 目前本 体的表 示使 用的是 词
(em) 但 同一 个词 可 能有 很 多不 同的 意 思 , 样 在 基 于 本体 的 应 用 时 将 导 致 不 清 楚 或 错 误 的理 解 。 为 了解 决 这 个 问 tr , 这
题 , 用定义在 Wod t 使 rNe 中的词 义(es) sn e 而不是词 来作 为本体 的表 示 , 原 因是词 义只有唯 一的意 思。本体 澄 清的 其
定义为利 用 目标词周围的本体元素和被 它标 注的文档 附近的词 , 目标词 进行 自动消歧 的过 程 。通过计 算 目标词 义 对
和 它 的邻 居 词 的语 义相 似度 , 义相 关度 最 大 的 词 义 将 选 为 正 确 的 词 义 。 实验 表 明 , 们 的 算 法 有 很 好 的 性 能 。与 最 语 我 好 的 消歧 算 法 相 比 , 念 ( o cp) 度 差 不 多是 名 词 精 度 的 2 , 系 ( rp r ) 度 差 不 多是 动 词 精 度 的 3倍 。 实 概 C n e t精 倍 关 P o et 精 y
WordNet在图像语义分析中的应用
WordNet在图像语义分析中的应用摘要:WordNet在图像语义分析中具有很重要的作用。
它提供了对图像语义精准的描述,图像语义特征的提取。
本文介绍了颜色直方图,边缘方向直方图,边缘直方图,局部二值模式(LBP)等四种方法,并根据这几种方法的优缺点进行比较,综合每种方法的优点来对图像的语义进行分析。
关键字:WordNet 图像语义分析应用随着计算机科学技术的进步,尤其是图像语义分析的发展,人类所获得的图像信息越来越多,对图像语义分析的要求也越来越强烈。
在这众多的图像中,为了获得我们所需要的图片。
就要求我们提供好的图像检索技术。
以便准确的搜索出要找的图片信息。
在进行图像语义分析中,WordNet在图像语义分析中的应用就显得非常重要了。
1 WordNet发展概况在WordNet的早期阶段,研究人员主要是在考虑用关系语义来描述词义的方式是否能够大规模地广泛使用,而不是仅仅停留在玩具式的演示水平上。
到了研究人员确信这是可行的时候,他们就编制了应用软件来把想法变成现实。
实际上,在早期,Miller并没有关于构建一个大词库的完整想法。
初步设想是识别由字符串组成的最重要的词节点,并探索其中的语义关系模式。
当时的想法是,如果得到了正确的语义关系模式,词语的定义就能从中推理出来,因此,对于一个有关词义的关系网来说,词义的定义是多余的。
WordNet从一个简单的“词典浏览器”(dictionary browser)发展成一个自足的词汇数据库(self-contained lexical database),主要的进步是从1989年年初开始的。
当时Susan Chip man不满于WordNet仅仅作为一个词汇浏览器而存在,要求研究小组开发一个工具。
该工具可以在WordNet的基础上阅读一个文本,并报告文本中词语的各种信息。
这一工具即所谓的“Word Filter”(词过滤器)。
罕用的或不符合需要的词能够从小说文档中被过滤出去,而同时更常见的词语可以用来替代这些词。
基于WordNet的本体查询方法研究
基于WordNet的本体查询方法研究
陈淑鑫;张凌宇
【期刊名称】《郑州大学学报(工学版)》
【年(卷),期】2016(037)003
【摘要】不同的本体之间普遍存在着很多语义互操作的问题,如:语义冲突和结构异构,这些问题严重地影响了本体之间的知识共享和重用;同时也给本体查询服务带来了很大的困难,为此,提出一种基于WordNet的本体查询框架OQ-WordNet.该框架首先使用语义词典库WordNet来精确地计算不同本体(源本体)之间概念的相似度;然后通过本体集成和本体映射方法为所有源本体生成一个目标本体,并建立它们之间的语义映射关系;最后OQ-WordNet采用本体查询语言SPARQL来实现本体之间的查询功能.
【总页数】5页(P16-20)
【作者】陈淑鑫;张凌宇
【作者单位】齐齐哈尔大学计算中心,黑龙江齐齐哈尔161006;齐齐哈尔大学计算中心,黑龙江齐齐哈尔161006
【正文语种】中文
【中图分类】TG335.58
【相关文献】
1.基于本体查询的图书推荐方法研究 [J], 任武
2.基于本体的数字学习资源查询方法研究 [J], 江河
3.一种基于影视素材本体的关键词查询扩展方法研究 [J], 沈熠;赵琳
4.基于模糊本体的时空推理查询方法研究 [J], 王文靖;朱文德;王小康;李景文
5.基于本体的局部文档分析查询扩展方法研究 [J], 周剑烽
因版权原因,仅展示原文概要,查看原文内容请购买。
基于本体的语义检索系统的设计
基于本体的语义检索系统的设计
向胜军;赵一
【期刊名称】《北京石油化工学院学报》
【年(卷),期】2011(019)004
【摘要】因特网上现有的各种检索方法都是基于关键词的,而关键词检索的弊端就是它的低查全率和低准确率.在对比现有检索技术与语义检索技术之后,着重介绍了语义Web、本体以及相关的工具如Protégé、Jena以及SPARQL查询语言等,构建了一个花卉文献本体,开发出基于该本体的语义检索系统.该系统比较了传统检索与语义检索2种方式,验证了语义检索技术的优势所在,提供了简单的推理功能,可以对关于花卉的一些语句进行推理验证.
【总页数】6页(P59-64)
【作者】向胜军;赵一
【作者单位】北京石油化工学院,北京102617;北京航空航天大学,北京100191【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于本体的教育资源语义检索系统研究 [J], 于超;王璐;程道文
2.基于本体语义教务信息检索系统的设计与实现 [J], 张铁虎;朱嘉钢
3.基于本体的学习资源语义检索系统研究与设计 [J], 位传海;范太华
4.基于本体的WEB语义检索系统研究 [J], 张伟疆
5.基于本体的教育资源语义检索系统的实现探讨 [J], 黄以宝
因版权原因,仅展示原文概要,查看原文内容请购买。
一种基于WordNet和Corpus Statistics的语义相似性计算方法
一种基于WordNet和Corpus Statistics的语义相似性计算方法张东娜;周春光;刘彦斌;郭东伟【摘要】提出一种新的基于WordNet和文本集语义参数IC的计算方法, 通过综合考虑概念在WordNet中语义信息以及数据集中的概率信息, 即概念的自信息, 同时利用新的参数考虑概念对在WordNet中的共享信息, 设计了一种通用的概念语义相似性计算方法, 该方法简化了传统语义相似性算法, 并解决了语义相似性计算领域的相关问题, 可以应用在信息抽取、信息检索、文档分类及本体学习中. 领域通用的数据集R&B数据实验结果表明, 该方法在计算语义相似度问题上有效.【期刊名称】《吉林大学学报(理学版)》【年(卷),期】2010(048)005【总页数】6页(P811-816)【关键词】语义相似性;布朗词集;IC模式【作者】张东娜;周春光;刘彦斌;郭东伟【作者单位】吉林大学,计算机科学与技术学院,长春,130012;吉林大学,计算机科学与技术学院,长春,130012;吉林大学,计算机科学与技术学院,长春,130012;吉林大学,计算机科学与技术学院,长春,130012【正文语种】中文【中图分类】TP391.1实现一个有效的概念语义相似性计算方法在对自然语言处理及其相关领域有重要作用, 如在Web图像检索方面, 使用短文字的检索方法可以提高对于图片检索的精确度. 语义相似性计算在互联网为基础的应用程序方面有重要作用, 如可以提高网页分类的效率[1], 结合网页特征用于网页噪音处理等, 也可以促进本体自动学习注重概念的语义信息, 避免只考虑字形相似性.近年来, 一些语义相似性计算方法被相继提出, 总体上算法可以分为以下几类:(1) 基于单词之间的路径距离;(2) 以信息为基础(IC-based);(3) 以特征为基础的计算方式(feature-based);(4) 综合的计算方法[2].文献[3]提出的算法只考虑两个概念间在知识库层次结构中概念间的最短路径长度; Leacock等[4]提出的算法都是从路径长度以及概念的深度上考虑概念间的相似性; Resnik[5]提出了以IC(Information Content)为基础的方法, 该方法主要分析两个概念间在知识库中的共享信息; Lin[6]提出了IC计算方法, 但只是单纯的考虑了两个概念共享信息与两个概念分别带有语义信息的比率; Jiang等[7]提出了遵循IC模式的新路径距离算法.本文提出一种新的基于WordNet和Corpus Statistics的IC计算模式IC-CW, IC 是衡量概念的语义信息[8], 一个概念在文档中出现的概率越高, 表明它越抽象, 带有的语义信息越少[9]. 除了在文档集中出现的概率, 在知识库中(由IS-A关系构建的层次结构)也能反映概念的语义信息, 越靠近叶子节点, 含有越少子概念的节点含有的语义信息越丰富[10]. IC-CW多方面考虑了概念的语义信息, 可以充分体现概念的语义性差异. 在计算语义相似性时应该充分考虑两个概念的语义信息, 如果两个概念共享的语义信息越多, 说明两个概念越相似[11]. 在IC-CW的基础上, 本文综合考虑概念在WordNet中语义信息及文本集中的概率信息, 并针对目前已有语义相似性计算方法均与领域相关的特点, 设计了一种通用的计算方法SS-CW. 通过在领域通用的数据集R&B数据进行实验[12], 表明该方法在计算语义相似度问题上较其他算法与人工判断具有更高的一致性.1 基于文集与WordNet的IC计算模式IC-CW以IC为参数的语义相似性计算考虑的信息理论基础是语义相似性来源于概念对的共享信息量. 本文相似性计算以Princeton开发的WordNet词法库为相似性计算的基本知识库[13]. WordNet是一个在线的词汇参照系统, 与传统词典不同, 它使用同义词集合代表概念, 利用概念的IS-A关系将概念组合成标准的层次结构, 这个新的知识结构符合人类在某一个特定领域的常识, 也符合英语的基本语法. WordNet中部分名词形成的层次语义结构如1所示.图1 部分层次语义结构Fig.1 Hierarchical semantic knowledge base综合考虑概念在经典文本集Brown Corpus中出现的概率以及WordNet中概念的语义信息, 本文提出一种新的IC计算方法IC-CW(Information Content Based on Corpus Statistics and WordNet):(1.1)(1.2)IC(c)=(1-p(c))(1-WIC)/WIC,(1.3)其中: hypo(c)返回在WordNet中概念c的下义词(在WordNet中概念的子概念)个数; nodemax返回在WordNet单词分类中某一类中概念的总数; deep(c)返回在WordNet中概念c的深度; deepmax返回知识库概念的最大深度; W(c)表示知识库中概念c的下义词; k表示因素深度和下义词个数的因子.由式(1.1)可见, hypo(c)返回的下义词个数越多, 概念越抽象, WIC越小; 概念越靠近叶子节点, deep(c)越大, WIC也相应增大. 由式(1.3)可见, IC值随着概念在文集中出现的概率增大而减小, 随着WordNet中语义信息值WIC的增大而增大. IC-CW算法考虑了概念语义的多个因素, 可以充分体现概念的语义性差异.2 基于IC-CW的语义相似度计算方法SS-CW(Semantic Similarity Based on Corpus Statistics and WordNet)是基于IC-CW的语义相似性计算方法, 首先验证IC-CW的有效性. IC的计算方式可以较好反映概念的语义信息, 区分概念的语义性[2]. 越具体的概念出现的概率越小, 在知识库WordNet中越靠近叶子节点, 具有越少的子节点个数, IC值较大; 反之, IC值较小.2.1 IC-CW分析Nuno等[10]提出的模型被应用于许多经典的语义相似性计算算法中, 它只考虑了在知识库WordNet中概念的子概念一个因素, 公式如下:(2.1)图2为计算结果, 其中第一行为本文的计算结果, 第二行为Nuno模型计算结果, 改变k值可以调节式(1.1)中两项的权重, 在计算中k=0.5.图2 不同IC模式的计算结果Fig.2 Results of different IC models由图2可见, Nuno的IC模型只考虑了概念的子概念信息, 不能较好区分概念的语义性差别, 例如对于节点animal与child的计算结果完全相同, 但child节点很明显要比animal节点更具体, 在Nuno模型下并未区分. IC-CW更能反映概念的语义性差别.2.2 SS-CW算法以WordNet作为知识库计算概念间语义相似性时, 有很多经典算法. 本文提出一种新的计算方法, 在该方法中概念间的相似性涉及到如下3个因子:(1) 知识库中两个概念在知识库中的最短路径长度;(2) 两个概念的重合度:两个概念到根节点的路径中共享路径的比例;(3) 两个概念最小上层概念LSO(Least Common Object)的深度.在进行计算时重合度可以用LSO的深度与两个概念的深度代替. 因此, 概念间的相似度s(w1,w2)可表示成概念间的最短路径长度l、两个概念的深度hw1,hw2、概念间最小上层概念LSO的深度h的函数:s(w1,w2)=f(hw1,hw2,h,l).(2.2)综合考虑以上语义信息以及新的IC, 本文提出概念间相似性计算SS-CW算法公式如下:(2.3)(2.4)(2.5)其中: h表示LSO在知识库中的深度; hw1返回概念w1在知识库中的深度; hw2返回概念w2在知识库中的深度; α,β为式(2.5)中两个因子参数, 且α,β的取值范围均为(0,1]; LSO( )函数返回两个概念在知识库中的最小上层概念.传统相似性计算的最短路径距离[9]不能较好反映概念的相似性, 以图1中的节点(person,animal,boy)为例, person和boy与animal和boy距离相同, 但显然前者语义相似性更高. SS-CW算法中考虑l/rc(w1,w2), person和boy的计算结果是20, animal和boy的计算结果是24, 与最短路径相比, 它可以更好地反映概念的语义相似性. hp反映了两个概念在知识库中越具体、差异越小则相似性越大, 符合信息理论[12].在WordNet中概念由同义词集合t表示, 在计算概念间的相似性时会遇到3种情况: (1) 概念1和概念2在同一个同义词集合中; (2) 概念1和概念2不在同一个同义词集合, 但它们各自的同义词集合含有相同的同义词. 以图1为例, boy和girl 有一个共同的同义词child; (3) 概念1和概念2不在同一个同义词集合中, 也没有共同的同义词. 情况(1)中, 算法将最短路径设为0, 情况(2)说明两个概念有部分特征相同, 所以将路径设为1. 对于情况(3), 则要找到两个概念在知识库中的最短路径. 因此, SS-CW的总体计算公式如下:(2.6)其中c1i,c2j分别是概念w1和w2在知识库中概念同义词集合中的义元.3 实验结果与分析实验过程分为两个阶段: IC模式计算和概念间的相似性计算. 本文使用Rubenstein等[9]定义的65对语句, 对这些概念进行人工打分, 称为R&B数据集. 由上述65对概念抽取30对, 并对这些概念对进行重新打分, 每对概念的相似性分值在[0,1]间, 称为M&B数据集. 文本相似性计算在两个数据集上进行, 通过计算算法结果与人工判断结果的相关系数评价算法性能, 相关系数计算公式如下:(3.1)其中:Cov(x,y)=E{(x-E(x))(y-E(y))};D(x)和D(y)表示方差. 相关系数在[0,1]间, 其值越高表明算法性能越好.3.1 概念间语义相似性计算结果比较在R&B和M&C数据集上, 参数α,β取不同值时的计算结果列于表1, 由表1可见, α=0.10, β=0.45时得到的结果最好.表1 α,β取不同值时在R&B和M&C数据集上SS-CW计算结果Table 1 Results of SS-CW for α,β of different values in the R&B and M&C datasets数据集α=0.20,β=0.45α=0.10,β=0.55α=0.30,β=0.55α=0.40,β=0.78α=0.10,β=0.45R &B0.8520.8460.8300.8600.880M&C0.8750.8700.8530.8690.895α,β在进行多次实验后得到了一个优化值, 其中α=0.10, β=0.45时算法可以得到一个最优结果. 将文献[14]中概念语义相似性计算部分分别用本文算法SS-CW, Lin 方法以及文献[14]PMI-IR算法与人工判断进行比较, 在M&C数据集上的计算结果列于表2. 由表2可见, 本文算法SS-CW的计算结果与人工判断的计算结果具有较好的一致性, 尤其在当概念相似性为0.01~0.29以及0.60~0.96范围内时, 较PMI-IR算法以及Lin算法有明显的优势, 与人工判断一致, 但在其余的范围内并不完全优于PMI-IR算法.表2 在数据集上各算法的计算结果Table 2 Compared results of each algorithm on the dataset概念对号概念对定义人工判断Lin方法PMI-IR方法本文方法1Cord Smile0.010.330.060.045AutographShore0.010.290.110.089Asylum Fruit0.010.290.110.1213BoyRooster0.110.530.160.1217Coast Forest0.130.360.260.2021BoySage0.040.510.160.1825Forest Graveyard0.070.550.330.1329Bird Woodland0.010.330.120.0633Hill Woodland0.150.590.290.1937Magician Oracle0.130.440.200.1641Oracle Sage0.280.430.090.2447FurnaceStove0.350.720.300.3948Magician Wizard0.360.650.340.4049HillMound0.290.740.150.1650Cord String0.470.680.490.5251GlassTumbler0.140.650.340.2352Grin Smile0.490.490.320.3354JourneyVoyage0.360.520.410.4355Autograph Signature0.410.550.190.1856Coast Shore0.590.760.470.5357Forest Woodland0.630.700.260.6458Implement Tool0.590.750.510.5659Cock Rooster0.861.000.940.9260BoyLad0.580.660.600.6261Cushion Pillow0.520.660.600.5962Cemetery Graveyard0.770.730.510.7263Automobile Car0.560.640.520.5064Midday Noon0.961.000.930.9865Gem Jewel0.650.830.650.653.2 与IC-CW算法比较将本文算法与以IC为参数的经典语义相似性计算方法在R&B数据集上进行比较, 结果列于表3. 采用Siddharth Patwardhan and Ted Pederson[9]免费软件包,该软件包含了各种经典的语义相似性计算, 本文以经典IC模式的相似性算法Resnik算法, Lin算法, Jiang算法作为对照, IC公式如下:IC(c)=-log p(c),其中: 带*算法是将Nuno算法中的IC模式代替算法原模型; 带**的是采用本文IC-CW算法代替原模型; 最后为本文概念相似性计算算法SS-CW的结果. 由表3可见, 在利用新的IC计算模式IC-CW后, 以IC为基础的语义相似性计算与人工判断的相关性均有不同程度的提高, 同时验证了本文语义相似度计算算法SS-CW的有效性.综上所述, 本文提出一种基于WordNet 和 Corpus Statistics的IC计算方式IC-CW, 新的IC计算方法不同于传统的计算方法, 传统的IC计算方法只考虑了概念在经典文集中出现的概率, IC-CW除了考虑概率外也考虑了概念在知识库中的语义信息. 与传统的IC算法相比, 可以更好地反映概念的语义性, 区别概念间语义信息含量的差别. 在新的IC基础上本文提出了一种新的语义相似性计算方法SS-CW, 该算法不同于已有算法需要大量领域相关的知识, 它充分考虑了两个概念在知识库中的共享信息, 提炼概念在知识库中的信息, 实验结果表明, 该方法与人的常识判断具有更高的一致性.表3 人工相似性判断与算法相似性的相关系数Table 3 Coefficients of correlation between human rating similarity and machine similarity judgment相似性计算算法相关系数r相似性计算算法相关系数rResnik0.81Jiang and Conrath *-0.823Lin0.756Resnik**0.853Jiang and Conrath-0.779Lin**0.872Resnik*0.829Jiang and Conrath **-0.865Lin*0.845本文概念相似性计算算法0.895*将Nuno算法中的IC模式代替算法原模型; **采用本文IC-CW算法代替原模型. 参考文献【相关文献】[1] Park E K, Ra D Y, Jang M G. Techniques for Improving Web Retrieval Effectiveness [J]. Information Processing and Management, 2005, 41(5): 1207-1223.[2] Budanitsky A, Hirst G. Evaluating WordNet-Based Measures of Lexical Semantic Relatedness [J]. Computational Linguistics, 2006, 32(1): 13-47.[3] LI Yu-hua, Bandar Z H, McLean D. An Approach for Measuring Semantic Similarity between Works Using Multiple Information Sources [J]. IEEE Trans Knowledge and Data Eng, 2003, 15(4): 871-882.[4] Leacock C, Chodorow M. Combining Local Context and WordNet Similarity for Word Sense Identification [M]. Cambridge: MIT Press, 1998: 147-165.[5] Resnik P. Using Information Content to Evaluate Semantic Similarity in a Taxonomy[C]//Proceedings of the 14th International Joint Conference on Artificial Intelligence. San Francisco: Morgan Kaufmann Publishers Inc, 1995: 448-453.[6] Lin D. An Information-Theoretic Definition of Similarity [C]//Proceedings of the 15th International Conference on Machine Learning. San Francisco: Morgan Kaufmanm, 1998: 296-304.[7] Jiang J J, Conrath D W. Semantic Similarity Based on Corpus Statistics and LexicalTaxonomy [C]//Proceedings of International Conference on Research in Computational Linguistics. Taiwan: [s.n.], 1997: 19-33.[8] Lenhart Schubert, Matthew Tong. Extracting and Evaluating General World Knowledge from the Brown Corpus [C]//Human Language Technology Conference, Proceedings ofthe HLT-NAACL 2003 Workshop on Text Meaning-Volume 9. Morristown: Association for Computational Linguistics, 2003: 7-13.[9] Rubenstein H, Goodenough J B. Contextual Correlates of Synonymy [J]. Comm ACM, 1965, 8(10): 627-633.[10] Nuno S, Tony V, Jer H. An Intrinsic Information Content Metric for Semantic Similarity in WordNet [C]//Proceedings of ECAI’2004, the 16th European Conference on Artificial Intelligence Valencia. Penn State: Scientific Literature Digital Library and Search Engine, 2004.[11] ZHANG Chang-sheng, SUN Ji-gui, CUI Yan, et al. PSO Based Partition Clustering Algorithms [J]. Journal of Jilin University: Engineering and Technology Edition, 2008, 38(6):1371-1377. (张长胜, 孙吉贵, 崔妍, 等. 一种基于PSO的分割聚类算法 [J]. 吉林大学学报:工学版, 2008, 38(6): 1371-1377.)[12] LIU Lei, SONG Ya-juan, REN Ping. Semantic Web Service Discovery Method Oriented for Composed Web Service [J]. Journal of Jilin University: Science Edition, 2010, 48(2): 256-264. (刘磊, 宋雅娟, 任平. 一种面相组合服务的语义 Web服务发现方法 [J]. 吉林大学学报:理学版, 2010, 48(2): 256-264.)[13] ZHU Hui-feng, ZUO Wan-li, HE Feng-ling, et al. A Novel Text Clustering Method Based on Ontology [J]. Journal of Jilin University: Science Edition, 2010, 48(2): 277-283. (朱会峰, 左万利, 赫枫龄, 等. 一种基于本体的文本聚类算法 [J]. 吉林大学学报:理学版, 2010,48(2): 277-283.)[14] Aminul I, Diana I. Semantic Text Similarity Using Corpus-Based Word Similarity and String Similarity [J]. ACM Transactions on Knowledge Discovery from Data, 2008, 2(2): Article 10.。
基于WordNet的Web服务发现模型
基于WordNet的Web服务发现模型
丁文文
【期刊名称】《微计算机信息》
【年(卷),期】2007(023)024
【摘要】针对目前语义Web服务发现机制只能基于一个本体发布,查找的缺点,结合WordNet本体库与OWL-S语义描述语言设计一个语义明确的Web服务发现模型.该模型中采用OWL-S对Web服务进行语义描述,对领域相关本体中的概念进行预处理,以WordNet提供的术语语义为基础,建立一个全局领域相关本体.这种全局领域本体建立方法避免了因对概念理解不统一而产生的不一致性,得到的本体易于扩展.
【总页数】3页(P191-193)
【作者】丁文文
【作者单位】710071,西安,西安电子科技大学
【正文语种】中文
【中图分类】TP301
【相关文献】
1.基于WordNet和SUMO本体集成的自动语义检索及可视化模型 [J], 胡泽文
2.基于WordNet和SUMO本体集成的自动语义检索及可视化模型 [J], 胡泽文
3.基于熵的WordNet概念IC模型 [J], 何艳;周子力
4.基于WordNet和Kernel方法的Web服务发现机制研究 [J], 王东睿;杨庚;陈蕾;
张迎周
5.基于WordNet和二分图的语义Web服务发现算法 [J], 华建新;曹敦
因版权原因,仅展示原文概要,查看原文内容请购买。
面向高速公路网知识管理的SUMO扩展本体
随着我国高速公路网体系的不断完善,信息化和智能化成为新的高速公路网发展趋势,也是有效解决现存营运难题、维护道路安全畅通、全面提升高速公路网效益的前提和保障。
由于长期遗留的分段式建设、分散化管理模式,我国高速公路网内不同部门、不同系统之间在交通领域知识的理解和表达上往往存在差异,如何消除这种差异是目前我国高速公路网信息化、智能化建设亟需解决的重要问题。
本体(ontology)是对客观知识的系统化、明确化和规范化说明,根据本体驱动思想建立交通领域知识的语义视图,是实现领域知识管理和信息集成共享的有效手段[1-2]。
目前,交通本体已成为智能交通技术研究的一项重要内容。
在工业界,美国国防部DARPA根据《2002年CIA各国基本国情收集》等资料开发了一套基于DAML语言的交通本体[3];以此为基础,IEEE上层本体标准化组织SUO开发了推荐上层合并本体SU-MO的交通领域推荐本体[4];欧洲标准化组织CEN提出了交通地理数据标准GDF,并与开放地理空间信息联盟OGC的GML 标准、日本的KIWI标准及ISO/TC211系列标准相互融合,形成了更为权威的ISO14825国际标准,其本体化工作也在逐渐展开[5]。
在学术界,科研工作主要从交通本体理论、交通本体构建、本体映射、本体知识推理与查询、基于本体的信息集成方案等方面展开。
在国内,武汉大学李德仁院士针对交通数据的空间性、时变性和模糊性,引入空间关系描述、状态行为面向高速公路网知识管理的SUMO扩展本体郭军杰1,闫茂德2GUO Jun-jie1,YAN Mao-de21.长安大学汽车学院,西安7100642.长安大学电子与控制工程学院,西安7100641.School of Automobile,Chang’an University,Xi’an710064,China2.School of Electronic and Control Engineering,Chang’an University,Xi’an710064,ChinaE-mail:xmkguo@GUO Jun-jie,YAN Mao-de.SUMO-based ontology for knowledge management in chinese freeway puter En-gineering and Applications,2010,46(35):14-17.Abstract:Regard to the problem of the inconsistent understanding of domain knowledge among different departments and heterogeneous systems in Chinese freeway network,an ontology named SFNO is developed by extending suggested upper merge ontology(SUMO).SFNO consists of two parts,which SFNO-basic is the set of shared concepts and relations,whereas SFNO-core constructs a comprehensive semantic view of the domain knowledge structure in a modular approach.Then,the consistent representation of domain knowledge for freeway network with SFNO is explained through an instantiating scenario of this ontology,which demonstrates that SFNO is feasible for eliminating knowledge ambiguity and can better promote up-per applications like knowledge management and information integration for Chinese freeway network.Key words:freeway network;suggested upper merge ontology;ontology;knowledge management摘要:针对我国高速公路网交通领域知识的不一致理解问题,通过扩展推荐上层合并本体SUMO设计了面向高速公路网领域知识管理的SFNO本体,包含SFNO基础和SFNO核心两个部分,前者定义了共享概念及关系,后者分单元建立了高速公路网交通领域知识结构的语义视图。
基于WordNet词义消歧的系统融合
基于WordNet词义消歧的系统融合刘宇鹏;李生;赵铁军【期刊名称】《自动化学报》【年(卷),期】2010(036)011【摘要】最近混淆网络在融合多个机器翻译结果中展示很好的性能.然而为了克服在不同的翻译系统中不同的词序,假设对齐在混淆网络的构建上仍然是一个重要的问题.但以往的对齐方法都没有考虑到语义信息.本文为了更好地改进系统融合的性能,提出了用词义消歧(Word sense disambiguation,WSD)来指导混淆网络中的对齐.同时骨架翻译的选择也是通过计算句子问的相似度来获得的,句子的相似性计算使用了二分图的最大匹配算法.为了使得基于WordNet词义消歧方法融入到系统中,本文将翻译错误率(Translation error rate,TER)算法进行了改进,实验结果显示本方法的性能好于经典的TER算法的性能.【总页数】6页(P1575-1580)【作者】刘宇鹏;李生;赵铁军【作者单位】哈尔滨工业大学计算机科学与技术实验室机器翻译与智能实验室,哈尔滨,150001;哈尔滨工业大学计算机科学与技术实验室机器翻译与智能实验室,哈尔滨,150001;哈尔滨工业大学计算机科学与技术实验室机器翻译与智能实验室,哈尔滨,150001【正文语种】中文【相关文献】1.基于WordNet的无导词义消歧方法 [J], 王瑞琴;孔繁胜;潘俊2.基于边权重的WordNet词语相似度计算 [J], 郭小华;彭琦;邓涵;朱新华3.基于WordNet词义消歧的语义检索研究 [J], 高雪霞;炎士涛4.基于WordNet的因素空间算法在搜索引擎中的应用 [J], 郑文良;关世杰;尹安琪;刘旭东5.基于Word2Vec的WordNet词语相似度计算研究 [J], 陈丹华;王艳娜;周子力;赵晓函;李天宇;王凯莉因版权原因,仅展示原文概要,查看原文内容请购买。
基于WordNet和HowNet建设双语语义词典
基于WordNet和HowNet建设双语语义词典
张晶;姚建民;赵铁军;李生
【期刊名称】《高技术通讯》
【年(卷),期】2001(011)012
【摘要】针对当前语义信息往往需要手工获取的现状,探讨了利用英语义类词典WordNet和汉语概念词典HowNet资源,为双语机读词典ECDic2K的英语词条添加概念和语义类的自动方法,以改善手工添加语义类带来的低效率和不一致性等问题.实验表明,该方法向英汉双语机读词典ECDic2K的35848词条译文项自动添加语义信息,而改造后的双语语义词典为单语语义分析中的成熟技术用于跨语言研究提供了方便,这在机器翻译和跨语言检索等自然语言处理领域具有很高的实用价值.【总页数】5页(P28-32)
【作者】张晶;姚建民;赵铁军;李生
【作者单位】哈尔滨工业大学计算机科学与技术学院,;哈尔滨工业大学计算机科学与技术学院,;哈尔滨工业大学计算机科学与技术学院,;哈尔滨工业大学计算机科学与技术学院,
【正文语种】中文
【中图分类】TP39
【相关文献】
1.基于WordNet的语义分布词典建设 [J], 张会平;吕学强;施水才;李渝勤
2.双语教育课程设计及课程资源r——基于广东省深圳市宝安区凤凰学校双语教育
课程建设的实践 [J], 廖柏灵
3.基于WordNet的藏文语义词典半自动构建方法研究 [J], 柔特
4.双语师资队伍建设的成效及对策研究——基于青海省民族地区双语师资队伍的调查分析 [J], 张诗雅;马少云
5.基于就业引导的高职旅游类双语核心课程建设——以《领队业务》双语课程为例[J], 朱丽
因版权原因,仅展示原文概要,查看原文内容请购买。
基于WordNet语义知识库的英语学习者作文局部连贯自动评价
基于WordNet语义知识库的英语学习者作文局部连贯自动
评价
刘国兵
【期刊名称】《河南师范大学学报:自然科学版》
【年(卷),期】2016(44)6
【摘要】首先从中国学生英语口笔语语料库中随机抽取80篇同题作文作为研究语料,利用WordNet语义知识库,从中提取与学习者作文局部连贯相关的预测因子;然后,将其与学习者作文局部连贯人工评分相比,通过多元线性回归分析的方法创建作文局部连贯自动评价模型.性能试验结果显示,学生作文语篇局部连贯人工评分与局部连贯评价模型预测值之间的线性关系较强;与同类模型相比,预测结果更为可靠.【总页数】10页(P149-158)
【关键词】WordNet;学习者作文;局部连贯;评价模型
【作者】刘国兵
【作者单位】河南师范大学外国语学院;语料库研发中心
【正文语种】中文
【中图分类】TP391;H08
【相关文献】
1.基于语义网技术的英语作文自动评判应用研究 [J], 谢少华
2.大学英语学习者书面语语篇连贯自动评价模型的创建 [J], 刘国兵
3.自动作文评阅系统对不同水平学习者英语写作能力的影响——基于句酷批改网的研究 [J], 黄绍莹;张荔;
4.向心理论在英语写作连贯性量化评价中的应用——一项基于中国英语专业大学生英语作文语料库的实证研究 [J], 洪明
5.向心理论应用于英语学习者书面语语篇局部连贯评价的有效性研究 [J], 刘国兵;常芳玲
因版权原因,仅展示原文概要,查看原文内容请购买。
基于差异化信息融合的语义信息检索模型
基于差异化信息融合的语义信息检索模型
王哲
【期刊名称】《微电子学与计算机》
【年(卷),期】2014(0)8
【摘要】研究语义信息检索方法,提高检索的效率.差异化信息由于特征差异过大,在检索过程中存在较大排异现象,传统的语义信息检索模型针对大差异信息检索过程中,以多轮次检测为主,效率很低.为此,提出一种基于决策树算法的语义信息检索方法.根据多层次解析融合相关理论,计算窗口函数,并且根据窗口函数进行不同层次数据的融合,得到差异信息融合结果.根据上述结果,建立决策树,实现语义信息的检索.实验结果表明,利用改进算法进行语义信息检索,能够提高检索的效率.
【总页数】5页(P159-162)
【关键词】信息融合;信息检索;多层次解析;决策树
【作者】王哲
【作者单位】河南中医学院信息技术学院;东华大学信息科学与技术学院
【正文语种】中文
【中图分类】TP391.1
【相关文献】
1.基于语义索引词的语义网信息检索模型 [J], 虞为;曹加恒;曾承;黄敏;陈俊鹏
2.基于语义图模型的跨语言网络信息检索方法研究 [J], 李冉
3.基于知识元语义描述模型的领域知识抽取与表示研究——以信息检索领域为例
[J], 石湘;刘萍
4.基于知识元语义描述模型的领域知识抽取与表示研究——以信息检索领域为例[J], 石湘;刘萍
5.基于差异化融合的语义信息检索模型仿真 [J], 王哲;徐燕文
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
GL UE[
、
On o p t Ma
、
COM A + + 【2 1]
。
并针对 本体集 成 中存在 的问题 ,
提出很多不同 的本体集 成解决 方案 , 中应用 较 其 为广泛的本 体集 成解 决方 案 是德 国卡 尔斯 鲁 厄
大 学 A F 研 究 所 Su m 和 Mad h 在 IB tm e G eee A 20 提 出的基 于形式 概 念分 析 ( C 01 F A) 的 本 体
动语 义检索及可视化模 型。实验表 明这种模型 能够过 滤掉 大量 与用户查询 无关的信 息, 高信 息检 索 提 系统的检准率 , 并很好地满足用 户可视化和个性化检 索需求 。图6 。表 2 。参考文献 3 。 4
关键词 本体集成 语 义检 索 可视 化 概 念语 义 图 模 型
A bsr c t a t:Th r tl x sss me p o lm si h r ci a pp iain o e n i ere a , u h a r e st e e si e it o r b e n t e p a tc la lc t fs ma tcr t v l s c shadn s o l o i a qur e ey i e t c mplx c mp i r c s fl tn e n i n e s l a e fd man ntlg c ieus Fsqu r ntn , o e o ut ng p o e s o ae ts ma tc i d x, mal r a o o i o oo y c v r g po rc n e t s ma tc tpe , o ra o tc e e , ec Ai n tt e e r b e o e a e, o o c p e n i y s lwe utma i lv l t . mi g a h s p o l ms,h s p pe t t i a r pu s
Hw e o Nt 和企业领域本体库 等 , 由于开发者 、 应
用 目的 和应 用 领 域 有 所 不 同 , 们 在 本 体 描 述 语 它
集成方法 。该方 法能 够有效 解决 本体 集成 领 域 中存在 的一些 问题 , 过通过形 式概 念分析 构 不
建 概 念 格 的过 程 较 复 杂 , 此 仅 适 用 于 轻 量 级 本 因
1 国 内外研 究现 状
1 1 本体集成 . 本体在实现语义 We b服务 、 义分类与智 能 语 检索方面有着举足轻 重 的地 位 , 近年来 成为 国 内 外学 者关 注 的焦点 , 些著 名机 构 、 一 企事业 单 位 设计 了很多语义 丰富且具有 实用 价值 的本 体库 ,
d ma d o iu l ain a d i d vd ain e n f s a i t n n i iu t . v z o o
Ke ywor ds:On oo y I tg ai n;S ma tc Rere l t lg ne r to e n i tiva ;Viu lz to s a iain;Co ce ma tc M a n ptSe ni p; M o l de
sb c,n o o l i poetepeio fno t nrtea ss m,u a ow l stf uesrtea uj tadnt n rv rc i o i r i e ivl yt b t l el aiy sr er v e ym h s n f ma o r e s s il
fr a d t e a t mai e n i ere a n i aiain mo e a e n W od e n U o w r h u o t s ma t r t v l d vs l t d l s d o r N ta d S MO o tl g tg a c c i a u z o b n oo y i e r — n tn i .Ex e i n h w : h r p s d mo e a l ro t r en mb r f no main u r ltd t s rq e y o pr me t o s t e p o o e d l n f t u l g u e fr t n eae ou e u r s c ie aa oi o
如 S MO 、 rN t 、 B ei 、 pn y [ 、 U … Wod e D p da O eC c [
究已有 1 年的历 史 , 计 了一批 功能 丰富、 O多 设 技
术先 进 、可 操 作 性 强 的 本 体 集 成 工 具 ,如
PROM P T[
、
Ono e g [ tM r e
胡 泽 文
H U Ze n we
摘 要 针 对语 义检 索在 实 际应 用 中 面 临 的 用 户查 询 意 图 获 取 困 难 、 在 语 义 索 引 计 算 复 杂 、 域 本 潜 领 体覆盖 范围小、 概念语义类型不丰富、 自动化程度低 等 问题 , 出基 于 Wod e 和 S MO本体集成 的 自 提 rN t U
・
信息组织 ・
基 于 Wod e 和 S MO本 体 集 成 的 自动语 义 rN t U 检 索 及 可视 化模 型
Au o ai e a t ti v l a d Viu lz to o e s d o 0 d e n t m t S m n i Rere a n s ai ai n M d l Ba e n W r N t a d c c S M O t l g n e r to U On o o y I t g ai n