基于领域本体的智能检索模型
基于领域本体的信息语义相关检索
(c o l f o ue ce c dIfr t nT cn lg , a g i r aUnvri , ul 4 0 4 Chn ) S h o mp tr inea omai eh oo yGu n x No l iesy G in5 10 , ia oC S n n o m t i
体 ,应用本体 。
理解能力较差 。因此,如何提 高搜索 引擎 的语 义处理能力成
为提高检索质量 的关键技术之一 。 用户检索项推荐技术属于 中文语义相 关度计算问题 ,相 关度计算模型 的设 计直接 影响到推荐项的相关性和合理性 。
以及实例之间 的关系 ,得到 的结果较合理 。
关奠诩 :语义相 关;领 域本体 ; 概念 格 ;信息检索 ;用户检索项推荐
I f r a i n S m a tcRea i iy Re r e a l l n o m t0 e n i l tv t t i v l C
Ba e n Do a n O n o o y s d0 m i t lg
[ sr c]I re rv esmat rcsigcp ct f erhe gn stkn ui fr x mpeti ae rp ss d l ae Abta t nod roi o et ni po esn aai o ac n ie,aigt r m a l, s p r o oe mo e sd t mp h e c y s o s oe h p p a b
ge ao 索 引擎 中都得 到广 泛运 用。大多数搜 索引擎的检索项推荐技 术采 用关键字 匹配方式 ,推 荐项大多基于关键字的扩展 ,部 分推荐结果甚至和 用户的查 询意图毫无关系 ,对 自然语言的
基于领域本体的文献智能检索模型研究
Me ng Ho n g we i Zh a n g Zh i p i n g Zha n g Xi a o d a n
( I n s i t t u t e o f S c i e n i t i f c a n d T e c h n i c a l I n f o r ma t i o n o f C h i n a ,B e i j i n g 1 0 0 0 3 8 )
关键词 领 域 本体 文 献检 索 语义标注 概 念 相 似 度
中图分类 号
G 3 5 4 . 0 0 2 - 1 9 6 5 ( 2 0 1 3 ) 0 9 - 0 1 8 0 - 0 5
Re s e a r c h o n I n t e l l i g e n t I n f o r ma t i o n Re t r i e v a l M o d e l Ba s e d o n Do ma i n On t o l o g y
现象时 , 检索结果与用户 的需求就无法实现高度吻合 。
向智 能化 的方 向发展 。
1 基 于领域 本体 的 文献检 索研 究现 状
智 能检 索的 目标是为用户提供既相关又准确 的信 息, 尽可能保证较 高 的查全 率 和查 准率 。本 体是 对概 念的明确描述 , 可 以把某个领 域抽 象为一组 概念 与概 念间的关 系 , 具有 较好 的概念层 次结构 。把 本体 融合 到信息检索技术 中 , 可 以实现对 概念关 系 的处理 。总 的来 说 , 本 体在信 息检索 中可 以起到概念定义 、 查询模 型和推理基 础的作 用 J , 因此 , 基 于本体 的智能检索研
Ab s t r a c t Th i s p a p e r p r o p o s e s a mo d e l o f d o ma i n o n t o l o g y- b a s e d i n t e l l i g e n t i n f o r ma t i o n r e t ie r v a l ,a n d ma k e s i n— d e p t h s t u d y o n o n t o l o g y c o n s t r u c io t n n d a s e ma nt i c nn a o t a io t n .T h e mo d e l i s a p p l i d e t o p r a c t i c l a a p p l i c a io t n .S at t is t i c s i n  ̄c me ha t t he t r e t r i e v l a s y s t e m b a s e d o n d o — ma i n o n t o l o g y h a s n a e n o r mo u s p o t e n ia t l o f a p p l i c a t i o n .
基于领域本体的垂直搜索引擎模型的研究
on I a o e sn m gePr c s i g, M a c r h200 v 31 n 3: 2 5 5. 9, , P 55 — 5
4何 检 测 J EG 图像 中 量 化 表 的一 致性 来 判 断 图 像 的 [] P
随 着 网络 的 飞 速 发 展 ,We b信 息 呈 爆 炸 性 地 也 使 人 工 智 能 化 的 搜 索 引擎 得 到 了 学 术 界 的 广 泛 增 长 ,如 何 在 浩 瀚 的 网络 中找 到 人 们 需 要 的 信 息 关 注 。 变 得 更 加 的重 要 。 传统 的 搜 索 技 术 虽然 满 足 了人
s ma i e r hTh spa rg veane m o l : ria e r h e gie b s d n m an o ol y. i od lwa e ntcs a c . i pe a w du eave t ls a c n n a e o do i nt og Th sm c e smor e
收稿 日期 :2 1—33 000 —1 作者 简介 : 林碧霞 ,在读 硕士 研究生 ;尹治本 ,教 授。
近年来 , 本体 理 论 的发 展 、 熟 也 为 搜 索 引 擎 成
的 发 展 带 来 了 新 的 动 力 ,也 为 提 高 检 索 系统 的查
全 率 和 查 准率 提 供 了进 一 步 的 保 证 。本 文 在 现 有
垂 直搜 索 就 是 针 对某 一 行 业 的专 业 搜 索 引擎 ,
们 一 定 的需 要 , 但是 由于 其 通 用 的 性 质 , 然 不 能 是 对某 类 、某 行 业 、某 领 域 的 信 息 的 采 集和 整 合 , 仍 满 足不 同背 景 、不 同时 期和 不 同 目的的 查 询 要 求 。 从 而 为 某 一 类 人 群 或某 一 领 域 的 用 户提 供 专 业 和 同 时 如 何 让 计 算 机 理 解 用 户 所 要 查 询 的 信 息这 也 精 准 的信 息 f。其 特 点就 是 “ 、精 、深 ” 1 1 专 ,具 有 是 当 今 搜 索 领 域 面 临 的 一 大 挑 战 。传 统 的通 用搜 很 强 的行 业 和 领 域特 色 。 索 引 擎 的 不 足 催 生 了垂 直 搜 索 引 擎 的 发 展 ,同 时
基于本体的领域知识建模研究共3篇
基于本体的领域知识建模研究共3篇基于本体的领域知识建模研究1领域知识建模是一种在特定领域内捕获,组织和管理知识的过程。
本体是目前最流行的知识表示和处理技术之一,可以用于领域知识建模。
本文旨在介绍本体及其如何用于领域知识建模。
本体是一种用于知识管理和语义Web的技术。
它是一个共享的、形式化的概念结构,描述了一组概念和它们之间的关系。
本体由一组术语、定义和规则组成,用于表达领域中的概念、事实和关系。
本体的核心思想是将概念和关系概括成一个共享的、标准化的组件,使得它们能够被计算机程序理解、计算和操作。
领域知识建模是利用本体技术获取、表示、组织和应用特定领域的知识。
首先,我们需要分析该领域的知识,并将其表示为本体的形式。
本体的构建需要遵循本体设计的规则和原则。
在本体构建期间,我们需要考虑以下因素:1.领域的范围和边界:确定实体和概念覆盖的范围和边界。
2.概念的抽象级别:选择最适合领域内概念描述的抽象层次。
3.相关概念的关系:确定研究领域内概念的关系。
4.应用场景:为特定应用场景更新本体的设计,使其更贴近应用需求。
当本体构建完成后,我们可以使用它来表示领域知识,并将其用于领域相关的应用程序中。
本体可以支持各种知识管理应用,例如:1.智能搜索:用于对领域内有关信息和资源进行发现和搜索。
2.决策支持:基于领域本体的决策支持系统。
3.语义网应用:支持语义Web应用的本体基础架构。
总之,领域知识建模是一种利用本体技术获取、表示、组织和应用特定领域的知识的过程。
本体是目前最流行的知识表示和处理技术之一,可以用于领域知识建模。
构建本体需要考虑领域的范围和边界、概念的抽象级别、相关概念的关系和应用场景。
对于应用程序,可以使用本体来支持各种知识管理应用,例如智能搜索、决策支持和语义网应用。
基于本体的领域知识建模研究2随着人工智能技术的快速发展,基于本体的领域知识建模模型成为了研究热点之一。
在众多的领域应用中,基于本体的领域知识建模技术能够帮助实现智能分类、推荐、搜索等任务,同时还能够为人们提供更加准确的知识查询和决策支持。
基于领域本体的智能检索模型
回信息过多 , 有很多无关信息 , 用户须从结果 中进行筛选 。
数据检索_ 主要针对 结构 化信 息系统 , 询要 求 和数 据 1 ] 查
遵循一定 的格 式 , 具有 一定 的结构 , 许 对特 定 的字 段 检 索 允
2 系统模 型框 架
综合传统信 息检索的模型和概述 中提到 的基 于本体 的信
综上, 8种传统 的检索 方式对 海 量信 息资 源检 索 的查 准
() 2 用户查询 请求 的处理 。将 用户输入 的查 询请求 映射
到构建的领域本体库概念上 , 最终形成检索关键词概念 。
基 金 项 目 : 家 “ 一 五 ” 技 支 撑 计 划 基 金 资 助 项 目“ 识 组 织 系 统 国 十 科 知
息检索方 法 , 本文提 出基 于领域 本体的信息检索模型 , 从基 于 主题 词表构建 领域本体 出发 , 设计基 于领域本体 的信息检 索
( 例如 : 作者 =“ 金庸” , ) 比较有 代表 性 的是各种 商业 数 据库 。
数 据 检 索 依 赖 于 编 码 的质 量 , 索 花 费 大 , 出 的 信 息 相 对 准 检 检 确 , 容 易 漏 检 , 具 有 很 大局 限性 。 但 也 主 题 检 索 ¨ 以人 工 方 式 或 半 自 动 方 式 收 集 信 息 , 文 档 1 ] 对 访 问 后 , 写 文 档 描 述 , 之 添 加 到 合 适 的事 先 确 定 的 主 题 类 编 将
kew o dq r ig c n e t Byc lua i hedo u e tsmia i y r ueyn o c p . ac lt ngt c m n i lrt y,t emo e eu nssa c e u t n h wst eb te ere a rcso ae h d lrt r e r hr s lsa d s o h et rr tiv lp e iin r t
一种基于领域本体的混合信息检索模型
图 1. 语义检索基本框 架
方法构建领域本体实现语义检索 J然而构建一个能够涵盖 。,
领域内所有知识 的本体是很 困难甚至是不可能的 。 目前对 基于 本体 的应 用研究也都是假设本体 中包含了所 需 的全部知识 ,而在 实际应 用中,当本体 中没有可用的知识
r t e a , n mp o e e re a e o ma c . e r v l a d i r v sr t v l r r n e i i p f
[ ywo d |d ma noo y h bi fr t nrte amo e; ewod e ivlsmat tea Ke r s o i o tlg ; y r i omai r vl dlky rs te a;e nir r v l n dn o ei rr ce i
信息检索领 域, 本体是解决语义层次上 We b信息共享和交换 的基础 ,是实现语义检索 的关键 。目前 ,基于本体的语 义检
索主要分为 2 : 类 () 用现有本体( Wod t H w t 1利 如 rNe, o Ne 提供的语义信息 )
完成语义检索 J 但 由于这些都是通用的本体,对各个具体 , 领域内知识的揭示不够全 面、深入 ,因此对具体领域信息的
构 和对逻辑推理 的支持 ,能够通过概念之间的关系表达概念 的语义信息 ,实现信息 的语义表示 ,因此 ,在语义检索中发
挥 了重要作 用。基于本体 的语义检索框架结构如图 1 所示 。
领域专
本体作 为一种能在语义和知识层次上描述信息系统的概
念模 型的建模工 具,在许 多领域得到 了广泛应用 ,特别是在
基于领域本体的贝叶斯网络检索模型研究
信息 , 而另一方面, 如何在如此繁杂 的信息中检索到 真正需要 的信息却变得越来越 困难 。特别是传统 的 基 于关键 字 匹配 的检索方 法 , 在查 全 率 和查准 率 上无 法 取得令 人 满意 的结果 - 。因此许 多 研究 者开 始关 】
注基于语 义 的检 索 方 法 。本 体 由于 具 有 良好 的概 念
i r v h t e a e oma c h o g h x r n s mp e t e r r v lp r r n e t r u h t e e p i o ei f e me t. Ke r s d man o tl g ;Ba e in n t r y wo d : o i no o y y sa ewo k;if r ai n r t e a no m t r v o e i l
e) 和 L M. eC m o ,. F mr dzL n 人 1¨ . d a p s J M. e n e—u a等
提 出的 贝 叶 斯 网 络 检 索 模 型 ( aei e okR — B ys nN t r e a w
tea Mo e) 。 r vl d 1 i
t e u e ’ u r st e e s ma t x a so r u h d ma n o tlg s c n ,t e e p d d q e e v d n e a es r a o h s r sq e e og t h e n i e p n i n t o g o i no o y; e o d h x a e u r sa e ie c r p e d i t c h n i s d i h a e in n t o k r t e a d la d g t u r e u t.I i h w a e p p s d B y sa ew r ere a d e a n t e B y sa ew r er v l i mo e n e e y r s l q s t ss o n t t h r o e a e i n t o k r t v mo l n h t o n i l C
一种基于本体的信息检索模型
Ab t a t I r e o sle te p o lmso h rd t n lifr t n r t e a b sd o ewod ny a ay ig k y od rm s r c : n od r t ov h rbe ft e t io a nomai er v l a e n k y r s o l n l n e w r s f a i o i z o
息, 到 问题的特征信 息或关键词 。 得 然后特征信 息通过 同领 域本体 中概念 或者属性 的匹配 并遵循一系 列的规 则构建查 询本体 。 具体实现时 , 经过分词 及过滤之后得 到待查询 的关 键词集 合 ,然后在 领域本 体库的支 持下 ,使 用 smop i - rhs m
算法实现 查询 关键词 到领域本体 库 中词语 的映射 ,得到概 念集合 , 并借助领 域本体库构 建概念 之问的关 系, 从而构 建
1 2月 1 8目的 X 0 0的会 议上提 出的 并认 为未来 的 网 ML 2 0 络是 向语义 网发展, 这个 网络 不同于 以前 的网络 , 是一个 机
检 索, 就是通 过一定的手段 和方法 , 利用计 算机程序 自动分 析信 息资源的语义信 息 ,查 找和发现具有特 定知识单元 的 信息 资源 。 因此 , 义网体系 结构 的二 、 、 语 三 四层是基于语义 网的语 义检索实现 的关键 。 体层作 为语义 层, 本 崩来描述分 布在 网上 的异构的信息 内容 , 是实现 语义 网检索的核心 。 不 的领域 需要 构建不 同的领域本体 ,计算机之 间通过对本 体的理解来交流 领域之 间的信息 。语 义网上每个 文档都是
1 于 本体 的语 义 网检 索模 型 基
基于领域本体的个性化信息检索研究与应用
基于领域本体的个性化信息检索研究与应用摘要本文首先介绍了个性化信息检索,然后解释了个性化信息检索的内涵,并介绍了个性化信息检索的相关技术,接着对基于领域本体的个性化信息检索进行了研究,探讨了本体描述语言以及构建本体的原则和步骤,论述了基于领域本体的个性化信息检索的基本原理,最后给出了基于领域本体的个性化信息检索的功能模块的论述。
关键词领域本体;个性化信息检索;构建本体中图分类号tp393文献标识码a 文章编号1674-6708(2010)21-0208-021 个性化信息检索的内涵和相关技术个性化信息检索是指根据用户的兴趣和特点进行检索,得到能够满足用户个性需求的信息,是一种能培养个性化趋势的检索方法,高效率地为用户提供检索服务,返回与用户需求相关的检索结果。
个性化信息检索的检索条目既可以是内容检索,也可以根据其它事件的关系检索。
个性化信息检索以用户检索行为为中心,与用户查询经历有关。
个性化信息检索的相关技术包括用户建模技术、智能agent技术、个性化推荐技术、数据挖掘技术等。
2 基于领域本体的个性化信息检索2.1本体描述语言目前,出现了基于人工智能的本体描述语言和基于web的本体描述语言等本体描述语言。
其中owl是基于web的本体描述语言,是目前w3c开发的一种语言,它能够取得表达力和推理复杂度之间的平衡,不仅能够使表达web上信息的需求得到满足,而且能够使得推理复杂度得到控制,对于应用的开发提供了便利条件。
2.2构建本体的原则和步骤建立本体时,应按以下的原则来进行指导。
1)明确客观:即对于建立本体时定义的术语,本体用自然语言给出的语义定义,能够明确有效地表述独立于计算机环境的概念知识的内容,并且客观地和形式化地定义概念名称,是明确客观的,能够尽可能地使用标准术语来准确地表达概念项的内涵。
2)完整性:即本体必须给出完整的定义,使得所描述术语的含义能够完全表达出来。
3)一致性:也就是说,由建立本体时定义的术语得出的推论必须和术语本身的含义是一致的。
基于领域本体科学效应知识语义检索的研究
2 0 1 4年 第 2 3卷 第 2期
h t t p : l l w ww . c — s - a . o r g . c n
计 算 机 系 统 应 用
基于领域本体科学效应知识语义检索的研究①
杨 政 国,马建红
( 河 北工业大学 计算机科学与软件学 院,天津 3 0 0 4 0 1 )
心之一, 是在特 定条件下, 在 技术系统 中实施 自然规
律 的技术结 果,是场( 能量) 与物 质之间的互动结果. 效 应也 能看 作是一种功 能,它使物质 、场或 两种的组合, 将输 入作用转变 为所需 的输 出作用 . 通过选 择不 同的
度不 高.主要表现 为搜索 结果数量 大 、结果不精确 、
基于本体的领域知识搜索研究
V14 o. 3
・
计
算年 1 2月
De e e 0 8 c mb r2 0
No. 24
Co p t rEn i e rn m u e gn eig
软件技 术 与数 据库 ・
文章编号:10_ 48 084_09_ 文献标识码: 0o 32( 0) - 4—0 2 2 0 3 A
理机等 方法 ,设计实现 了一 个基于 本体的领 域知识检索系统模型 。用户通过对 用户本体 的选择 ,可得到相关的 目标本体 ,继续对其追踪 , 通 过本体推理 ,搜索 引擎能 准确地 搜索到用户所关心的本领域 内的相 关知识 。讨论 了该 系统结构中各个模块 的功能和该系统 的特点 。 关键诃 :本体 ;智能搜索 ;领 域知 识;推 理机
(. p. fnomainS inea d eh oo yNaj gUnvri f rn uis n t n uisNajn 1 0 6 1De to fr t ce c n c n lg , ni iest o Aeo a t d r at , nig2 0 1 ; I o T n y c a As o c
k o e g , t l g a e e s n r t ,i d sg s a d r a i e h d lo n o o s d d ma n kn wl d e s a c y t m.Th o gh t n wl d e on o o y b s d r a o e ,ec t e i n n e l s t e mo e f t o t l gy ba e o i o e g e r h s se z he r u he c o c fc i n ’ o t l g . le t a e h e ae i o t l g . ft e c i n n s t n w o e a o tt e kn h i e o l t n o o y c in sc n g tt e r l t d am n o o y I h le t wa t O k o m r b u h owl d e h l g tt e s a c e S e g . e wil e e h h r rsl e u t whih a e e a t e ae t e d ma n k o e g e r a o e n e c n i e I ic s s t e f n t n o v r o u e a e s c x cl r l t d wih t o i n wld e by t e s n r a d s a h e g n . td s us e h u c i fe e y m d l nd t r y h h r o h c a a t rsi ft e s se h r ce i t o y t m. c h
基于领域本体的知识检索系统研究
基于领域本体的知识检索系统研究作者:唐斌谢爱南董坚峰来源:《电脑知识与技术》2012年第31期摘要:为了解决传统信息检索存在的效率低、精度不高以及无法为用户提供个性化服务等问题,提出了将领域本体引入到信息检索的思路,并构建了基于领域本体的知识检索模型。
在探讨基于领域本体的知识检索实现关键技术基础上,以毕业生求职招聘知识检索系统为例进行了知识检索性能的实验论证。
实验结果表明该检索系统能有效的提高信息检索的准确率和效率。
关键词:领域本体;知识检索;本体构建中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2012)31-7423-04随着计算机技术的不断发展以及互联网技术的日新月异,使得万维网上的信息每天都以爆炸式增长,如何快速高效地在海量的数据中获取有价值的信息已成为了当前信息检索研究所面临的重大挑战。
传统的基于关键字的语法匹配和全文检索方式,在早些年以其简单、快捷和容易实现等优点受到用户的亲睐,但随着社会的发展,这种传统的检索方式出现的漏检、误检以及无法为用户提供个性化的检索需求等问题逐渐显现出来。
通过对传统检索系统的研究,总结出传统检索方式存在以下几个较突出的问题:第一,忠实表达问题。
大多数检索系统主要是借助于目录、索引和关键字等方法来实现,结构单调统一,很多情况下,用户很难通过简单的几个关键词就能够真正表达出他所需要检索的内容,因此表达上的困难导致检索质量的降低。
第二,一词多义问题。
不同的检索用户有着不同的检索目的,当以同一组关键词进行检索时会得到同样的检索结果,无法实现用户的特殊检索需求。
第三,同义词问题。
基于关键字匹配的检索技术,是严格按照用户提交的查询请求在全文中进行关键字匹配的检索方式,没有理解和处理信息的能力,因此许多与关键词的同义词信息就无法检索出来。
第四,词汇孤岛问题。
在人的大脑中,概念之间存在着各种各样的联系,而在基于关键字的检索系统中,这种概念之间的语义联系很难进行描述。
基于领域本体的学习资源语义检索模型
Ab t a t sr c :T a i tt h f c ie rtiv l o e r i g rs u c s h a e rp s d a d man o tl g — a e d lo o f cl ae t e e e t ere a f la n n e o r e ,t e p p r p o o e o i no o y b s d mo e f i v
领域本体在信息检索中的应用研究
领域本体在信息检索中的应用研究近些年随着社会经济的发展,人们愈加关注信息检索的研究,本体在信息检索中的应用也受到了越来越多的重视。
本体是一种面向概念描述的建模技术,它为信息检索提供了一种新的、高效的方式。
它能够为信息检索提供一种基于概念的描述,以便更好的识别文本的真实内容和更加有效的检索相关信息。
领域本体是一种知识表示技术,它能够更容易地理解和表示用户查询意图,让文本检索变得更加准确和有效。
领域本体技术包括本体计算、本体记录、本体推理、本体构建等基本技术。
本体技术能够为文本检索提供准确和有效的检索,亦可以提供复杂的信息检索功能,如信息细分和文本表示。
本体技术的应用主要有:本体的结构模型化、本体的概念描述等,这将有助于系统建立查询模型,以及有效的管理和检索信息。
在信息检索中,本体技术可以提升知识的管理效率,灵活性和精度。
首先,本体技术可以通过建立本体模型将信息结构化,有效地实现知识的细分和重新组织,有助于提高文本检索的精度;其次,本体技术可以通过概念索引,有效地组织和检索信息,改善文本检索的效率,并且能够有效地实现关联检索;第三,本体技术可以通过信息语义分析技术来提升文本检索的灵活性和准确性,有助于提高查询的精度和质量。
本体技术在信息检索方面也有一些不足之处。
本体技术虽然能够提高文本检索的准确性和灵活性,但是会增加存储和检索的复杂性,这也是本体技术应用的主要瓶颈。
此外,由于本体技术只能按照预定的框架检索和管理信息,因此无法完全反映信息的复杂性和变化。
为了克服上述不足,在近年来也出现了一些新的解决方案。
例如,引入本体的混合技术,使用混合技术可以改善文本检索的准确性和灵活性,并且表示能够更好地模拟文本信息的复杂性和变化,以便实现更好的信息检索效果。
此外,还有将机器学习技术和本体技术结合起来的方案,这将有助于在文本中更好地查找用户需要的信息。
因此,本体在信息检索中的应用研究有着非常重要的意义。
它不仅能够改善传统的文本检索方法,而且可以为用户提供更加准确、更加灵活的信息检索功能,从而达到更好地支持文本检索的目的。
电子商务智能推荐系统中基于领域本体的案例检索算法
的概念语 义相似度 、 基于类型的属性语 义相似度和基 于数据类型的属性值 相似度 , 来计算案例 的综合相似度 , 避免 了 传 统推荐 算法中计算相似度仅靠属性值 , 考虑语 义和属性 类型的影 响造成 的效率低 、 没 精度 差等 问题 。设 计 了领域 本体协 同案例推理的 电子商务智能推荐 系统 架构 , 通过在 领域本 体 中抽取 语义要 素对案例进 行表 示, 宽 了案例 求 拓
基于本体的专题知识库智能检索系统研究_以张謇研究知识库检索系统实现为例
78・基金项目・Vol .52,No .4,April ,2008LIBRARY AND INFORMATION SERVICE钱智勇南通大学图书馆南通226016〔摘要〕以基于本体的张謇研究知识库智能检索系统开发为例,探讨基于本体的专题领域知识库智能检索系统的框架结构、工作流程以及功能实现。
系统采用语义Web 技术和智能Agent 技术,使用RDF 模型对知识库的Web 页面元数据进行描述,然后利用本体建模语言对张謇研究领域知识进行建模,根据所得到的本体对元数据进行基于语义的查询,为用户提供智能检索服务。
〔关键词〕本体知识检索智能检索知识库〔分类号〕G250.6Research on Intelligent Retrieval System of Ontology-based Knowledge Database——Taking Zhang Jian’s Research on the Realization of knowledge Database Retrieval System as an ExampleQian ZhiyongThe library of the Nantong University, Nantong 226016〔Abstract〕This paper discusses the framework,workflow and function realization of ontology-based intelligent knowledge retrieval system inthe thematic area based on the development example of Zhang Jian’s Research of ontology-based Knowledge database retrieval system. Adopting semantic Web and intelligent agent technologies,the system describes webpage metadata of knowledge data base with RDF model, models the knowledge of the Zhang Jian’s Research thematic area in ontology modeling language,and then offers intelligent retrieval services to inquire the semantic metadata based on the ontology.〔Keywords〕ontology knowledge retrieval intelligent retrieval knowledge database基于本体的专题知识库智能检索系统研究*——以张謇研究知识库检索系统实现为例*本文系江苏省教育厅社科基金资助项目“张謇研究本体知识库组织与实现”(项目编号:05SJB870003研究成果之一。
基于本体的电子政务领域智能搜索引擎研究
由于 我 国 电 子 政 务 是 在 各 级 政 府 、不 同部 门 中分 别 进 行 u d e r 给 出的定 义较 为完 善 。 它体现 了On t o l o g y 的4 个含 义: 即概 的 ,没 有统 一 的战 略 规划 ,各 部 门之 间 相 互封 闭 ,相 当一 部 分 念 模 型( C o n c e p t u a l i z a t i o n ) 、 明确( E x p l i c i t ) 、形 式化 ( F o r ma 1 ) 已建 成 的 电子 政 务 系统 模 式 不 统一 ,这 些 独立 的、 异构 的、 封 和 共 享( S h a r e ) 。这 四个 模块 中 ,核 心是 “ 概念 模型 ”, 它是指 闭 的 系 统 使 得 彼 此 之 间 难 以实 现 互 联 互 通 ,从 而 成 为 一 个 个 特 定 领 域 中所 有 可 能状 态 所 包含 所 有 元素 涉 及概 念 及 概 念 间 的 “ 信息 孤 岛 ”。 关 系。 或者 说 ,通过 对 领 域概 念 化 ,从 中抽 象 出概 念 ,明确 概 随 着 电子 政 务 的 深入 发 展 ,简 单 的信 息发 布 、 内容 检 索 等 念 间 的 各种 关 系 ,从 而建 立 包含 语 义联 系 的领 域知 识库 。 同 时, 基 本 功 能 已无 法 满 足 需要 ,便 民服 务 、 网上 审 批 、 一站 式 办 公 完 全 意 义上 的本体 还 能够 利 用公 理 、 规则 对概 念及 概 念 问 关系 等 应 用 的 需 求越 来越 迫 切 ,具 备强 大 交互 功 能 和协 同作 业 能 力 效 沟 通 的桥 梁 ,并将 成 为 政府 高效 行 政 ,履 行 公 共服 务 职 能 的
际 标准 的服 务和 管理 。 的明确 的规 范说 明 ” 。
基于本体的智能检索及其在泌尿外科中的应用
tbtO ) 其他关 系。为每 一种 关系 附上 一定 的权 值 , 值视 r ue f , i 数 关系疏密程度而变化 , 值越 大表示概 念之间相关度 越高 , 同 数 如 义关系为 1 。这样 , 领域本体可 以近 似的看成一棵 树 , 如图 2所 示 。每个节点是一个概念 , 每条边代表概念之间的关系。
法采用词形匹配而非词义匹配、 以及 “ 词汇孤岛”等问题 上
使传统信 息检索机制缺乏必要 的智 能性 , 而语义 检索 正 是突
破 了机械式 匹配局限于表 面形 式 的缺陷 , 从词 语所表 达的语 义
层次上来认识 和处理用户的检索请求 。 本文以泌尿外科本体作为基础 , 通过分析病人病情与泌尿外 科本体之间的关系 , 研究泌尿外科概念体 系的语义相似度 , 相关度 及基于泌尿外科本体的语义推理 。 并在此基础上 , 研究基于泌尿外 科的领域本体的辅助诊断系统模型及其相关的关键技术的实现。
李学明 付大超
( 重庆大学计算机学院 重庆 40 3 ) 0 00
摘
要
以本体论作为指导理论 ,通过研 究泌尿 外科辅助诊 断系统模 型 , 泌尿 外科领域本体 的基础上研 究语义相似度 、 在 语义 相
关度的计算方法, 并提出 新的相关度计算方法。该方法可以 定量地分析 领域本体中的 概念间 相关度。并通过建立泌尿外科本体, 实
体 。但 目 前还没 有 一个 大规 模 的、 可共 享 、 可复 用 的医学 知 识 库 j 。在智能检 索方 面 , 目前 的搜索 引擎基本 都采用 基于关 键 字 匹配 的全 文检索技术 , 基于关 键字的语法 匹配和全文 检索 是
技术 , 主要借助 目录 、索引和关键词等方法来 实现 , 虽然具 有简 单 、快捷和容易实现等技术 优点 , 但是在 “ 忠实表达”、检索算
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第36卷 第23期Vol.36 No.23计 算 机 工 程Computer Engineering2010年12月December 2010人工智能与识别技术文章编号:1000 3428(2010)23 0171 03 文献标识码:A中图分类号:T P311基于领域本体的智能检索模型贾雪峰1, 王建新1, 齐建东1, 朱礼军2(1.北京林业大学信息学院,北京100083; 2.中国科学技术信息研究所,北京100038)摘 要:在传统检索模型的基础上,结合本体概念,提出一种基于领域本体的检索模型。
该模型利用本体中语义概念关系及语义扩展机制对查询关键词进行概念映射及扩展,通过计算文档相似度返回检索结果,提高检索的查准率和查全率。
关键词:信息检索;本体;概念树;智能检索;文档相似度Intelligent Retrieval Model Based on Domain OntologyJI A X ue feng 1, WA N G Jian xin 1, QI Jian dong 1, ZHU L i jun 2(1.School of Information S cien ce &T echnology,Beijing Forestry University,Beijing 100083,China;2.Institute of S &T Information of Ch ina,Beijin g 100038,China)!Abstract ∀Compared w ith the traditional retrieval model,this paper proposes a retrieval model b as ed on domain Ontology com bining w ith th e Ontology concepts.T he model us es the con cept of Ontology in the s emantic relations and sem antic extens ion m echanis m to map and expand the keyw ord queryin g con cept.By calcu lating the docum ent similarity,th e m odel return s search results and s how s th e b etter retrieval precision rate and recall rate.!K ey words ∀inform ation retrieval;Ontology;concept tree;intelligent retrieval;docum ent similarity基金项目:国家#十一五∃科技支撑计划基金资助项目#知识组织系统的集成及服务体系研究与实现∃(2006BAH 03B03);中央高校基本科研业务费专项基金资助项目作者简介:贾雪峰(1983-),男,硕士研究生,主研方向:智能检索系统;王建新、齐建东,副教授;朱礼军,副研究员收稿日期:2010 04 15 E mail :jiaxuefeng0@1 概述目前常用的文献检索方法大多是基于人工分类目录或关键词匹配的,大致分全文检索、数据检索、主题检索3类[1]。
全文检索[1]把用户的查询请求以关键词的形式与全文中的每一个词比较,不考虑查询请求与文档语义上的匹配,主要基于词频分析技术,检出信息量大,无需人工干预。
缺点是返回信息过多,有很多无关信息,用户须从结果中进行筛选。
数据检索[1]主要针对结构化信息系统,查询要求和数据遵循一定的格式,具有一定的结构,允许对特定的字段检索(例如:作者=#金庸∃),比较有代表性的是各种商业数据库。
数据检索依赖于编码的质量,检索花费大,检出的信息相对准确,但容易漏检,也具有很大局限性。
主题检索[1]以人工方式或半自动方式收集信息,对文档访问后,编写文档描述,将之添加到合适的事先确定的主题类别中。
用户从提供的最基本的几个大类的入口,逐级向下访问,即可得到较为满意的结果。
主题检索的优点在于可以使原来不很明确的信息需求随层次类目列表提示变得逐渐清晰。
缺点是检索花费的时间较长,对新出现的概念没有适合的相关类目可用于检索。
综上,3种传统的检索方式对海量信息资源检索的查准率和查全率都很有限,特别是在信息语义揭示上有局限性,缺乏知识处理和理解能力。
如何构造能更准、更快、更全地查找到所需信息的检索方式成为信息检索领域急需解决的问题。
本体论是描述概念和概念之间关系的模型,作为一种有效表现概念层次结构和语义的模型,能满足用户在语义上和知识上的需求,因此,在信息检索领域得到广泛的应用[2]。
构建领域本体库能很大程度上揭示概念间的语义关系,应用于相关领域的信息检索,可以扩大检索范围,很大程度上提高检索的查全率和查准率[3]。
国内已有部分学者在研究如何将本体应用于信息检索领域。
本文在利用已有成果的基础上,从构建领域本体出发,借助构建的领域本体,从本体的语义概念关系扩展关键词的入口词范围,提高了检索的全面性,同时检索的准确性也有提高。
2 系统模型框架综合传统信息检索的模型和概述中提到的基于本体的信息检索方法,本文提出基于领域本体的信息检索模型,从基于主题词表构建领域本体出发,设计基于领域本体的信息检索方法,利用领域本体中概念间的语义信息对用户检索条件进行分析推理、语义扩展,在检索过程中以本体作为参照标准,实现了一定的语义检索,不但可以检索和用户检索条件匹配的结果,而且可以检索出在语义层次上满足需要的结果。
整个系统框架如图1所示。
系统模型的具体工作流程如下:(1)领域本体知识库的构建。
领域本体是在已有领域主题词表的基础上,由熟悉该领域的专家通过筛选语义丰富的主题词及关系词,然后在此基础上进行语义扩展构建而成的。
(2)用户查询请求的处理。
将用户输入的查询请求映射到构建的领域本体库概念上,最终形成检索关键词概念。
171(3)查询信息的语义处理。
主要通过构建的领域本体库完成对检索关键词概念空间的语义扩展和推理,将相关和相似的信息纳入查询目标,扩大查询范围。
(4)查询条件的规范处理。
将语义扩展处理好的查询信息在领域本体和知识表示规则的指导下,经过预处理,转换成符合规范的查询表达式。
(5)查询结果的资源匹配。
对生成的规范化的查询表达式和检索模块进行匹配检索。
(6)查询结果的排序输出。
进行文档相似度计算,将检索结果按照文档相似度的高低顺序返回。
图1 系统框架3 关键技术的实现3.1 领域本体知识库的构建领域本体知识库的构建在整个系统中占有重要地位,因为主题词表本身就是一个轻量级本体。
在已有主题词表基础上,由熟悉该领域的专家通过筛选领域主题词表中的主题词,将语义丰富的主题词不断扩展完善而成。
3.1.1 领域本体的构成本体是共享概念模型明确的形式化规范说明。
本体作为人工智能和知识工程领域中一种新兴的知识表示方法,可以用于组织相关领域的知识,确定该领域内共同认可的词汇(术语),并给出这些词汇之间相互关系的明确定义[2]。
领域知识本体是指与领域知识内涵相关的一组概念化的规范说明。
领域知识本体可描述为如下的三元组:D K O ={C,A ,I }其中,D K O 表示领域知识本体;C 表示领域知识的概念集;A 是建立在C 上的属性集;I 表示建立在C 上的实例集。
属性集从语义分析上主要有5种基本关系,见表1。
表1 本体知识库中的基本关系关系名称描述备注P art o f 表达概念之间部分和整体的关系例如:#计算机∃和#机箱∃K i nd of 表达概念之间的继承关系例如:类#学生∃与类#研究生∃Instance of 表达实例与概念之间的关系例如:类#花∃与#百合∃At tri bute o f表达某个概念是另一个概念的属性例如:#学号∃是#学生∃的一个属性Aspect of表达某个概念是从另一概念某一方面的分类例如:#作家∃是一个#职业∃的一个分类3.1.2 领域知识本体的形式化表示领域知识本体的形式化表示就是将本体中定义的概念及概念间的关系用本体描述语言来表示,以便计算机处理,最终表示结果是用W3C(W or ld Wide Web Conso rt ium)推荐的本体描述语言OW L(O nto lo gy Web Lang uag e)描述的领域知识的概念及概念关系的文件[2]。
对于整个领域知识,根据层次结构特点以及概念之间的语义关系,从最高层概念逐步细分,形成一个能反映概念之间关系的树状层次结构 概念树[2],由于并不严格要求子女仅有一个父母,因此实际上是一个有向无环图。
概念关系形式化表示如下:(1)直接父母与直接子女(Parent Son)A 是B 的直接父母是指在概念树上,从A 出发向下只需经过一条边即可到达B 。
如A 是B 的直接父母,则B 是A 的直接子女。
这种直接父母子女关系可以分为上述的5种关系,统一定义为#Parent Son ∃。
(2)祖先、子孙关系(A ncestor Offspring )A 是B 的祖先是指在概念树上,从A 出发向下经过至少一条边可到达B 。
将这种关系定义为#A ncesto r Offspr ing ∃。
2种情况如下:1)A #P arent Son ∃B ;2)存在一个序列T 1,T 2,%,T n ,A #Pa rent So n ∃T 1,T 1#Par ent So n ∃T 2,%,T n #Parent Son ∃B 。
3.2 智能检索中语义扩展处理算法设计在本检索模型中,当用户提交了一个关键词进行查询时,基于本体的检索服务器将通过对用户查询需求进行语义上的自然语言处理,析取出各种概念信息,不仅检索出包含提问式中的关键词的结果,还将检索具有相似关系的关键词。
为了充分理解和正确表达用户的需求,需要利用构建的本体库中的概念关系对检索概念进行优化和扩展[4]。
假设用户的原始概念空间为{K ,R},其中,K 为用户查询式中的检索概念项的集合,是n 个概念的一个组合C 1,C 2,%,C n ,权值分别为W 1,W 2,%,W n (n 一般很小);R 为概念项间逻辑关系的集合。
利用本体知识库对其进行概念优化和扩展[5]分为以下2个过程:(1)将K 中的用户概念项映射为O nto lo gy 中的概念,形成新的概念集合C;假设K 中的检索概念项为(K 1,K 2,%,K n ),对于其中的每一个概念项,查找O ntolo g y 中与之匹配的概念,每一次成功的匹配都产生一条记录(K i ,C i )。