基于多层次的语义网信息检索浅释

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本 体 的 不 同 内涵 , 者 认 为 语 义 网 的本 体 是 表 示 语 义 网 中实 笔
中 , 出现 了对语义信息检索 的讨论 。随着语义 网信息和语 【 l 就
义 信 息 处理 发展 水平 的不 断 提 升 , 义 网信 息 检 索 的关 注 度 语
才有所提升 , 但还是相对薄弱。 0 3年开始 , 20 国家的 9 3 7 计划
关系问题 。曙 法和语 义 、 微观 和宏 观 , 两者的渗透和结合就
能够完成在元数据框架下 的语义检索。
1 本 体 文 档 资 源 . 2
还是复杂的描述性语言都是 由某种语言作为载体 , 对知识进 行客观描述 , 机器能够具有 智能评估 的作用 , 让 在一定 程度
笔者认 为该类资源是从资源描述的角度看 , 是构建在本
语 义 网结 构 分 为 知识 结构 层 、 义仓 库 层 、 辑 证 明信 任 层 、 口互 动 服 务 层 4个层 次 , 语 逻 接 并在 此 基础 上得 到 多层 次语 义
网检 索模 式 图。
【 键 词】 义 网 语 义 网资 源 语 义 网 结构 关 语 【 类 号] 2 2 分 G5. 6
更为有效的方式查询 、 重用 和集 成 。无 论 是 简单 的 描 述 语 言
种形式 , 或者是“ ” 元 元数据 , 或者是简单 的本体 。 前者注重

的是资源分类体系和资源本身 的信息描述 , 后者注重 的则是 表达资 源语 义逻辑 的知识体 系 , 因此 , 对一个系统 中实体进 行分析并提取属性 的过程 即为元数据 的创建过程 , 在此基础 上再加之异构分析 、 关联分 析等就可以创 建本 体了 。元数据 解决了资源 的语义描述 问题 , 而本体解决了资源集合 的相互
次为切人点 , 探索 多层次语义 网信息检索的相关理论 。
元数据是关 于数据 的数 据 , 它为数字化 信息集合 提供 规范 、
普遍的描述方法 和检索工具。元数据本身可以看成是本体 的

1 语 义 网资 源
语义的核心是共享 ,是 自由, 田 它的存 在将 实现从字符检 索到概念检索的过渡。语义 网( e niWe ) Smat b 是一个通用 的 c 语义框架 , 不仅将文档对象 、 数据共享和集成 , 更是 将世界对 象资源及 资源之 间多而杂的关联关 系通过机 器可 阅读 和理 解的信 息利用语义 、语 法和逻辑 规则集合在 一起组成 的 网 络。在语义 网中定义 和链接 的数据都能被各种不同的应用 以
20 0 5年 开 始 , 关 语 义 的 文 章 才 开 始 出 现 , “ 义 信 息 ” 相 以 语 为
义网检索的核心部分 , 是语义共享 的基础。刘康翻 根据不 同的
分类体 系对 本体有不 用的分类 , 无论 哪种分类 的本 体 , 其特 定词汇的概念和面 向对象 中词汇的概念有着本质的区别。万 维 网上 的 D M A L本体库 、c e b Poee Shma We 、 r g 本体 库等 都是 t
目前语 义 网 资源 的主 要 来 源 。 在 这里 需 要 提 及 的是 元 数 据 。 圈
题名或者关 键词的文章有 2 余 篇 , 0 但是 如果细化至 “ 义 网 语 信息” “ 、 语义 网检 索” “ 义 网信息检 索” 涉及 的文章 一般 、语 , 只有 四五 篇 , 因此笔者 旨在语 义信息研 究的基础 上 , 以多层
图书馆学刊
2 1 年第 9 02 期
TUS UGUANXUEKAN H NO. 2 2 9, O1
基 于 多层 次 的 语 义 网 信 息 检 索 浅释
桑 琰 云
( 烟台大学图书馆 , 山东 烟台 2 4 0 ) 6 0 5
【 摘 要 】 语 义 信 息研 究的 基 础 上 , 语 义 网 资 源 的 本 体 、 体 文 档 资 源 、 在 从 本 实例 数 字 资 源 、 义 关联 资 源 着 手 , 语 将
开 始将 语 义 的 相 关 基 础 研 究 、 术 研 究 、 型 研 究 、 法 研 究 技 模 方
体、 、 类 属性 、 角色 、 功能等特定 词汇及词 汇之间关 系的具有
“ 四化 ” 点 ( 特 概念 化 、 明确 化 、 范 化 、 解 化 ) 集 合 。 是 语 规 理 的
作为重点支持对象。笔者通过维普 资讯 数据库平 台发现 , 从
体 中描述文档类 和属 性的资源 。该类 资源用 R F的二元数 D
上提高我们分析 网络信息语义的能力 。有 了语义 网资源 , 计
算机不需 要人工 的干预就可 以对 不同来源 的这些语义 网资
据模型作为基础模 型 , R F ce a 用 D hm 作为描述词汇表 , S 模型
中用于描述本体文档资源 的都可以被看成是 “ 节点” 但 由于 。
语 义 网信 息检 索 多层 次 .
11 本 体 .
不论是基于分类 目录 的搜索引擎检索技 术 , 还是基 于含
有指定 目 的全文搜索 引擎技术 , 标 都存在查 准率 、 查全 率偏
低 的问题 , 也就是检索利用 的有效率偏低 。再加上用 户检索 用 词 的 自由化 , 同系统数据库标 引语 言的兼容 , 不 一词 多义 或 者多词 同义 , 有分词 的歧义 与错误 , 还 常常会 导致 自然 语 言与规范语言 的差异 。上个 世纪 8 0年代在 SGR会 议论文 II
本体——表达 的核心 , 它给 出了构成相关 领域词 汇的 “ 基本术语和关系 , 以及结合术语 和关 系来定义词 汇的外 延规 则 ” 【 目标是在语义正确 的基础上具有对语 言的描述理解 。4 J 其 能力和完成推理的能力。计算机界的本体研究始于 2 0世纪 9 0年 代初 期 的知识 基础 社 (nwe g ae o u i ) 究 ko l eb s cmm nt 研 d y 之后 , 各个学科都 开始致力 于本体 的研究 。借鉴不 同领域的
相关文档
最新文档