信息检索中“相关性”的概念、类型及其不确定性
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
究 提供借 鉴 。
1 相 关 性研 究 回顾 1 1 第一阶段 ( 9 8年之 前 ) . 15
后, 研究人员开始倾 向于使用二元策略 , 认为相关性 只有 两种 类 型 。持 这 种 观 点 的有 Cee o , uda l r n C ar vd 和 K t r 1 。例如 , 第 二次 克 兰菲 尔德 实验 中 , at 一 e 0 3 在
第 13期 2
山 东 图 书 馆 学 刊
2 1 年 2月 01
概 念 的界 定 中 , 他们 谈论 了一 个 “ 息需 求 表 述 ” 信 和
一
注 意 的是 用户 的 内部 概念 体系 与外部 世界 的相互作
用 以及 内部 知 识 与 相 关 性 判 断 的 关 系 。在 这 一 时
述 的基础 上提 出 了一个 相关 性 的 比较成 功 的形式化
求 和表 出 的信 息 需 求 之 间 的 区别 。可 以说 , opr Coe 将研 究重 心放 在 了满 足用 户 真 正 的信 息 需 求 上 , 并
试 图采用 逻辑 方法 解决这 一 问题 。 ( ) 境 相 关 性 。1 7 3情 9 3年 , l n发 表 了一 篇 Wi o s 颇 有影 响力 的文 章 , 在该 文 中 , 在 C o e 提 出 他 opr 的逻辑 相关性 的定 义 基 础上 , 入 了情 境相 关 性 这 引
遍的认可还是在 15 98年 的国际科学信 息会议 (c I— S) 。在 该 会 议 上 , i ey首 次 将 相 关 性 区分 为 I上 Ve r k “ 主题 相关 ”( e vnet S bet 和 “ 户 相 关 ” R l ac o ujc) 用 e ( srR lvne -3 U e e ac) 7。相 关 性 的 “ 统 观 ” 始 受 e 系 开
f e o d ] R lvne I om t nR tea U cr i y yw rs eeac n r a o e ivl net n K f i r at
Sr ei指出, a cv a c 信息检索提 出的更大 的问题是
情报 学 的核 心 … 。他 所 指 的 “ 大 的 问 题 ” 是 相 更 就 关性 。毋 庸置 疑 , 观 信息 检索 发展 史 , 纵 相关 性是 一 个核 心概 念 , 报学 界 对 相 关 性 的研 究 也 从 未停 止 情
而可将 19 97年之 后 的相关 性研 究作 为第 四个 阶段 。 本 文从相 关性 研究 的各 个 阶段 人 手 , 理 相 关 性 研 梳 究 中最具 代表 性 的研 究 成 果 , 总结 已有 研 究 中相 关
性 的类 型及 其不 确 定 性 表 现 , 相关 性 的进 一 步研 为
多定 义 , 主张 用 逻 辑 工 具来 处 理 相 关 性 问 题 , 从
念 的发展 是致命 的 ; 如何 从 认 知 或 心理 角 度 来研 究 相关 性 , 其是从 认 知状 态或 知 识状 态 的改 变来 理 尤
解相 关性 , 当成为 相关性 研 究 的发展 方 向 。这 应
一
而 成为 逻辑 相 关 性 的代 表人 物 。他 对 逻 辑 相 关
Ce e o l r n及 其 同事指 出 , vd 相关 性评 价 中最 难 的是 对
信息检索系统的评价 , 解决这一问题 的第一步应该
自上世纪 5 0年代 M or、 ab 和 Pr oe Tu e s ey等将 r 计算机技 术应 用 于信 息 检索 之后 , 相关 性 ( e — Rl e vne 就成 了该领 域 的核心 研究 内容 J ac ) 。这 三 位学
a d c a sf s te s r lv n e o y tm — oi n e ,i fr t n —o e td a d sta in —o e td n ls i e h m a ee a c f s se i r t d no mai e o i r ne n i t u o i r n e .T e ,sa t h n trs fo t e p o e so fr ain rt e a ,t i a e n y e h n et it fv ro s tp s o e e a c n d ti. r m h rc s fi o n m t er v l h sp p r a a s s te u c ran y o a iu y e rl v e i ea l o i l f n F n l ,p e it h tt e r lv n e r s a c i a t n in t y tm ,i fr ain a d u e a es me t . i a y r d cs ta h ee a c e e r h w l p y at t o s se l l e o no m t n s l tt a i o  ̄ h me
一
的理论 框 架—— 四维 模 型 ( 息 源 、 息 需 求 的表 信 信 示、 时间 和构建 )1 。在 实证分 析方 法方 面 , 关性 7 1 相
研究 已深入 到各 个领 域 , 中 , 关性判 断研 究尤为 其 相
突 出 。19 98年 ,pn Sik等通 过 四组 实 验 对 相 关 性 判 断进 行 了研 究 , 相 关 性 判 断 的 二 元 等 级 ( iay 将 bnr
则 就无法 用逻 辑推 理得 出所需 结论 。C oe 还 区分 op r 了不 同类 型 的信息 需 求 , 重要 的是 现 实 的信 息 需 最
类别 、 相关 性模 型等基 础性 的研究 都 有所进 展 , 大 但
多数 是根 据 以往 的研 究 展 开 的 。在 基 础 性研 究 方面, z r Mi ao在对信 息检 索领 域 相关 性 研究 全 面综 z
个时期 : 5 1 8年之前 ( 9 以在 国际科 学信 息会议 上明 确承认“ 相关性” 概念为结束标志 ) 15 - 17 年 ; ;99 9 6 17 9 7年 至 今 J 。文 献 认 为 ,9 7年 之 后 的 相 关 19
性 研究 在基 础研 究 和 实 证 研 究 方 面 都 有很 大 进 展 , 研究 范 围不 断扩 大 , 呈现 出百 花 齐放的 研 究态 势 , 因
在此基础上 , 从信息检索过程 出发 , 具体分析 了各相关性 ( 系统观的相关性 、 信息观的相关性和情境观的相关性) 的不确定性 表现。最后 。 预测相关性研究将朝着系统 、 信息和用户并重的方向发展。
[ 关键词] 相关性
信息检索
不确定性
[ 文献标识码 ] A
[ 中图分类 号] G 5 . 249
到挑 战 。 1 2 第二 阶段 ( 9 9—17 . 15 9 6年 )
该 阶段 是相关 性 研究 的 高潮 , 着相 关 性 研 究 随 的进 一步 深化 , 者 们 从 各 个 角度 阐述 了对 相 关 性 学 概念 的不 同理 解 。 ( ) 关 性 的 二 元 策 略 。“ 统 观 ” 到 挑 战 1相 系 受
者还从 检索 的角 度 将 相关 性 定 义 为 “ 索词 与 文献 检 索引词之 间的吻合 程度” 。显然 , J 他们是从检 索
是将相关性 概念 分成两种 类型 : 用户 相关性 ( s ue r rl ac) 表 出相 关 性 (te eeac) 其 中 , ee ne 和 v s tdrl n e 。 a v 用户 相关 性 只能 由提 问者 自己决 定 , 而表 出相 关 性
过 。19 9 7年 , z r Mi ao将相 关 性 的研 究 历史 划分 为 三 z
的角 度考 虑相 关 性 的 。在 该 定 义 中 , 关 性 被认 为 相 是系统 的属性 , 与用户基本无关 。可 以说 , 这是相关 性 研究 初见 成 效 的 开始 。然 而 , 关 性 概 念得 到普 相
期 , 相关 性概 念 的理 论 探 讨 不多 。9 对 O年 代 , 延
篇文 章之 间 的一致 性 。在 此 , 们 使 用 了另 一 种 他
二 元性 , 文献 相关性 ( ou n rl a c ) 用户 相关 d cmet ee n e / v
性, 而不 是表 出相 关 性/ 用户 相 关 性 , 他们 用 一 种 与 克 兰菲尔 德实 验不 同 的策 略来 表示相 关性 的不 同复
杂性 。
Βιβλιοθήκη Baidu
续 了认 知 相 关性 的 观 点 , 比较 有 代 表 性 的是 H t ar e
的《 心理相关 性 号 情报 学 》 。他认 为 , 期 的检 索系 早
统设计 将 相关性 局 限在“ 主题 相关 性 ” 对相 关性 概 ,
() 2 逻辑 相 关 性 。C oe 在 其 17 op r 9 1年 的文 章 中批 判 了包 括 C a r uda和 K t r 出 的相 关 性 的 许 at 提 e
成 表述 需 求 的 最小 前 提 集 合 ( nm l rmi e) Mii a Pe s S t e 中 ; 于所有 的需 求 表 述 , 由许 多 前 提集 合 组 成 ; 对 它
如 ,9 1年 ,ca br 认 知 的角 度 在 一 个 多媒 体 19 Shm e 从 专业 的工作 环境 中(天气 预报 )研 究 了在 一个 真实 的信 息查 询及信 息利 用活 动过程 中所采 用 的相关性
[ btat r i p prr i stefu tgso e vnersa h u m r e evr u pso l ac , A s c] I s ae e e h rs e fr eac eer ,sm ai st a ost e f e vne r 1 h vw o a l c z h i y re
可 由具有 该学 科 领域 合理 知识 的任 何 人来决 定 。继
Ceedn之 后 ,uda和 K t r 成 了相 关 性 判 断 lvro C ar ae 完 t 的一 系列 实验 研 究 , 出 了相 关 性 的一 般定 义 。在 提
・
系统如何判断检索词与文献索引词之间的一致程度
】・
各 前提 是最 小前 提 的 先辈 。换 言 之 , 果构 成 信 息 如 需 求 的最小前 提集 合 存 在 于某 一 文 献 中 , 可判 断 则
该 文献 为相关 。但 对 于最 终推 论 出所 需结 果 的最小
前 提集 合 , 须 保 证其 任 一先 辈 ( 提 ) 存 在 , 必 前 都 否
评 价标 准 ;9 4年 , ar 察 了学 者们 面对 真 实信 19 Br y考 息需 求 时 , 检 索 过程 中对 印刷 型 文 献 的评 价 , 在 发 现 了 2 相关 性 的判 定标 准等 。 3条 1 4 第四阶段 ( 0世 纪 9 . 2 0年代 中期 至今 ) 近年 来 , 于相关 性 的基本定 义 、 关 相关性 的属性
时期 围绕相关 性 评价 标 准 的实证 研 究 也 颇 丰 , 例
性 的定 义如 下 : 个 存 储 的句 子 ( 论 是 存 储 在 系 一 无 统 内或用 户 的记忆 中 ) 逻辑 上 与 用户 的信 息需 求 在 是 相关 的 , 当且仅 当它 ( 个存 储 的句 子 ) 在于 构 这 存
学 术 论 坛
山东 图书 馆学 刊 2 1 年 第 1 01 期
信 息 检 索 中 “ 关性 " 相 的概 念 、 类 型 及 其 不 确 定 性
王 知 津 卞 丹 王 文 爽
( 南开大 学商学院信 息资源管理 系, 津 3 0 7 ) 天 0 0 1
[ 摘 要] 从相关性研究 的四个历史 阶段对相关性研究进行 了梳理 , 进而总结 出相关性 的各种类 型, 并对各类型进行归类 ,