第二讲信息检索概述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.限制符检索(Range)
限制符检索是通过限制检索范围,达到优化检索结 果的方法。不能完全确定检索词(关键词、主题词) 在数据库记录中出现的字段位置,特别在使用自由 词进行全文检索时,需要用字段限制检索的范围。 常用的字段代码有标题(TI)、文摘(AB)、叙词 (DE)、识别词或自由词(ID)、作者(AU)、语 种(LA)、刊名(JN)、文献类型(DT)、年代 (PY)等。这些限制符在不同的数据库系统有不同 的表达形式和使用规则。
4
信息检索步骤示意图
①
②
③
确定检索途径
分析检索课题
主
选择检索工具
1.分类途径
1.主题内容 2.时间范围
题
1.索引、文摘
2.主题途径
3.题名途径
3.信息类型
概
2. 全文数据库
4.著者途径
4.检索语种
念
5.其它途径
获 取 息一 次 信
选择检索工具 1.馆藏目录 2.图书馆
信息检索系统
⑤
确定一次信息出处 1.缩写还原为全称 2.音译转换成原名 3.信息类型
过程 课题
提问
标引
信息特征 标识
输入
信 息
检
检
检
索
索 工
输出
索
语
具
结
言
标引
系 检索提问 检索 统
(
果
标识
)
3
2.2 信息检索的一般方法
顺查法:时间上,远近 查全率高 到查法:时间上,近远 查准率高 抽查法:研究的高级阶段 检索效率高 追溯法(引文法) :
A.一次文献参考文献一次信息参考文献 …… 近远 B.一次文献引用该一次信息的文献新的一次 文献…… 实际是由“远近 ”越查文献越新 交替法(综合法)
所谓布尔逻辑符检索是用布尔逻辑算符将检索词 (关键词、主题词)、短语或代码进行逻辑组配, 凡符合逻辑组配所规定条件的为命中文献,否则 为非命中文献。它是信息检索中最常用的一种检 索方法。逻辑算符主要有: ✓逻辑“与”(AND 或 *) ; ✓逻辑“或”(OR或 + ); ✓逻辑“非”(NOT或-)
2.位置算符检索(Proximity Searching、Adjacent Operators): 位置算符是在检索式中表示算符两边的检索词(关 键词、主题词)之间位置关系的符号。这种方法能 够提高检索的准确性,当检索的检索词(关键词、 主题词)要用词组表达,或者要求两个词在记录中 位置相邻/相连时,可使用位置算符。 ✓(nW)算符 ✓(nN)算符 ✓(F)算符 ✓(S)算符:
3.截词符检索(Truncation、Wildcard Symbols):
利用检索词(关键词、主题词)的词干或不完整词 形进行查找的过程为截词检索。它可以起到扩大检 索范围,提高查全率,减少检索词(关键词、主题 词)(关键词、主题词)的输入量,节省检索时间。 尤其在英文检索系统中检索时,若遇到名词的单复 数形式,词的不同拼写法,词的后缀变化时,均可 采用此方法。截词的方式有多种,可以分为有限截 词、无限截词和中间截词。
课题或专题 检索前通常不知道会有什么结果 迅速、准确
日常生活 通常知道结果 一般
如果不刻意区分:你完全可以认为它们没有区别!
2
2.1 信息检索原理
从技术上来说,信息检索是以信息的存储与检索 之间的相符性为基础的,如下图“信息检索原理 图”:
存储 过程
一次 分析 信息
信息
特征
检索 检索 分析 检索
为了提高文献的检准率,应该从相应的规范词表中选择 所需的检索词。并且在确定检索词时,除了要考虑反映主题 概念的同义词、近义词等相关的检索词外,还要注意选择被 选用检索词的缩写词和不同拼法的词,以避免漏检有关的文 献。
选择检索方法
信
1.顺查法
息
2.倒查法
线
3.抽查法 4.追溯法
索
5.交替法
④
5
信息检索步骤
① 分析检索课题,明确信息需求 说明 ② 选择检索工具,了解检索系统 说明 ③ 确定检索途经,选定检索方法 ④ 实施检索策略,浏览初步结果 说明 ⑤ 调整检索策略,获取所需信息 说明
6
2.3 信息检索的基本技术
核心概念的选取
有些检索词中已经含有的某些概念,在概念分析中应予以 排除。例如:课题"公司劳动奖励、职工培训和养老保险制度 管理的理论和实践",如果把"劳动奖励","职工培训","养老 保险","公司","制度","管理"六个概念全部组配起来,则 会造成大量文献漏检。实际上,劳动力资源管理已经包含了 劳动奖励、职工培训和养老保险三个方面,而且,劳动力管 理必然是针对该三个方面而言的。因此,本课题只须采用"劳 动力资源"和"管理"这两个本质概念即可。
第二讲 信息检索概述
1. 信息检索原理 2. 信息检索的一般方法 3. 信息检索技术
检索与查找的区别
英文
过程和方 法
技能
检索
查找、搜索、 搜寻
Retrival 或 Retrieval
Search
有一定的策略,是系统的查找资料。 随机或更随意一些。
需要一定的专门知识和技能
简单,任意词
用途 结果 效率
隐含概念的分析方法
有些课题的实质性内容往往很难从课题 的名称上反映出来,课题所隐含的概念和 相关的内容需要从课题所属的专业角度作 深入分析,才能提炼出能够确切反映课题 内容的检索概念。例如:"社会保障"包含 "养老保险"、"失业保险"、"医疗保险"和" 社会救济"等概念,如果要检索社会保障 方面的文献,应该析出上述概念,才能保 证文献的查全率。
小结
检索与查找的区别 信息检索的原理 信息检索工具、方法、步骤 能通过“信息检索原理图”理解信息检索
原理 能够借助“信息检索步骤示意图”理解并
记忆信息检索五步骤
12
课题概念的分析方法
分析课题就是分析出课题所涉及的主要概 念,并找出能代表这些概念的若干个词或 词组,进而分析概念之间的上、下、左、 右关系。对于新学科、交叉学科和边缘学 科的课题,则要搞清楚这些概念之间的关 系。概念分析的结果应以概念组为单元的词或词组的形式列出,以便下一步制订检 索策略时使用。
信息检索过程中,为了保证检索结果的快、 全、准,仅靠一个检索词(关键词、主题 词)难以满足检索的需要,有时需要用各 种算符将若干个检索词(关键词、主题词) 组成检索式进行检索。它们主要有布尔逻 辑符检索、位置算符检索、截词符检索和 限制符检索。
1.布尔逻辑符检索(Boolean Operators):