基础理论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.索引
• 索引是一个线性的表单,可以将任何一个 标引字段中的概念按字母顺序线性排列起 来,不分等级。 • 索引与浏览最大的不同,就在于浏览提供 给用户的是一个树状结构的概念体系,而 索引是一个简单的线性列表。
3.简单检索
• 又叫基本检索、快速检索,即为用户提供一个 简单的检索界面,帮助非专业或初入门的用户 方便地提交检索式。 • 页面上通常只有一个检索框,不提供或提供很 少的检索入口,不使用或很少使用组配算符
一、文献信息资源的检索原理与检索技术
• 传统文献检索系统由存储和检索两个核心部分 组成。 存储是将大量无序的文献信息集中起来,根据 文献本身的内外特征,经过筛选、加工和整序 等处理,使其有序化、系统化,形成具有检索 功能的检索系统(数据库)。 检索是用户根据自己的信息需求,利用检索系 统,查找特定信息的过程。 检索是系统根据用户提问按规范化语言文本进 行概念转换,经逻辑匹配输出与提问相关的文 献。
3.词位限定检索
• 运用位置算符表示两个检索词间的位置 邻近关系。这种检索技术通常只出现在 西文数据库中,在全文检索中较多。(见 教材P30)
4.字段限定检索
• 即指定检索词出现的字段,被指定字段也叫 检索入口,检索时,系统只对指定字段进行 匹配运算,提高了效率和查准率。 • 在网络数据库中,字段名称通常放置在下拉 菜单中,用户只需要选择即可。(见教材P31)
基础理论
第一讲 文献信息资源概览和图书馆服务导览 第二讲 文献信息资源的类型及其特征 第三讲 文献信息资源的检索原理与技术 第四讲 网络信息资源的检索与利用(一) 第五讲 网络信息资源的检索与利用(二) 第六讲 文献信息资源的检索策略与效果评价
第六讲 文献信息资源的检索策略与效果评价
• • • • • • 一、文献信息资源的检索原理与检索技术 二、文献信息资源的检索策略 三、文献检索的效果评价 四、馆际互借与原文获取 五、数字资源使用规范 六、文后参考文献著录规则
文献信息存储与检索过程
文 献 文 分 信 献 息 信 析 特 息 征 检 索 课 题 信 息

标 引
息 检 索
确 定
文 献 信 息 标 识

输 入
献 信 息
匹 配 输 出
检 索 结 果
检 分 索 课 析 题
提 炼
语 言
确 定
检 索 提 问 标 识

输 入
索 系 统
检索原理的核心是用户信息需求与文献信息集合的比较和 选择,是两者匹配的过程。
检索技巧和提示
• (3)调整策略的考虑 确定较为恰当的检索词,选定检索范围(如:年 代、文献类型、学科范围、语种等), • 如果检出文献量过多,则要紧缩检索限定, 如果检出文献量过少,则要放宽检索限定。
检索技巧和提示
• (4)利用检出文献的信息,拓宽检索 • 考察检出相关文献的出处,从被检索出文献较多的期 刊、会议录、作者以及年代等为检索点出发,找到一 批相关文献。 例如:OPAC中先利用主题词,再利用分类号 • 利用引文检索, 根据相关文献(全文)的"引用文献" 或"参考目录" 条目中所列出文献的出处又可找到一批 相关文献。
一站式检索
Union Search Platform(USP)又叫: 一站式检索 USP是一个智能化的网络数据库统一检索 平台。它通过一个统一用户界面帮助用 户在多个网络数据库搜索平台中实现信 息检索操作,是对分布于网络中的多种 检索工具的智能化整合。
第五讲 文献信息资源的检索策略与效果评价
4.调整检索策略
• 根据反馈的检索结果,反复对检索式进行 调整,直到得到满意的结果。 • 对检索结果数量比较少的,可以进行扩检, 提高查全率。 • 对检索结果过多的,进行缩检,提高查准 率。 • “检索就是不断试错的过程。”
检索结果信息量过多
• 产生检索结果信息量过多的原因可能有以下两点: 一是主题词本身的多义性导致误检;二是对所选 的检索词的截词截得太短。在这种情况下,就要 考虑缩小检索范围,提高检索结果的查准率。 • 调整检索策略的方法如下: • ?减少同义词与同族相关词 • ?增加限制概念,采用逻辑“与”连接检索词 • ? 使用字段限定,将检索词限定在某个或某些字 段范围 • ?使用逻辑“非”算符,排除无关概念 • ?调整位置算符,由松变严。
检索技巧和提示
• 在实施一个课题的检索过程中,在各个环节上需注意以 下一些问题 • (1) 广泛浏览数据库 进入数据库前,需阅读数据库的说明,出版物类型 (期刊、会议、报告、专利…),文献类型(全文、文摘、 题录…),收集年限,使用权限,文献版本 • (2) 选择合适的数据库试查 每个数据库检索都有它自己的表达方式,对此要把握好。 最常用的检索方式是首先先从主题入手,以主题词为检 索点, 试查找到相关文献
4.复杂检索
• 又叫高级检索,提供比较复杂的检索界面,可 以构建比较细致的检索式。 • 复杂检索包含组配检索,即将两个或两个以上 的检索词用不同的组配算符组合起来,如布尔 逻辑算符、位置算符等,使得检索结果更为准 确。
• 检索示例:方正Apabi •
5.二次检索
• 在检索结果内进一步检索,使结果更精练、 准确。
• • • • • • 一、文献信息资源的检索原理与检索技术 二、文献信息资源的检索策略 三、文献检索的效果评价 四、馆际互借与原文获取 五、数字资源使用规范 六、文后参考文献著录规则
二、文献信息资源的检索策略 • 检索原理的核心是用户信息需求与文献信 息集合的比较和选择,是两者匹配的过程。 • 检索方法就是制定正确恰当的检索策略, 为检索过程进行指导,目的是优化检索过 程,提高检索效率,全面、准确、快速、 低成本地找到所需信息。
检索目的、检索需求的类型
一是需要关于某一课题的系统、详尽的信息,包括 历史、现状和发展,如撰写毕业论文等需求要求检 索得全面、彻底、检索的资源多,覆盖的时间年限 长。 二是需要关于某个课题的最新信息,需要检索的资 源必须是更新速度较快,覆盖的年限也比较短。 三是了解一些片段信息,解决一些具体问题。这类 需求不需要查找大量资源,但必须针对性强,结果 必须准确,速度要快。
3.构造检索式,选择检索入口
• 检索式是检索策略的逻辑表达式,是用来表达用户检 索提问的,由基于检索概念产生的检索词和各种组配 算符构成。 • 检索词可以是一个单元词,表达一个单一概念,也可 以是多个词组,表达多个概念。 • 组配算符通常有布尔逻辑算符、截词符(通配符)、 位置算符等。 • 拟好检索式后,就要选择检索点,即选择检索途径或 检索入口,也叫检索字段。常用的检索入口如题名、 著者、主题词、关键词、引文、文摘、全文、出版 年、ISSN 、ISBN 、分类号等等。
2.截词检索
• 用截断的词的一个局部进行的检索,并认为凡满足这个 词局部中的所有字符(串)的文献,都为命中的文献。 按截断的位置来分,截词可有后截断、前截断、中截断 三种类型。截断技术可以作为扩大检索范围的手段(见教 材P30) • 不同的系统所用的截词符也不同,常用的有?、$、* 等。分为有限截词(即一个截词符只代表一个字符)和 无限截词(一个截词符可代表多个字符)。下面以无限 截词举例说明: • (1)后截断,前方一致。如:comput?表示 computer,computers,computing等。 • (2)前截断,后方一致。如:?computer表示 minicomputer,microcomputers等。 • (3)中截断,中间一致。如?comput?表示 minicomputer,microcomputers等。 •
5.其他检索技术
• 大小写敏感:指西文检索系统中对用户检索式 包含的大小写的处理方式。有些检索系统严格 按照用户输入的大小写来处理。 • 禁用词表:在西文数据库中,系统对信息进行 标引时,不能做标引词或检索词的语词,包括 介词、冠词、代词、连接词、某些形容词或副 词等。这部分词语由于使用频率过高,不能反 映信息的实际内容,即使用户输入,系统也不 会对其进行检索。不同系统的禁用词表略有不 同。
构筑检索提问式
• 检索提问式构建的是否合理,将直接影响查全率和查 准率。构建检索提问式时,应正确运用逻辑组配运算 符。 • (1)使用逻辑“与”算符可以缩小命中范围,起到缩 检的作用,得到的检索结果专指性强,查准率也就高; • (2)使用逻辑“或”算符可以扩大命中范围,得到更 多的检索结果,起到扩检的作用,查全率也就高; • (3)使用逻辑“非”算符可以缩小命中范围,得到更 切题的检索结果,也可以提高查准率,但是使用时要 慎重,以免把一些相关信息漏掉。 • 另外,在构建检索提问式时,还要注意位置算符、截 词符等的使用方法,及各个检索项的限定要求及输入 次序等。
Βιβλιοθήκη Baidu
常用检索技术(见教材P29)
• • • • • 1.布尔逻辑检索 2.截词检索 3.词位限定检索 4.字段限定检索 5.其他检索技术:大小写敏感、禁用词表
1.布尔逻辑检索
• 即运用布尔逻辑组配符对检索词进行逻辑组配, 表达两个概念之间的逻辑关系。(见教材P29) • 常用的组配符有: “AND”(并且) 、 “OR” (或者) 、“NOT”(不包含)三种。(见教材P30) • 在中文数据库中,布尔逻辑算符有时用 AND、 OR、NOT下拉菜单表示。 • OPAC“与”、“或”
检索系统的功能
检索功能是指检索系统在检索界面上提供 给用户的基本功能。比较通用的检索功 能有:
浏览 索引 简单检索 复杂检索 二次检索
1.浏览
• 即由系统提供一个树状结构的概念等 级体系,用户可以沿着这棵树进入不 同的分支,到达叶子节点,并在节点 看到检索结果列表。 • 最常见的浏览体系是在电子期刊、电 子图书的检索中,先按照分类类目浏 览刊名或书名。
检索结果信息量过少
• 造成检索信息量少的原因有以下几点: • 首先,选用了不规范的主题词或某些产品的俗称,商品 名称作为检索词;其二,同义词、相关词、近义词没有 运用全;其三,上位概念或下位概念没有完整运用。针 对这种情况,就要考虑扩大检索范围,提高检索结果的 查全率。调整检索策略的方法如下: • ? 选全同义词与相关词并用逻辑“或”将它们连接起来, 增加网罗度。 • ? 减少逻辑“与”的运算,丢掉一些次要的或者太专指 的概念。 • ?去除某些字段限制。 • ?调整位置算符,由严变松。
确定检索词
• 检索词是表达文献信息需求的基本元素,也是计算机检索系统中进 行匹配的基本单元。检索词选择正确与否,直接影响着检索结果。 在全面了解检索课题的相关问题后,提炼主要概念与隐含概念,排 除次要概念,以便确定检索词。检索词的确定一般有以下几种方法: • (1)先选用主题词。当所选的数据库具有规范化词表时,应优先选 用该数据库词表中与检索课题相关的规范化主题词,从而可获得最 佳的检索效果。 • (2)选用数据库规定的代码。许多数据库的文档中使用各种代码 来表示各种主题范畴,有很高的匹配性。例如,世界专利文摘数据 库中的分类代码,化学文摘数据库中的化学物质登记号。 • (3)选用常用的专业术语。在数据库没有专用的词表或词表中没 有可选的词时,可以从一些已有的相关专业文献中选择常用的专业 术语作为检索词。 • (4)选用同义词与相关词。同义词、相关词、缩写词、词形变化 等应尽量选全,以提高查全率。
2.选择相关信息资源
主要确定几个方面: 是否所有与检索课题相关的资源都要进行检索,如果是, 则不但考虑要检索一次文献和二次文献的数据库,而且 对于网上其他资源,如搜索引擎/分类指南、学科导航、 专题BBS等,也要查询。 选择哪些学科的信息资源,特别注意跨学科的问题。 选择哪些语种的信息资源:中文还是西文或是两者兼顾。 信息资源覆盖的年限。 信息资源的特点及其针对性如何:要了解已选择的信息 资源的查询特点,是否与自己的信息需求相吻合。
检索策略
检索策略包括: 1.课题分析(需求分析) 2.选择相关信息资源 3.构造检索式,选择检索入口 4.对检索策略进行调整
检索策略
选 择 相 关 信 息 源
课 题 分 析
构 造 检 索 式
调 整 检 索 策 略
1.课题分析
• • • • • 课题分析主要弄清楚以下几个方面: (1)明确检索目的 (2)明确课题的主题或主要内容 (3)课题涉及的学科范围 (4)所需信息的数量、语种、年代范围、 类型等具体指标。
相关文档
最新文档