第四讲计算机检索技术概述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【实例】在搜索引擎中输入“电视台-中 央电视台”,查询结果不包含“中央电 视台”。
相同的检索词在不同的字段中检索到的结果不同。
【实例】用《中文科技期刊数据库》检索机械产品采用计算机 辅助设计的论文。
用不同字段作为途径,如下所示: 选择”u=任意字段” 输入“计算机辅助*产品”,查出2902篇; 选择”m=题名或关键词” 输入“计算机辅助*产品”,查出626
逻辑“或”
用“or”、“+”或逗号表示。在网络搜索引擎 中习惯用逗号代替“OR”。表示检出的记录中至少含有 多个检索词中的任何一个,可以扩大检索范围,增加 命中文献量,防止漏检。常用于连接同义词,相关词 等。
光盘
A
B
磁盘
A or B 例:检索“光盘和磁盘”文献
【实例】在搜索引擎中输入“计算机OR多 媒体OR Windows98”则查询至少包含 “计算机”、“多媒体”、“Windows 98”三者之一的信息。
3.2 计算机检索的相关概念
1.检索系统 信息检索系统包括两个子系统:存储子系统和检
索子系统。 2.联机检索
利用与检索系统或信息中心的主机连接,在中央 处理机控制下查询系统内的数据库,并能够与系统 实时对话,随时调整检索策略。 3.数据库
是在计算机存储设备上按一定方式存储的相互关 联的数据集合。
字段(Field) 记录(Record) 文档(File)
3. n( Near)表示两个检索词可以互换顺, 二者之间只能间隔连字符、空格或者是逗 号。
顺排文档(记录) 倒排文档(索引)
数据库(database)——由计算机进行处理的一定数 量同类信息的有序集合,是用来存储和查找文献信 息的电子化检索工具。
数据库的类型
按收录的文献类型划分
按信息处理层次划分
书 目 数 据 库
百度文库
文 摘 数 据 库
全 文 数 据 库
书学 目位 及论 图文 书数 全据 文库 数 据 库
记录(Record)——由若干字段组成的文献单元,在 全文数据库中,一条记录相当于一篇完整的文献, 在书目数据库中,一条记录相当于一条文摘或题录。
文档(File)——由若干个逻辑记录构成的信息集合, 是数据库的基本内容,分为顺排文档和倒排文档。 顺排文挡是数据库的主体内容,倒排文档是将记录 中的一切可检字段或属性值提取出来,按某种顺序 重新加以组织所得到的文档。
逻辑“非”(NOT)
表示检索结果中排除含有某些词的记录,可 以缩小检索范围,减少文献输出量,但并不一定 能提高查准率。
能源
A
B
核能
A not B 例:检索“除核能以外有关能源”文献
【实例】输入“automobile not car”, 就要求查询的结果中包含automobile (汽车),但同时不能包含car(小汽 车)。
期专 产 刊利 品 论数 数 文据 据 数库 库 据 库
按收录文献信 息的范围划分
综合性数据库
专业性数据库
文本数据库

网络数据库

声音数据库 单机数据库
联机数据库

数值数据库

息 划
图像数据库
按服务模式划分

多媒体数据库
视频数据库
3.3 检索式的拟订
3.3.1布尔逻辑检索算符 3.3.2位置检索算符 3.3.3截词检索算符 3.3.4字段揭示及限制算符 3.3.5其它符号 3.3.6注意事项
1. w (with) 表示两个检索词前后次序固定,二者之间只能间隔连
字符、空格或者是逗号。 【实例】在OCLC中输入communication w satellite; 2 . wN (with N) 表示两个检索词前后次序固定,二者之间最多间隔N个
字符。 【实例】在EBSCO中输入communication w3 satellite;
太阳
A A and B
B
能源
例:检索“太阳能”文献
【实例】检索“中国人民政府”这个网站, 可以输入“中国*政府”、“中国 and 政府”、“中国 政府”等。
【实例】检索课题“中国外汇储备规模的 研究”不是一篇文章,需要检索有关的 期刊文章,其检索式宜表达为“中国 and 外汇 and 储备 and 规模”
数据库
字段(field):如在数据库中题名、作者、作者单位、 期刊名、摘要、全文等等均是字段;一条记录由多个 字段值组成;对计算机检索来说字段相当于检索入口。
常用字段缩写: TI——Title 文章题目 AB——Abstract 文章摘要 KW——Key Word 关键词 AU——Author 作者 AF——Affiliation 作者单位 SO——Source 文章来源(刊名信息等) ISSN(ISBN)—— International standard Serial (book) Number PY——Publication year 出版年 LA——Language 语种
第四讲
计算机检索技术概述
3.1 计算机检索简况 3.2 计算机检索的相关概念 3.3 检索式的拟订 3.4 检索步骤
3.1 计算机检索简况
计算机检索指利用计算机及相关设备进行的文献信息检 索。
信息检索技术正向两个方向迅速发展: 一是在深度上提高管理和组织信息的能力 传统信息检索向全文文本、多媒体、多载体、多原理等 新型信息检索的发展. 二是在广度上提高管理和组织信息的能力 文献资源的网络化和分布化,面向Internet中浩瀚无垠 的资源。
词间位置检索
基本技术
3.3.1 布尔逻辑检索算符
1.逻辑 “与” (AND),表示为 A and B 或 A * B
2.逻辑 “或”(OR),表示为 A or B 或 A + B 3.逻辑 “非”(NOT),表示为 A not B 或 A - B
逻辑“与”
用“and”、“*”或者空格表示。在网络搜索 引擎中习惯用空格代替“and”。表示检出的记录 必须同时包含所有的检索词,可以缩小检索范围, 减少命中文献量,提高查准率。
篇; 选择“t=题名”输入“计算机辅助*产品”,查出139篇; 选择“k=关键词”输入“计算机辅助*产品”,查出545篇; 检索入口 选择“c=分类号”输入“机械产品”的分类号
“TH122”年限设定,查到11206条。
3.3.2 位置检索算符
也叫“邻接检索”, 表示两个或多个检索词之间的 关系检索方式,常用的位置算符有:
相关文档
最新文档