第1章 数字资源的检索原理与检索策略
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2009.9
讲授内容
• • • • • • • • • • • 第1章 第2章 第3章 第4章 第5章 第6章 第7章 第8章 第9章 10章 第10章 11章 第11章
2
数字资源的检索原理与检索策略 中文文献数据库 著名综合性参考数据库 英文参考数据库 全文数据库 电子图书、 电子图书、电子报纸及其使用 电子期刊及其使用 特种文献及其检索 事实和数值型数据库 网络学术资源的收集 信息资源的分析利用、 信息资源的分析利用、组织与论文写作
9 《数字资源检索教程》 数字资源检索教程》
1.2.2 信息检索
将描述特定用户所需信息的提问特征与信息存储的检索 标识进行异同的比较, 标识进行异同的比较,从中找出与提问特征一致或基本 一致的信息。 一致的信息。 1.识别用户:账号密码、IP地址允许机制 识别用户:账号密码、IP地址允许机制 接收提问: 2.接收提问:三种界面形式 提问校验:语法检查、 3.提问校验:语法检查、用词检查等 转化提问式:解释、 4.转化提问式:解释、转化 检索: 5.检索:匹配比较 结果输出: 6.结果输出:结果排序输出
19
《数字资源检索教程》 数字资源检索教程》
截词位置
前截词(左截词、后方一致):允许检索词前有若干变化。 前截词(左截词、后方一致):允许检索词前有若干变化。如 ):允许检索词前有若干变化 physics就可检索到physics、astrophysics、biophysics、 就可检索到physics *physics就可检索到physics、astrophysics、biophysics、 chemophysics、geophysics等词的结果 等词的结果。 chemophysics、geophysics等词的结果。 后截词(右截词、前方一致):允许检索词尾有若干变化。 后截词(右截词、前方一致):允许检索词尾有若干变化。如 ):允许检索词尾有若干变化 comput*将检索出 将检索出computer computing、computerised、 comput*将检索出computer 、computing、computerised、 computerized、computerization等结果 等结果。 computerized、computerization等结果。 前后截词(中间一致):词干的前后各有一个截词符,允许检索词的 前后截词(中间一致):词干的前后各有一个截词符,允许检索词的 ):词干的前后各有一个截词符 前端和尾部各有若干变化形式 各有若干变化形式。 computer*可检索computer、 可检索computer 前端和尾部各有若干变化形式。如*computer*可检索computer、 computers、computerize、computerized、computerization、 computers、computerize、computerized、computerization、 minicomputer、minicomputers、microcomputer、 minicomputer、minicomputers、microcomputer、microcomputers 等结果。 等结果。 中间截词(前后一致):允许检索词中间有若干变化。例如wom*n可 中间截词(前后一致):允许检索词中间有若干变化。例如wom*n可 ):允许检索词中间有若干变化 wom*n 检索出woman women。英美的不同拼法,defen*e可检索出defence、 woman、 可检索出defence 检索出woman、women。英美的不同拼法,defen*e可检索出defence、 defense的结果 的结果。 和defense的结果。
15wk.baidu.com
《数字资源检索教程》 数字资源检索教程》
布尔逻辑检索- 布尔逻辑检索-例子
例如检索: 打印机驱动程序” 例如检索:“打印机驱动程序”
查询关键词:打印机、 查询关键词:打印机、驱动程序 检索表达式:打印机* 检索表达式:打印机*驱动程序
例如检索:“微型计算机”方面的有关信息 例如检索: 微型计算机”
10
《数字资源检索教程》 数字资源检索教程》
1.3 数字资源的检索技术
1 2 3 4
布尔逻辑检索技术 截词检索技术 邻近检索技术
字段检索技术
11
《数字资源检索教程》 数字资源检索教程》
1.3.1 布尔逻辑检索技术
检索词:是单字匹配?还是词组匹配? 检索词 : 是单字匹配 ? 还是词组匹配 ? 或者是句 子匹配? 子匹配? 举例: 私营企业人力资源研究》如何检索? 举例:《私营企业人力资源研究》如何检索? 布尔逻辑检索是指通过标准的布尔逻辑关系算符 来表达检索词 检索词间的逻辑关系的检索方法 检索词与 来表达检索词与检索词间的逻辑关系的检索方法 主要的布尔逻辑关系词有:逻辑与(AND) (AND)、 主要的布尔逻辑关系词有 : 逻辑与 (AND) 、 逻辑或 (OR)、逻辑非(NOT) OR) 逻辑非(NOT)
12
《数字资源检索教程》 数字资源检索教程》
逻辑与
逻辑乘: and”或 逻辑乘: “and 或“*”表示 组配方式:A*B或者 或者A 组配方式:A*B或者A and B 表示两个概念的交叉 和限定关系, 和限定关系,只有同时含有这两个概念的记录才算 命中信息 作用:增加限制条件,即增加检索的专指性, 作用:增加限制条件,即增加检索的专指性,以缩 小提问范围,减少文献输出量,提高查准率。 小提问范围,减少文献输出量,提高查准率。 举例: and(或用 或用* 举例:私营企业 and(或用*) 人力资源
13
《数字资源检索教程》 数字资源检索教程》
逻辑或
又称逻辑和:“or”、“+” 又称逻辑和: or 、 组配方式: B或者 或者A 表示检索含有A 组配方式:A OR B或者A+B,表示检索含有A词, 或含有B 或同时包含A 两词的文章。 或含有B词,或同时包含A、B两词的文章。 作用:放宽提问范围,增加检索结果, 作用:放宽提问范围,增加检索结果,起扩检作 提高查全率。 用,提高查全率。 举例:( :(私营企业 举例:(私营企业 or 私人企业 or 民营企业 or 私企) 私企) and 人力资源
数字资源检索的发展阶段(四个阶段) 1.1.3 数字资源检索的发展阶段(四个阶段)
脱机检索阶段 联机检索阶段 光盘检索阶段 网络检索阶段
6
《数字资源检索教程》 数字资源检索教程》
数字资源检索的进展(三大技术) 1.1.4 数字资源检索的进展(三大技术)
全文检索技术
• • • • • 概念信息检索 超文本信息检索 图像检索 视频检索 音频检索
错误表达式: 错误表达式:
•唐 •唐 •唐 •唐
17
+ * + *
宋 宋 宋 宋
* * + +
诗歌; 诗歌; 诗歌; 诗歌; 诗歌; 诗歌; 诗歌; 诗歌;
《数字资源检索教程》 数字资源检索教程》
注
意
布尔逻辑检索技术在联机检索和光盘检索及网络搜索引 擎中得到广泛的应用。但在实现方式上有所差异, 擎中得到广泛的应用。但在实现方式上有所差异,即所 使用的逻辑符号可能是不同的。 使用的逻辑符号可能是不同的。 一些检索工具会完全省略任何符号和关系, 一些检索工具会完全省略任何符号和关系,直接把布尔 逻辑关系隐含在菜单中。 逻辑关系隐含在菜单中。 一些网络检索工具如搜索引擎甚至用“ 、,、一些网络检索工具如搜索引擎甚至用“︺、,、-”(即 空格、逗号、减号)来表示。 空格、逗号、减号)来表示。 一般情况下请按以下规则使用逻辑符号, 一般情况下请按以下规则使用逻辑符号,但并非所有数 据库和搜索引擎都是如此,具体请参考所用数字资源。 据库和搜索引擎都是如此,具体请参考所用数字资源。
8 《数字资源检索教程》 数字资源检索教程》
1.2.1 信息存储
按照既定的标准和原则,从信息中选择合适的信息, 按照既定的标准和原则,从信息中选择合适的信息,并 对这些信息的内容进行概念分析, 对这些信息的内容进行概念分析,用系统规定的检索语 言进行标引,形成信息的特征信息,进行整理与排序, 言进行标引,形成信息的特征信息,进行整理与排序,构 成可供检索的数据库。 成可供检索的数据库。 主要包括信息的采集 著录、标引和整序等过程 采集、 等过程。 主要包括信息的采集、著录、标引和整序等过程。 信息的采集:常见的数据来源? 1.信息的采集:常见的数据来源? 网络信息又是如何采集的? 网络信息又是如何采集的? 2.信息的著录:文献特征(外表和内容特征)? 信息的著录:文献特征(外表和内容特征) 数据库的结构? 数据库的结构? 信息的标引:内容标识?自动标引?著录标引的作用? 3.信息的标引:内容标识?自动标引?著录标引的作用? 信息的整序:数据评价与转换、数据录入、 4.信息的整序:数据评价与转换、数据录入、数据库的维护 与更新。 与更新。
中文数据库用: 中文数据库用: * + - and or not 西文数据库用: 西文数据库用: and or not 搜索引擎用: 搜索引擎用:︺ , 18 《数字资源检索教程》 数字资源检索教程》
1.3.2 截词检索技术
主要应用于西文数字资源的检索 定义:是指在检索式中用专门的符号(截词符号) 定义:是指在检索式中用专门的符号(截词符号)表示检 索词的某一部分允许有一定的词形变化。 索词的某一部分允许有一定的词形变化。 原因:在检索中,常会遇到一些词干相同、 原因:在检索中,常会遇到一些词干相同、词义相近的检 索词或有英、美不同拼写法的词,为了减少检索词输入量, 索词或有英、美不同拼写法的词,为了减少检索词输入量, 节省机时,同时又扩大检索范围,保证查全率, 节省机时,同时又扩大检索范围,保证查全率,可使用截 词检索。 词检索。 截词符一般用“ 表示,不同的系统, 截词符一般用“?”或“*”表示,不同的系统,不同的 数据库,其代表的含义可能有所不同。 数据库,其代表的含义可能有所不同。 作用:主要是提高查全率。 作用:主要是提高查全率。
《数字资源检索教程》 数字资源检索教程》
第1章 数字资源的检索原理与检索策略
1 2 3 4 5
3
数字资源及其检索概述 数字资源检索原理 数字资源的检索技术 数字资源检索语言 数字资源的检索策略
《数字资源检索教程》 数字资源检索教程》
1.1.1 数字资源的概念与特点
文献的概念? 记录有知识的一切载体,统称为文献。 常见的纸质文献资源? 数字资源的概念? 数字资源是数字化的信息资源或数字化文献, 是指可通过计算机本地或远程读取、使用,以 数字形式存放在光、磁载体上,以电信号、光 信号的形式传输的图像、文字、声音、视频等 信息资源。
查询关键词:微型计算机、 查询关键词:微型计算机、微机 检索表达式:微型计算机+ 检索表达式:微型计算机+微机
16
《数字资源检索教程》 数字资源检索教程》
布尔逻辑运算符优先级
例:检索“唐宋诗歌”的有关信息 检索“唐宋诗歌”
关键词: 关键词:唐、宋、诗歌; 诗歌; 检索表达式: 检索表达式:
• (唐 + 宋)*诗歌; 诗歌; • 唐 * 诗歌 + 宋 * 诗歌; 诗歌;
4 《数字资源检索教程》 数字资源检索教程》
主要数字资源类型简介(五个类型) 1.1.2 主要数字资源类型简介(五个类型)
1 2 3 4 5
5
参考数据库
全文数据库
事实、 事实、数值型数据库
电子图书、 电子图书、电子期刊和电子报纸
网络资源指南/ 网络资源指南/搜索引擎
《数字资源检索教程》 数字资源检索教程》
基于内容的多媒体检索技术
数据挖掘技术
7
《数字资源检索教程》 数字资源检索教程》
1.2 数字资源检索原理
数字资源检索? 数字资源检索? 手段, 通过检索系统 采用一定的技术手段 根据一定的原 检索系统, 通过检索系统,采用一定的技术手段,根据一定的原 则,在数据库或其他形式的数字资源中自动找出用户 所需相关信息的过程。 所需相关信息的过程。 检索原理? 检索原理? 本质:对信息集合和需求集合的匹配和选择。 本质:对信息集合和需求集合的匹配和选择。 一方面,为保证用户全面、准确、 1. 一方面,为保证用户全面、准确、快速地获得所 需信息,要对原始信息进行存储,并以数据库或其他 需信息,要对原始信息进行存储, 形式的资源存在。 形式的资源存在。 另一方面,对用户所表达的信息需求进行分析, 2. 另一方面,对用户所表达的信息需求进行分析, 并与所存储的数字资源进行匹配运算, 并与所存储的数字资源进行匹配运算,自动检索出两 者相一致的部分,输出给用户,即为检索结果。 者相一致的部分,输出给用户,即为检索结果。
14 《数字资源检索教程》 数字资源检索教程》
逻辑非
又称逻辑差: not” “-” 又称逻辑差: “not 组配方式: 表示检索出含有A词而不含有B 组配方式:A-B,表示检索出含有A词而不含有B 词的文 章。 作用:逻辑非用于排除不希望出现的检索词,它和“ 作用:逻辑非用于排除不希望出现的检索词,它和“*” 的作用相似,能够缩小命中文献范围,增强检索的准确性。 的作用相似,能够缩小命中文献范围,增强检索的准确性。 举例: 举例:人力资源 not 国营企业
讲授内容
• • • • • • • • • • • 第1章 第2章 第3章 第4章 第5章 第6章 第7章 第8章 第9章 10章 第10章 11章 第11章
2
数字资源的检索原理与检索策略 中文文献数据库 著名综合性参考数据库 英文参考数据库 全文数据库 电子图书、 电子图书、电子报纸及其使用 电子期刊及其使用 特种文献及其检索 事实和数值型数据库 网络学术资源的收集 信息资源的分析利用、 信息资源的分析利用、组织与论文写作
9 《数字资源检索教程》 数字资源检索教程》
1.2.2 信息检索
将描述特定用户所需信息的提问特征与信息存储的检索 标识进行异同的比较, 标识进行异同的比较,从中找出与提问特征一致或基本 一致的信息。 一致的信息。 1.识别用户:账号密码、IP地址允许机制 识别用户:账号密码、IP地址允许机制 接收提问: 2.接收提问:三种界面形式 提问校验:语法检查、 3.提问校验:语法检查、用词检查等 转化提问式:解释、 4.转化提问式:解释、转化 检索: 5.检索:匹配比较 结果输出: 6.结果输出:结果排序输出
19
《数字资源检索教程》 数字资源检索教程》
截词位置
前截词(左截词、后方一致):允许检索词前有若干变化。 前截词(左截词、后方一致):允许检索词前有若干变化。如 ):允许检索词前有若干变化 physics就可检索到physics、astrophysics、biophysics、 就可检索到physics *physics就可检索到physics、astrophysics、biophysics、 chemophysics、geophysics等词的结果 等词的结果。 chemophysics、geophysics等词的结果。 后截词(右截词、前方一致):允许检索词尾有若干变化。 后截词(右截词、前方一致):允许检索词尾有若干变化。如 ):允许检索词尾有若干变化 comput*将检索出 将检索出computer computing、computerised、 comput*将检索出computer 、computing、computerised、 computerized、computerization等结果 等结果。 computerized、computerization等结果。 前后截词(中间一致):词干的前后各有一个截词符,允许检索词的 前后截词(中间一致):词干的前后各有一个截词符,允许检索词的 ):词干的前后各有一个截词符 前端和尾部各有若干变化形式 各有若干变化形式。 computer*可检索computer、 可检索computer 前端和尾部各有若干变化形式。如*computer*可检索computer、 computers、computerize、computerized、computerization、 computers、computerize、computerized、computerization、 minicomputer、minicomputers、microcomputer、 minicomputer、minicomputers、microcomputer、microcomputers 等结果。 等结果。 中间截词(前后一致):允许检索词中间有若干变化。例如wom*n可 中间截词(前后一致):允许检索词中间有若干变化。例如wom*n可 ):允许检索词中间有若干变化 wom*n 检索出woman women。英美的不同拼法,defen*e可检索出defence、 woman、 可检索出defence 检索出woman、women。英美的不同拼法,defen*e可检索出defence、 defense的结果 的结果。 和defense的结果。
15wk.baidu.com
《数字资源检索教程》 数字资源检索教程》
布尔逻辑检索- 布尔逻辑检索-例子
例如检索: 打印机驱动程序” 例如检索:“打印机驱动程序”
查询关键词:打印机、 查询关键词:打印机、驱动程序 检索表达式:打印机* 检索表达式:打印机*驱动程序
例如检索:“微型计算机”方面的有关信息 例如检索: 微型计算机”
10
《数字资源检索教程》 数字资源检索教程》
1.3 数字资源的检索技术
1 2 3 4
布尔逻辑检索技术 截词检索技术 邻近检索技术
字段检索技术
11
《数字资源检索教程》 数字资源检索教程》
1.3.1 布尔逻辑检索技术
检索词:是单字匹配?还是词组匹配? 检索词 : 是单字匹配 ? 还是词组匹配 ? 或者是句 子匹配? 子匹配? 举例: 私营企业人力资源研究》如何检索? 举例:《私营企业人力资源研究》如何检索? 布尔逻辑检索是指通过标准的布尔逻辑关系算符 来表达检索词 检索词间的逻辑关系的检索方法 检索词与 来表达检索词与检索词间的逻辑关系的检索方法 主要的布尔逻辑关系词有:逻辑与(AND) (AND)、 主要的布尔逻辑关系词有 : 逻辑与 (AND) 、 逻辑或 (OR)、逻辑非(NOT) OR) 逻辑非(NOT)
12
《数字资源检索教程》 数字资源检索教程》
逻辑与
逻辑乘: and”或 逻辑乘: “and 或“*”表示 组配方式:A*B或者 或者A 组配方式:A*B或者A and B 表示两个概念的交叉 和限定关系, 和限定关系,只有同时含有这两个概念的记录才算 命中信息 作用:增加限制条件,即增加检索的专指性, 作用:增加限制条件,即增加检索的专指性,以缩 小提问范围,减少文献输出量,提高查准率。 小提问范围,减少文献输出量,提高查准率。 举例: and(或用 或用* 举例:私营企业 and(或用*) 人力资源
13
《数字资源检索教程》 数字资源检索教程》
逻辑或
又称逻辑和:“or”、“+” 又称逻辑和: or 、 组配方式: B或者 或者A 表示检索含有A 组配方式:A OR B或者A+B,表示检索含有A词, 或含有B 或同时包含A 两词的文章。 或含有B词,或同时包含A、B两词的文章。 作用:放宽提问范围,增加检索结果, 作用:放宽提问范围,增加检索结果,起扩检作 提高查全率。 用,提高查全率。 举例:( :(私营企业 举例:(私营企业 or 私人企业 or 民营企业 or 私企) 私企) and 人力资源
数字资源检索的发展阶段(四个阶段) 1.1.3 数字资源检索的发展阶段(四个阶段)
脱机检索阶段 联机检索阶段 光盘检索阶段 网络检索阶段
6
《数字资源检索教程》 数字资源检索教程》
数字资源检索的进展(三大技术) 1.1.4 数字资源检索的进展(三大技术)
全文检索技术
• • • • • 概念信息检索 超文本信息检索 图像检索 视频检索 音频检索
错误表达式: 错误表达式:
•唐 •唐 •唐 •唐
17
+ * + *
宋 宋 宋 宋
* * + +
诗歌; 诗歌; 诗歌; 诗歌; 诗歌; 诗歌; 诗歌; 诗歌;
《数字资源检索教程》 数字资源检索教程》
注
意
布尔逻辑检索技术在联机检索和光盘检索及网络搜索引 擎中得到广泛的应用。但在实现方式上有所差异, 擎中得到广泛的应用。但在实现方式上有所差异,即所 使用的逻辑符号可能是不同的。 使用的逻辑符号可能是不同的。 一些检索工具会完全省略任何符号和关系, 一些检索工具会完全省略任何符号和关系,直接把布尔 逻辑关系隐含在菜单中。 逻辑关系隐含在菜单中。 一些网络检索工具如搜索引擎甚至用“ 、,、一些网络检索工具如搜索引擎甚至用“︺、,、-”(即 空格、逗号、减号)来表示。 空格、逗号、减号)来表示。 一般情况下请按以下规则使用逻辑符号, 一般情况下请按以下规则使用逻辑符号,但并非所有数 据库和搜索引擎都是如此,具体请参考所用数字资源。 据库和搜索引擎都是如此,具体请参考所用数字资源。
8 《数字资源检索教程》 数字资源检索教程》
1.2.1 信息存储
按照既定的标准和原则,从信息中选择合适的信息, 按照既定的标准和原则,从信息中选择合适的信息,并 对这些信息的内容进行概念分析, 对这些信息的内容进行概念分析,用系统规定的检索语 言进行标引,形成信息的特征信息,进行整理与排序, 言进行标引,形成信息的特征信息,进行整理与排序,构 成可供检索的数据库。 成可供检索的数据库。 主要包括信息的采集 著录、标引和整序等过程 采集、 等过程。 主要包括信息的采集、著录、标引和整序等过程。 信息的采集:常见的数据来源? 1.信息的采集:常见的数据来源? 网络信息又是如何采集的? 网络信息又是如何采集的? 2.信息的著录:文献特征(外表和内容特征)? 信息的著录:文献特征(外表和内容特征) 数据库的结构? 数据库的结构? 信息的标引:内容标识?自动标引?著录标引的作用? 3.信息的标引:内容标识?自动标引?著录标引的作用? 信息的整序:数据评价与转换、数据录入、 4.信息的整序:数据评价与转换、数据录入、数据库的维护 与更新。 与更新。
中文数据库用: 中文数据库用: * + - and or not 西文数据库用: 西文数据库用: and or not 搜索引擎用: 搜索引擎用:︺ , 18 《数字资源检索教程》 数字资源检索教程》
1.3.2 截词检索技术
主要应用于西文数字资源的检索 定义:是指在检索式中用专门的符号(截词符号) 定义:是指在检索式中用专门的符号(截词符号)表示检 索词的某一部分允许有一定的词形变化。 索词的某一部分允许有一定的词形变化。 原因:在检索中,常会遇到一些词干相同、 原因:在检索中,常会遇到一些词干相同、词义相近的检 索词或有英、美不同拼写法的词,为了减少检索词输入量, 索词或有英、美不同拼写法的词,为了减少检索词输入量, 节省机时,同时又扩大检索范围,保证查全率, 节省机时,同时又扩大检索范围,保证查全率,可使用截 词检索。 词检索。 截词符一般用“ 表示,不同的系统, 截词符一般用“?”或“*”表示,不同的系统,不同的 数据库,其代表的含义可能有所不同。 数据库,其代表的含义可能有所不同。 作用:主要是提高查全率。 作用:主要是提高查全率。
《数字资源检索教程》 数字资源检索教程》
第1章 数字资源的检索原理与检索策略
1 2 3 4 5
3
数字资源及其检索概述 数字资源检索原理 数字资源的检索技术 数字资源检索语言 数字资源的检索策略
《数字资源检索教程》 数字资源检索教程》
1.1.1 数字资源的概念与特点
文献的概念? 记录有知识的一切载体,统称为文献。 常见的纸质文献资源? 数字资源的概念? 数字资源是数字化的信息资源或数字化文献, 是指可通过计算机本地或远程读取、使用,以 数字形式存放在光、磁载体上,以电信号、光 信号的形式传输的图像、文字、声音、视频等 信息资源。
查询关键词:微型计算机、 查询关键词:微型计算机、微机 检索表达式:微型计算机+ 检索表达式:微型计算机+微机
16
《数字资源检索教程》 数字资源检索教程》
布尔逻辑运算符优先级
例:检索“唐宋诗歌”的有关信息 检索“唐宋诗歌”
关键词: 关键词:唐、宋、诗歌; 诗歌; 检索表达式: 检索表达式:
• (唐 + 宋)*诗歌; 诗歌; • 唐 * 诗歌 + 宋 * 诗歌; 诗歌;
4 《数字资源检索教程》 数字资源检索教程》
主要数字资源类型简介(五个类型) 1.1.2 主要数字资源类型简介(五个类型)
1 2 3 4 5
5
参考数据库
全文数据库
事实、 事实、数值型数据库
电子图书、 电子图书、电子期刊和电子报纸
网络资源指南/ 网络资源指南/搜索引擎
《数字资源检索教程》 数字资源检索教程》
基于内容的多媒体检索技术
数据挖掘技术
7
《数字资源检索教程》 数字资源检索教程》
1.2 数字资源检索原理
数字资源检索? 数字资源检索? 手段, 通过检索系统 采用一定的技术手段 根据一定的原 检索系统, 通过检索系统,采用一定的技术手段,根据一定的原 则,在数据库或其他形式的数字资源中自动找出用户 所需相关信息的过程。 所需相关信息的过程。 检索原理? 检索原理? 本质:对信息集合和需求集合的匹配和选择。 本质:对信息集合和需求集合的匹配和选择。 一方面,为保证用户全面、准确、 1. 一方面,为保证用户全面、准确、快速地获得所 需信息,要对原始信息进行存储,并以数据库或其他 需信息,要对原始信息进行存储, 形式的资源存在。 形式的资源存在。 另一方面,对用户所表达的信息需求进行分析, 2. 另一方面,对用户所表达的信息需求进行分析, 并与所存储的数字资源进行匹配运算, 并与所存储的数字资源进行匹配运算,自动检索出两 者相一致的部分,输出给用户,即为检索结果。 者相一致的部分,输出给用户,即为检索结果。
14 《数字资源检索教程》 数字资源检索教程》
逻辑非
又称逻辑差: not” “-” 又称逻辑差: “not 组配方式: 表示检索出含有A词而不含有B 组配方式:A-B,表示检索出含有A词而不含有B 词的文 章。 作用:逻辑非用于排除不希望出现的检索词,它和“ 作用:逻辑非用于排除不希望出现的检索词,它和“*” 的作用相似,能够缩小命中文献范围,增强检索的准确性。 的作用相似,能够缩小命中文献范围,增强检索的准确性。 举例: 举例:人力资源 not 国营企业