第1章 文献信息源(3)信息检索基础
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息检索基础知识
第一节信息检索及其类型第二节信息检索语言
第三节信息检索技术
第一节信息检索及其类型
一、信息检索的概念
二、信息检索的类型
三、信息检索的意义
一、信息检索
信息检索:是指将信息(主要指文献信息)按一定的方式组织和存储起来,并根据用户的需要找出相关信息的过程。
信息检索
存储
检索存储:是对信息进行著录、标引、整序,编制检索工
具和建立检索系统的过程。检索:是指面向信息需求而进行高度选择性的查找过程。
原始文献加工整理
数据库提问检索输出
存储
检索
二、信息检索的类型
(一)按检索内容划分
1、书目检索
是以文献线索为检索内容的信息检索。
2、数据检索
是以数据为检索内容的信息检索,要求从检索系统存储的大量原始调查数据和其它统计数据中查出所需的数字资料。
3、事实检索
是以具体事项为检索内容的信息检索,要求从检索系统存储的各种原始信息资源中查出专门的事实材料。4、全文检索
即检索系统存储的是整篇文章或整本图书。
5、图像检索
即以图形、图像或图文信息为检索内容的信息检索。
6、多媒体检索
是以文字、图像、声音等多媒体信息为检索内容的信息检索。
(二)按是否使用检索工具划分
1、直接检索
就是指利用一次文献进行检索,这是以前比较常用的一种查找方法。所花时间多和精力大,检出文献少。
(二)按是否使用检索工具划分
2、间接检索
就是指利用各种检索工具获得文献线索,再根据线索去查找原始文献线索的方法。
(三)按信息检索手段划分
1、传统信息检索
就是手工信息检索,是利用各种印刷型检索工具来查找文献的一种方法。
(三)按信息检索手段划分
2、现代信息检索
现代信息检索即计算机信息检索,是指利用计算机和网络来处理和查找文献信息的检索方式。
三、信息检索的意义
1、信息检索是现代人才的基本生存技能
2、信息检索是科学交流的重要途径
3、信息检索是开发信息资源的工具
4、信息检索是管理决策的基础
5、信息检索是继承和借鉴前人成果,避免重
复研究的必由之路
第二节信息检索语言
一、检索语言的含义及作用
二、检索语言的类型
一、检索语言的含义及作用
检索语言:是根据检索需要而创造的一种人工语言。
作用:1、保证不同标引人员表征文献信息的一致性。
2、使内容相同及相关的文献集中化。
3、保证检索提问与文献信息标引的一致性。
4、保证检索者按不同需求检索文献信息时,
都能获得最高的查全率和查准率。
二、检索语言的类型
检索语言的类型表述文献外表
特征的语言
表述文献内容
特征的语言
题名
责任者
号码
引文
分类法
主题法
标题词法
叙词法
关键词法
分类语言
按知识门类的逻辑次序将信息系统地组织和划分的语言,具体体现为用分类号和类名来表达信息的主题概念。
中国图书馆图书分类法
美国国会图书馆分类法
杜威十进位分类法
IPC国际专利分类法
主题语言
标题词语言
是从文献的题目和内容中抽出来,经过规范化处理的主题语言。
关键词语言
直接从文献信息的标题、摘要或内容本身抽取出来的用于揭示信息主题内容的自由词。
叙词语言
是以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组配的一种主语语言。
参考:汉语主题词表.ppt
第三节检索技术
一、概念检索
二、布尔逻辑运算符组配检索
三、截词检索
四、字段限制检索
五、位置运算符
六、检索技巧和方法
一、概念检索
检索标识是具体的检索词或词组,每个检索词表达一个概念,具体检索时,将检索词与数据库中的文献特征标识进行类比,两者相同,则该记录为命中文献。
二、布尔逻辑算符组配检索
布尔逻辑组配运算是采用布尔代数中的逻辑“与”逻辑“或”、逻辑“非”等算符,将检索提问式转换成逻辑表达式,限定检索词在记录中必须存在的条件或不能出现的条件。凡符合布尔逻辑所规定的条件的文献,既为命中文献。
布尔逻辑运算符————————————
1、逻辑“或”
2、逻辑“与”
3、逻辑“非”
1、逻辑“或”(和)—————————————————
A B
用符号“or”或“+”表示,其逻辑表达式为:
A or
B 或A+B
其意义为检索记录中凡含有检索词A或检索词B,
或同时含有检索词A和B的,均为命中文献。
2、逻辑“与”————————————————
A B
用符号“and”或“*”表示,其逻辑表达式为:
A *
B 或 A and B
其意义为检索记录中必须同时含有检索词A和B
的文献,才算命中文献。
3、逻辑“非”————————————————
A B
用符号“not”或“-”,其逻辑表达式为:
A not
B 或A-B
其意义为:检索记录中含有检索词A,但不能含有检索词B的文献,才算命中文献。