文献信息检索基本原理及方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据信息检索:数据信息是指检索系统中存储的是数值型数据,如科学 技术常数、各种统计数据等,信息用户可用通过检索获得的经过核实、整 理的数值信息再做定量分析。
事实信息检索:又称事项检索。是指系以事实为检索内容的情报检索, 其检索对象包括事实、概念、思想、知识、人物的基本信息等内容,事实 检索也是一种确定性检索,,用户获得的是有关某一事物的具体答案。
3.2 文献信息检索原理
文献信息检索的基本原理:就是用户根据课题需要,将代
表需要查找的检索提问标识与文献库中所存储的文献特征标识 进行比较,当文献库中所存储的文献特征标识与检索提问标识 相一致,或文献特征标识包含了检索提问标识时,那么具有这 些特征的标识就被检出,即是命中的结果。
信息存储与检索原理流程图
一种较好的检索语言应具有对多种检索要求的 广泛适应性,保证有较高的查全率和查准率; 具有对多种学科和多种信息类型的适应性;具 有与其他检索语言的兼容性和国际通用性。
检索语言
检索语言的分类划分
区分依据 按内容和结
构划分
按标识组配 方式
按描述文 献的特征
类型
分类语言
主题语言
先组式 检索语言
后组式 检索语言
➢相关性检索——是系统不直接回答用户所提出的 技术问题本身,而是只提供与之相关的文献供用 户参考。
➢确定性检索——是以数据或事实为检索对象,系 统要直接问答用户提出的技术问题,即直接提供 用户需要的确切的数据或事实。
文献信息检索的类型
根据检索对象划分 书目检索:是以文献线索为检索对象的文献检索,即检索检索系统存储
第三章文献信息检索基本原含义
一、文献信息检索的基本含义
“检索”即“查找”之意。信息检索,是将信息按照一定的方式 组织、存储起来,并针对用户的需要查找所需信息的过程。因此信 息检索包含了信息的存储和检索两个不可分的部分。我们通常所说 的信息检索是指狭义的信息检索,即从检索工具和检索系统中查找 所需信息的过程及其所采取的一系列方法和策略。
3.1.2 文献信息检索的类型
按检索手段
手工检索
机械检索
依靠手工操作来完成检索过程, 所用文献一般是以纸张为载体。
主要是指利用计算机进行文献信 息检索,也称作计算机信息检索, 所用的文献多以非纸张为载体,
手工检索和计算机检索的关系:手检是基础,机检是发展方向。
3.1.2 文献信息检索的类型
按检索要求划分:
是以文献信息上标明的、显而易见的外部特征, 如题名、著者等作为文献标识和检索的依据。
描述文献内部特 它包括分类语言和主题词语言。对内容特征语言 征的检索语言 的研究,是信息检索语言的主题与核心。
分类语言
检索语言
概 念
是指以数字、字母或数字与字母结合作为基本字 符,以基本类目为基本词汇,以类目的从属关系
描述文献外部特 征的检索语言
概念
用分类号表达各种概念并按学科性质进行分类和 系统排列
以主题词作为文献主题概念的标识作用
指描述文献主题概念的标识在检索之前就已 经事先固定好了的标识系统.如体系分类语言、 标题词语言
指描述文献的标识在检索之前未固定组配,而是 在检索时根据检索的实际需要,按照组配规则临 时进行组配的标识系统。如叙词语言。
索
语
语法是指如何创造和运用标识来
言
语法
准确表达信息内容特征,以有效 实现信息检索的一整套规则。
检索语言
检索语言须具备三个基本要素: 1. 有一套专用字符来构建词汇; 2. 有一定数量的基本词汇用来表达基本概念; 3. 有一套专用语法规则,用严格的句法手段和词法对词汇 进行控制,以准确表达各种各样的概念。
文 献 信 息
文
分
献 信
析
息 特
征
文
标 引
检 索
形 成
献输 信 息入
语
标
言
识
文 献 信 息
检
匹 配索
和
输
检 索 课 题
文 献 分信 析息
检 索 课 题
选 用
信
息
名
检
检
称 规 范
形 成
索 提 问 标
输 入
索 系
识
统
出结 果
检索语言
在信息检索工作中,检索语言亦称情报检索语 言,在存储和检索过程中,检索语言起着重要 的作用。它把信息的内容特征和外表特征简明 而有效的揭示出来,并保证了文献存储的集中 化和系统化,使有规律的检索成为可能;沟通 检索人员和标引人员的思想,引导检索人员和 标引人员理解一致,避免检索的漏误。具体而 言:它能够保证不同标引人员表达文献的一致 性,保证不同检索人员检索提问的一致性,保 证检索提问与文献标引的一致性。
主题语言
检索语言
是一种描述概念性语言,它用语词直接表达文献的主题, 这些语词就是表达主题概念的标识。将这些作标识的语 词按字顺序排列并使用参照系统来间接表达各种概念之 间的关系,这就是主题语言。
的是以二次文献为对象(目录、索引、文摘)的信息,他们是文献信息的外部特 征与内容特征的描述集合体,信息用户通过检索,获取的是原文的“替代物”。 用户通过检索获得的是与检索课题有关的一系列文献线索,然后再通过阅读决定 取舍。
全文检索:是以文献所含的全部信息作为检索内容的文献检索,即检索 系统提供的是整篇文章或整部图书的全部内容,检索时可以查找到原文以 及有关的句、段、接、章等文字,并可进行各种频率统计和内容分析。全 文检索主要是用自然语言表达检索课题。较适用于某些参考价值大的典据 性文献。全文检索是当前计算机检索的发展方向之一。
来表达概念间相互关系的一类检索语言。
分类原理:分类是对知识概念的划分。分类语言是用分类号来表达学科体 系的各种概念,将各种知识要领按学科性质进行分类和系统排列。即以学 科分类为基础,按照概念划分的原理,将知识分门别类地按一定的逻辑次 序,从总到分,从具体到一般,从简单到复杂、进行层层划分,层层隶属, 形成一个严格有序、层次分明的知识门类体系,以便从知识分类的角度按 学科、分专业地集中信息,揭示各类信息在内容上的联系与区别,提供从 学科分类角度检索信息的途径。
检索语言的定义:检索语言是从自然语言精选出来的 一整套词汇、符号,用以对文献内容和信息特征进行 概括和规范。它是文献的标引系统,也是读者检索使 用的一种符号系统,是检索工具和参考工具书的重要 组成部分。
检索语言
词汇
词汇是指收录在类表和词表中的 所有标识,如分类号、检索词、 代码等,是可识别词汇。
检
事实信息检索:又称事项检索。是指系以事实为检索内容的情报检索, 其检索对象包括事实、概念、思想、知识、人物的基本信息等内容,事实 检索也是一种确定性检索,,用户获得的是有关某一事物的具体答案。
3.2 文献信息检索原理
文献信息检索的基本原理:就是用户根据课题需要,将代
表需要查找的检索提问标识与文献库中所存储的文献特征标识 进行比较,当文献库中所存储的文献特征标识与检索提问标识 相一致,或文献特征标识包含了检索提问标识时,那么具有这 些特征的标识就被检出,即是命中的结果。
信息存储与检索原理流程图
一种较好的检索语言应具有对多种检索要求的 广泛适应性,保证有较高的查全率和查准率; 具有对多种学科和多种信息类型的适应性;具 有与其他检索语言的兼容性和国际通用性。
检索语言
检索语言的分类划分
区分依据 按内容和结
构划分
按标识组配 方式
按描述文 献的特征
类型
分类语言
主题语言
先组式 检索语言
后组式 检索语言
➢相关性检索——是系统不直接回答用户所提出的 技术问题本身,而是只提供与之相关的文献供用 户参考。
➢确定性检索——是以数据或事实为检索对象,系 统要直接问答用户提出的技术问题,即直接提供 用户需要的确切的数据或事实。
文献信息检索的类型
根据检索对象划分 书目检索:是以文献线索为检索对象的文献检索,即检索检索系统存储
第三章文献信息检索基本原含义
一、文献信息检索的基本含义
“检索”即“查找”之意。信息检索,是将信息按照一定的方式 组织、存储起来,并针对用户的需要查找所需信息的过程。因此信 息检索包含了信息的存储和检索两个不可分的部分。我们通常所说 的信息检索是指狭义的信息检索,即从检索工具和检索系统中查找 所需信息的过程及其所采取的一系列方法和策略。
3.1.2 文献信息检索的类型
按检索手段
手工检索
机械检索
依靠手工操作来完成检索过程, 所用文献一般是以纸张为载体。
主要是指利用计算机进行文献信 息检索,也称作计算机信息检索, 所用的文献多以非纸张为载体,
手工检索和计算机检索的关系:手检是基础,机检是发展方向。
3.1.2 文献信息检索的类型
按检索要求划分:
是以文献信息上标明的、显而易见的外部特征, 如题名、著者等作为文献标识和检索的依据。
描述文献内部特 它包括分类语言和主题词语言。对内容特征语言 征的检索语言 的研究,是信息检索语言的主题与核心。
分类语言
检索语言
概 念
是指以数字、字母或数字与字母结合作为基本字 符,以基本类目为基本词汇,以类目的从属关系
描述文献外部特 征的检索语言
概念
用分类号表达各种概念并按学科性质进行分类和 系统排列
以主题词作为文献主题概念的标识作用
指描述文献主题概念的标识在检索之前就已 经事先固定好了的标识系统.如体系分类语言、 标题词语言
指描述文献的标识在检索之前未固定组配,而是 在检索时根据检索的实际需要,按照组配规则临 时进行组配的标识系统。如叙词语言。
索
语
语法是指如何创造和运用标识来
言
语法
准确表达信息内容特征,以有效 实现信息检索的一整套规则。
检索语言
检索语言须具备三个基本要素: 1. 有一套专用字符来构建词汇; 2. 有一定数量的基本词汇用来表达基本概念; 3. 有一套专用语法规则,用严格的句法手段和词法对词汇 进行控制,以准确表达各种各样的概念。
文 献 信 息
文
分
献 信
析
息 特
征
文
标 引
检 索
形 成
献输 信 息入
语
标
言
识
文 献 信 息
检
匹 配索
和
输
检 索 课 题
文 献 分信 析息
检 索 课 题
选 用
信
息
名
检
检
称 规 范
形 成
索 提 问 标
输 入
索 系
识
统
出结 果
检索语言
在信息检索工作中,检索语言亦称情报检索语 言,在存储和检索过程中,检索语言起着重要 的作用。它把信息的内容特征和外表特征简明 而有效的揭示出来,并保证了文献存储的集中 化和系统化,使有规律的检索成为可能;沟通 检索人员和标引人员的思想,引导检索人员和 标引人员理解一致,避免检索的漏误。具体而 言:它能够保证不同标引人员表达文献的一致 性,保证不同检索人员检索提问的一致性,保 证检索提问与文献标引的一致性。
主题语言
检索语言
是一种描述概念性语言,它用语词直接表达文献的主题, 这些语词就是表达主题概念的标识。将这些作标识的语 词按字顺序排列并使用参照系统来间接表达各种概念之 间的关系,这就是主题语言。
的是以二次文献为对象(目录、索引、文摘)的信息,他们是文献信息的外部特 征与内容特征的描述集合体,信息用户通过检索,获取的是原文的“替代物”。 用户通过检索获得的是与检索课题有关的一系列文献线索,然后再通过阅读决定 取舍。
全文检索:是以文献所含的全部信息作为检索内容的文献检索,即检索 系统提供的是整篇文章或整部图书的全部内容,检索时可以查找到原文以 及有关的句、段、接、章等文字,并可进行各种频率统计和内容分析。全 文检索主要是用自然语言表达检索课题。较适用于某些参考价值大的典据 性文献。全文检索是当前计算机检索的发展方向之一。
来表达概念间相互关系的一类检索语言。
分类原理:分类是对知识概念的划分。分类语言是用分类号来表达学科体 系的各种概念,将各种知识要领按学科性质进行分类和系统排列。即以学 科分类为基础,按照概念划分的原理,将知识分门别类地按一定的逻辑次 序,从总到分,从具体到一般,从简单到复杂、进行层层划分,层层隶属, 形成一个严格有序、层次分明的知识门类体系,以便从知识分类的角度按 学科、分专业地集中信息,揭示各类信息在内容上的联系与区别,提供从 学科分类角度检索信息的途径。
检索语言的定义:检索语言是从自然语言精选出来的 一整套词汇、符号,用以对文献内容和信息特征进行 概括和规范。它是文献的标引系统,也是读者检索使 用的一种符号系统,是检索工具和参考工具书的重要 组成部分。
检索语言
词汇
词汇是指收录在类表和词表中的 所有标识,如分类号、检索词、 代码等,是可识别词汇。
检