第二章信息检索技术与策略
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如:中国图书馆分类法 美国国会图书馆分类法 杜威十进位分类法
三、信息检索语言
中国图书馆分类法的体系结构:
部类(5个): 马克思主义、列宁主义、毛泽东思想 哲学 社会科学 自然科学 综合性图书
三、信息检索语言
中国图书馆分类法的体系结构:
大类(一级类目) 22 个
三、信息检索语言
中国图书馆分类法的体系结构:
三、信息检索的类型和方法
1. 信息检索的类型
按
文献检索
检
数据检索
索
事实检索
内
全文检索
容 划 分
图像检索 超文本检索
三、信息检索的类型和方法
文献检索
使用以二次文献为存储对象的信息系统,如目录型、题录 型、文摘型数据库,是一种相关性检索。特点:检索结果不直 接解答课题用户提出的技术问题,只提供与之相关的线索。
信息内容特征的描述较为复杂,必须借助于特定 的信息检索语言。
三、信息检索语言
信息检索语言是根据信息组织和信息检索的需要 而创制的人工语言,又称信息组织语言、情报语言、 标引语言、索引语言等。
三、信息检索语言
1. 分类检索语言
分类检索语言是用分类号和类名来表达各种概念, 将各种概念按学科门类的逻辑次序或事物的性质进行 分类和系统排列。
存储 检索
存检储索::是是对指信面息向进信行息著需录求、 标而引进、行整高序度,选编择制性检的索查工找 具过和程建。立检索系统的过程。
二、信息检索的概念和原理
原始文献 加工整理
数据库 存储
提问 检索 输出 检索
二、信息检索的概念和原理
信息检索原理 检索提问标识与存储标引标识进行比较,两者一
致或信息标引的标识包含着检索提问标识,则具有该 标识的信息就从检索系统输出,输出的信息就是检索 命中的信息。
三、信息检索的类型和方法
事实检索
检索系统中存储的是从原始文献中抽取的各种事实,用户 通过检索可获得有关事物、事件的发生与发展情况及相关资料, 它也是一种确定性检索。一般利用字词典、年鉴、百科全书、 手册等为检索工具。
例如:禽流感最早出现于哪个国家 检索工具:兽医手册
三、信息检索的类型和方法
全文检索
S农业科学类目简表
三、信息检索语言
2.主题检索语言
主题检索语言是用语词作为概念标识,按字顺排列,并用参 照系统等方法间接显示概念间相互关系的一种信息检索语言,也 称主题法系统。
◆ 标题词语言(Heading) 受《词表》控制 ◆ 元词(单元词)语言 (Uniterm) 受《词表》控制 ◆ 叙词语言( Descriptor ) 受《词表》控制 ◆ 关键词语言(Keyword) 不受《词表》控制
四、信息存储
2.数据库记录的格式
“记录”是文献信息数据库的基本组成单位。 每一条记录是由三种类型的字段组成:检索系统存取 号、基本索引字段和辅助索引字段。
四、信息存储 2.数据库记录的格式
第二节 信息检索概述
一、信息检索的发展历程及进展 二、信息检索的概念与原理 三、信息检索的类型和方法 四、信息检索工具
分类号 主题词
关键词
信息外部特征的描述
期刊论文: 文献题目、著者、著 者工作单位、文献的 出处(刊名、刊号、 卷期、起止页码)、 语种、参考文献及图 表的数量等。
图书: 书名、著者(或编 者、译者)、出版 项(出版社、地点、 时间)稽核项(价 格、页数、参考文 献)、书号等。
信息内容特征的描述
信息内容特征描述:是指在对信息内容进行分析 的基础上,根据一定的规则对信息的内容予以揭示, 并赋予标识的过程。
一、信息检索的发展历程及进展
(一)手工检索阶段 (二)机械检索阶段 (三)计算机检索阶段
1. 脱机批处理检索 2. 联机检索 3. 光盘检索 4. 网络检索
二、信息检索的概念和原理
信息检索:是指将信息 (主要指文献信息)按一定 的方式组织和存储起来,并 根据用户的需要找出相关信 息的过程。
信息检索
四、信息存储
1. 数据库及其构成
数据库(database):至少由一种文档组成,并 能满足某一特定目的或某一特定数据处理系统需要的 一种数据集合。 通俗地说,数据库就是在计算机存储 设备上,按一定方式存储的相互关联的数据集合,是 信息检索的基础。
四、信息存储
1.ቤተ መጻሕፍቲ ባይዱ数据库及其构成
一条信息记录(record)是由若干个字段 (Field)所组成,字段是构成记录的基础;信息记 录的集合就形成文档,一个数据库可以包含有一个文 档,也可以含有若干个文档。
例如:查找有关“食品安全与人类健康 ”方面的国内外 信息有哪些?
三、信息检索的类型和方法
数据检索
以数值信息为检索对象,通过检索,用户可以获得所需 要的确切数据,是一种确定性检索。它一般以数据大全、手 册、年鉴等为检索工具。
例如:2013年申请中国发明专利和获得授权发明专利最 多的国家有哪些?
检索工具:中国统计年鉴
二、信息描述
信息描述是指根据一定的规则和技术标准,对信息的外 部特征、物质形态和内容特征进行全面描述并给予记录的过 程。
一条信息之所以有别于其他信息,主要是它与其他信息 在外表和内容两方面的特征都有所不同。
二、信息描述
信息名称
外部特
信息来源
信 息
征描述
信息加工者 类型及表现形式
描
述
内容特 征描述
第二章 信息检索技术与策略
第一节 信息存储的基本知识 第二节 信息检索概述 第三节 现代信息检索策略 第四节 检索效果评价
第一节 信息存储的基本知识
信息存储是指利用一定的科学规则和方法,通 过对信息的特征进行分析、表征和提炼,并按给定 的参数和序列公式排列、存储在相应载体上,组织 成系统化的具有检索功能的系统过程。
第一节 信息存储的基本知识
一、信息筛选 二、信息描述 三、信息检索语言 四、信息存储
一、信息筛选
信息筛选是指对原始信息有无作用的挑选和鉴别,是建立信息 资源检索系统的基础和保障。 信息筛选原则:针对性、系统性、预见性、科学性、计划性和 及时性。 信息筛选方法:直观判断、分析、集体讨论、专家裁决、数学 核算、现场核实等方法。
从存储有大量原始文献全文的数据库中检索全文或某一 章节,属相关性检索的范畴。特点:是在书目信息检索基础 上更深层次的内容检索。
例如:检索由陈代文等撰写的“动物营养与免疫研究进 展 ”一文的全文
检索工具:中文科技期刊数据库等
三、信息检索语言
中国图书馆分类法的体系结构:
部类(5个): 马克思主义、列宁主义、毛泽东思想 哲学 社会科学 自然科学 综合性图书
三、信息检索语言
中国图书馆分类法的体系结构:
大类(一级类目) 22 个
三、信息检索语言
中国图书馆分类法的体系结构:
三、信息检索的类型和方法
1. 信息检索的类型
按
文献检索
检
数据检索
索
事实检索
内
全文检索
容 划 分
图像检索 超文本检索
三、信息检索的类型和方法
文献检索
使用以二次文献为存储对象的信息系统,如目录型、题录 型、文摘型数据库,是一种相关性检索。特点:检索结果不直 接解答课题用户提出的技术问题,只提供与之相关的线索。
信息内容特征的描述较为复杂,必须借助于特定 的信息检索语言。
三、信息检索语言
信息检索语言是根据信息组织和信息检索的需要 而创制的人工语言,又称信息组织语言、情报语言、 标引语言、索引语言等。
三、信息检索语言
1. 分类检索语言
分类检索语言是用分类号和类名来表达各种概念, 将各种概念按学科门类的逻辑次序或事物的性质进行 分类和系统排列。
存储 检索
存检储索::是是对指信面息向进信行息著需录求、 标而引进、行整高序度,选编择制性检的索查工找 具过和程建。立检索系统的过程。
二、信息检索的概念和原理
原始文献 加工整理
数据库 存储
提问 检索 输出 检索
二、信息检索的概念和原理
信息检索原理 检索提问标识与存储标引标识进行比较,两者一
致或信息标引的标识包含着检索提问标识,则具有该 标识的信息就从检索系统输出,输出的信息就是检索 命中的信息。
三、信息检索的类型和方法
事实检索
检索系统中存储的是从原始文献中抽取的各种事实,用户 通过检索可获得有关事物、事件的发生与发展情况及相关资料, 它也是一种确定性检索。一般利用字词典、年鉴、百科全书、 手册等为检索工具。
例如:禽流感最早出现于哪个国家 检索工具:兽医手册
三、信息检索的类型和方法
全文检索
S农业科学类目简表
三、信息检索语言
2.主题检索语言
主题检索语言是用语词作为概念标识,按字顺排列,并用参 照系统等方法间接显示概念间相互关系的一种信息检索语言,也 称主题法系统。
◆ 标题词语言(Heading) 受《词表》控制 ◆ 元词(单元词)语言 (Uniterm) 受《词表》控制 ◆ 叙词语言( Descriptor ) 受《词表》控制 ◆ 关键词语言(Keyword) 不受《词表》控制
四、信息存储
2.数据库记录的格式
“记录”是文献信息数据库的基本组成单位。 每一条记录是由三种类型的字段组成:检索系统存取 号、基本索引字段和辅助索引字段。
四、信息存储 2.数据库记录的格式
第二节 信息检索概述
一、信息检索的发展历程及进展 二、信息检索的概念与原理 三、信息检索的类型和方法 四、信息检索工具
分类号 主题词
关键词
信息外部特征的描述
期刊论文: 文献题目、著者、著 者工作单位、文献的 出处(刊名、刊号、 卷期、起止页码)、 语种、参考文献及图 表的数量等。
图书: 书名、著者(或编 者、译者)、出版 项(出版社、地点、 时间)稽核项(价 格、页数、参考文 献)、书号等。
信息内容特征的描述
信息内容特征描述:是指在对信息内容进行分析 的基础上,根据一定的规则对信息的内容予以揭示, 并赋予标识的过程。
一、信息检索的发展历程及进展
(一)手工检索阶段 (二)机械检索阶段 (三)计算机检索阶段
1. 脱机批处理检索 2. 联机检索 3. 光盘检索 4. 网络检索
二、信息检索的概念和原理
信息检索:是指将信息 (主要指文献信息)按一定 的方式组织和存储起来,并 根据用户的需要找出相关信 息的过程。
信息检索
四、信息存储
1. 数据库及其构成
数据库(database):至少由一种文档组成,并 能满足某一特定目的或某一特定数据处理系统需要的 一种数据集合。 通俗地说,数据库就是在计算机存储 设备上,按一定方式存储的相互关联的数据集合,是 信息检索的基础。
四、信息存储
1.ቤተ መጻሕፍቲ ባይዱ数据库及其构成
一条信息记录(record)是由若干个字段 (Field)所组成,字段是构成记录的基础;信息记 录的集合就形成文档,一个数据库可以包含有一个文 档,也可以含有若干个文档。
例如:查找有关“食品安全与人类健康 ”方面的国内外 信息有哪些?
三、信息检索的类型和方法
数据检索
以数值信息为检索对象,通过检索,用户可以获得所需 要的确切数据,是一种确定性检索。它一般以数据大全、手 册、年鉴等为检索工具。
例如:2013年申请中国发明专利和获得授权发明专利最 多的国家有哪些?
检索工具:中国统计年鉴
二、信息描述
信息描述是指根据一定的规则和技术标准,对信息的外 部特征、物质形态和内容特征进行全面描述并给予记录的过 程。
一条信息之所以有别于其他信息,主要是它与其他信息 在外表和内容两方面的特征都有所不同。
二、信息描述
信息名称
外部特
信息来源
信 息
征描述
信息加工者 类型及表现形式
描
述
内容特 征描述
第二章 信息检索技术与策略
第一节 信息存储的基本知识 第二节 信息检索概述 第三节 现代信息检索策略 第四节 检索效果评价
第一节 信息存储的基本知识
信息存储是指利用一定的科学规则和方法,通 过对信息的特征进行分析、表征和提炼,并按给定 的参数和序列公式排列、存储在相应载体上,组织 成系统化的具有检索功能的系统过程。
第一节 信息存储的基本知识
一、信息筛选 二、信息描述 三、信息检索语言 四、信息存储
一、信息筛选
信息筛选是指对原始信息有无作用的挑选和鉴别,是建立信息 资源检索系统的基础和保障。 信息筛选原则:针对性、系统性、预见性、科学性、计划性和 及时性。 信息筛选方法:直观判断、分析、集体讨论、专家裁决、数学 核算、现场核实等方法。
从存储有大量原始文献全文的数据库中检索全文或某一 章节,属相关性检索的范畴。特点:是在书目信息检索基础 上更深层次的内容检索。
例如:检索由陈代文等撰写的“动物营养与免疫研究进 展 ”一文的全文
检索工具:中文科技期刊数据库等