信息检索的基本办法和基本技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如:《中图法》正表之一项为: TP24 机器人技术
机器人工程学入此。机器人语言入TP31
图书馆分类法简介
图书分类法是在一定的哲学思想指导下, 运用知识分类的原理,结合图书的特点,采 用逻辑方法编制出来的对图书文献进行分类 的体系分类表。
图书分类法是图书分类的依据,是组织藏 书的工具。
目前我国图书情报单位常用的分类法主要 有《中国图书馆分类法》(简称《中图法》 )、《中国科学院图书馆图书分类法》、( 简称《科图法》)及《中国人民大学图书馆 图书分类法》(简称《人大法》)等。
T 工业技术
TBБайду номын сангаас一般工业技术
TL 原子能技术
TD 矿业工程
TM 电工技术
TE 石油、天然气工业 TN 无线电电子学、电讯技术
TF 冶金工业
TP 自动化技术、计算机
TG 金属学、金属工艺 TQ 化学工业
TH 机械、仪表
TS 轻工业、手工业
TJ 武器工业
TU 建筑科学
TK 动力工程
TV 水利工程
(2)主题语言
D 政治 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 四、自然科学.............N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、宇宙飞行 X 环境科学 五、综合性图书...................Z 综合性图书
《中图法》由编制说明、类目表、标记符号、说明和注释、索 引五个部分组成。
类目表是整个《中图法》的主体,是类分图书的依据。它由5 个基本部类、22个基本大类、简表、详表和复分表五个部分组成。
如下表所示:
一、马克思主义、列宁主义、毛泽东思想
............A 马克思主义、列宁主义、毛泽东思想 二、哲学.................. B 哲学 三、社会科学...............C 社会科学总论
“中图法”的类目配号采用汉语拼音和阿拉伯数字相结合的混 合号码制,即一个字母标识表示一个大类,以字母的顺序反映大 类的序列,在字母后用数字表示大类下的类目划分。如 I247.57
为适应“工业技术”领域中的图书文献分类的需要,对其下一 级类目的复分,也采用了字母标志,即工业技术(T)类下细分 了16个二级类目(采用双字母标识)。
(1) 文献信息检索 即查找出用户所需文献线索或原文
的检索。其检索结果是文献信息。如查找某一研究课题一定年
限内的有关文献,或对一项发明创造进行文献查新等。
(2) 数据信息检索 是指查找出用户所需特定数据、公
式或图表形式的检索。其检索结果是数据信息。如查找某一数 据、公式、图表、价格,某种物质的化学分子式,某种设备的 型号与参数等。数据检索是一种确定性检索。
第二章 信息检索的基本方法和基本技术
第一节 现代信息检索的概念与类型
一、信息检索概念
信息检索(广义):是从任何信息集合中识别 和获取所需信息的过程及其所采取的一系列 方法和策略。它包括存储与检索两个方面。
信息检索(狭义):即从检索工具和检索系统 中查找出所需信息的过程。
二、 现代信息检索的类型
1、 按存储和检索内容划分
第三节 现代信息检索语言、工具及 检索工具的编排结构
一、信息检索语言 1、信息检索语言概念:应文献信息的加工、存储和检索的共
同需要而编制的专门语言,是表达一系列概括文献信息内容和 检索课题内容的概念及其相互关系的一种概念标识系统。分为 规范化语言和非规范化语言(自然语言)两类。
2、信息检索语言主要作用:(略)
3、信息检索语言的类型
按照标识的性质与原理划分:
(1)分类语言——是以数字、字母(即分类号)或 字母与数字结合作为基本字符,采用字符直接连接 并以圆点(或其他符号)作为分隔符的书写法,以 基本类目作为基本词汇,以类目的从属关系来表达 复杂概念的一类检索语言。
分类表基本结构:正表、附表、说明、索引组成 。其中正表是主要部分,它由类号、类名、注释三 部分组成。
(2) 超文本检索 是指信息在系统中的组织方式不同而言的。 从组织结构上看,超文本的基本组织元素是节点和节点间的逻 辑联接链。与传统文本的线性顺序不同,超文本检索强调中心 节点之间的语义联接结构。其检索模式是“哪里”到“什么”。
(3) 超媒体检索 是对超文本检索的补充。其存储对象超出了 文本范畴,融入了静、动态图像(形)以及声音等多种媒体信 息。信息的存储结构从单维发展到多维,存储空间范围在不断 扩大。
《中图法》分类法简介
《中国图书馆分类法》(简称《中图法》)是我国图书情报部门 通行的分类方法,也是许多国内检索刊物用以组织文献的主要分类 法。这个分类法1971年由北京图书馆、中国科技情报所等单位编 制的。目前使用的是第四版。
“中图法”的体系结构是以科学分类为基础,结合图书文献的 特点进行划分,遵循从总到分,从一般到具体,从理论到应用,从 简单到复杂,全表共划分为五大部类,往下展开成22个大类。在每 一大类下再层层展开为二级、三级、四级……类目,形成一个等级 列举式的分类体系。在“中图法”这样层层细分的分类体系中,处 于被区分的类称为上位类,相应地说,区分出来的类就是下位类。 “中图法”总共设置了53811个类目。
3、按使用不同的工具和手段划分
(1)手工检索 是指人们通过手工的方式来存储和 检索信息,其使用的检索工具主要是书本式、卡片式 的信息系统,如目录、索引、文摘等。
(2)计算机检索 是指人们在计算机检索网络或终 端上,使用特定的检索指令、检索词和检索策略,从 计算机检索系统的数据库中检索出所需要的信息的过 程,其检索是在人机的协同作用下完成的。
(3) 事实信息检索 是指以特定的事实作为检索对象的
一种信息检索。其检索结果是基本事实。如某个人或某个组织 的基本情况,某一件事发生的时间、地点、过程等。
文献、事实、数据检索关系图
2、 按信息组织方式划分
(1) 全文检索 是指检索系统中存储的是整篇文章或整本书。 检索时,用户可以根据自己的需要从中获取有关的文章、段、 句、节等信息,还可以进行各种频率统计和内容分析。
机器人工程学入此。机器人语言入TP31
图书馆分类法简介
图书分类法是在一定的哲学思想指导下, 运用知识分类的原理,结合图书的特点,采 用逻辑方法编制出来的对图书文献进行分类 的体系分类表。
图书分类法是图书分类的依据,是组织藏 书的工具。
目前我国图书情报单位常用的分类法主要 有《中国图书馆分类法》(简称《中图法》 )、《中国科学院图书馆图书分类法》、( 简称《科图法》)及《中国人民大学图书馆 图书分类法》(简称《人大法》)等。
T 工业技术
TBБайду номын сангаас一般工业技术
TL 原子能技术
TD 矿业工程
TM 电工技术
TE 石油、天然气工业 TN 无线电电子学、电讯技术
TF 冶金工业
TP 自动化技术、计算机
TG 金属学、金属工艺 TQ 化学工业
TH 机械、仪表
TS 轻工业、手工业
TJ 武器工业
TU 建筑科学
TK 动力工程
TV 水利工程
(2)主题语言
D 政治 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 四、自然科学.............N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、宇宙飞行 X 环境科学 五、综合性图书...................Z 综合性图书
《中图法》由编制说明、类目表、标记符号、说明和注释、索 引五个部分组成。
类目表是整个《中图法》的主体,是类分图书的依据。它由5 个基本部类、22个基本大类、简表、详表和复分表五个部分组成。
如下表所示:
一、马克思主义、列宁主义、毛泽东思想
............A 马克思主义、列宁主义、毛泽东思想 二、哲学.................. B 哲学 三、社会科学...............C 社会科学总论
“中图法”的类目配号采用汉语拼音和阿拉伯数字相结合的混 合号码制,即一个字母标识表示一个大类,以字母的顺序反映大 类的序列,在字母后用数字表示大类下的类目划分。如 I247.57
为适应“工业技术”领域中的图书文献分类的需要,对其下一 级类目的复分,也采用了字母标志,即工业技术(T)类下细分 了16个二级类目(采用双字母标识)。
(1) 文献信息检索 即查找出用户所需文献线索或原文
的检索。其检索结果是文献信息。如查找某一研究课题一定年
限内的有关文献,或对一项发明创造进行文献查新等。
(2) 数据信息检索 是指查找出用户所需特定数据、公
式或图表形式的检索。其检索结果是数据信息。如查找某一数 据、公式、图表、价格,某种物质的化学分子式,某种设备的 型号与参数等。数据检索是一种确定性检索。
第二章 信息检索的基本方法和基本技术
第一节 现代信息检索的概念与类型
一、信息检索概念
信息检索(广义):是从任何信息集合中识别 和获取所需信息的过程及其所采取的一系列 方法和策略。它包括存储与检索两个方面。
信息检索(狭义):即从检索工具和检索系统 中查找出所需信息的过程。
二、 现代信息检索的类型
1、 按存储和检索内容划分
第三节 现代信息检索语言、工具及 检索工具的编排结构
一、信息检索语言 1、信息检索语言概念:应文献信息的加工、存储和检索的共
同需要而编制的专门语言,是表达一系列概括文献信息内容和 检索课题内容的概念及其相互关系的一种概念标识系统。分为 规范化语言和非规范化语言(自然语言)两类。
2、信息检索语言主要作用:(略)
3、信息检索语言的类型
按照标识的性质与原理划分:
(1)分类语言——是以数字、字母(即分类号)或 字母与数字结合作为基本字符,采用字符直接连接 并以圆点(或其他符号)作为分隔符的书写法,以 基本类目作为基本词汇,以类目的从属关系来表达 复杂概念的一类检索语言。
分类表基本结构:正表、附表、说明、索引组成 。其中正表是主要部分,它由类号、类名、注释三 部分组成。
(2) 超文本检索 是指信息在系统中的组织方式不同而言的。 从组织结构上看,超文本的基本组织元素是节点和节点间的逻 辑联接链。与传统文本的线性顺序不同,超文本检索强调中心 节点之间的语义联接结构。其检索模式是“哪里”到“什么”。
(3) 超媒体检索 是对超文本检索的补充。其存储对象超出了 文本范畴,融入了静、动态图像(形)以及声音等多种媒体信 息。信息的存储结构从单维发展到多维,存储空间范围在不断 扩大。
《中图法》分类法简介
《中国图书馆分类法》(简称《中图法》)是我国图书情报部门 通行的分类方法,也是许多国内检索刊物用以组织文献的主要分类 法。这个分类法1971年由北京图书馆、中国科技情报所等单位编 制的。目前使用的是第四版。
“中图法”的体系结构是以科学分类为基础,结合图书文献的 特点进行划分,遵循从总到分,从一般到具体,从理论到应用,从 简单到复杂,全表共划分为五大部类,往下展开成22个大类。在每 一大类下再层层展开为二级、三级、四级……类目,形成一个等级 列举式的分类体系。在“中图法”这样层层细分的分类体系中,处 于被区分的类称为上位类,相应地说,区分出来的类就是下位类。 “中图法”总共设置了53811个类目。
3、按使用不同的工具和手段划分
(1)手工检索 是指人们通过手工的方式来存储和 检索信息,其使用的检索工具主要是书本式、卡片式 的信息系统,如目录、索引、文摘等。
(2)计算机检索 是指人们在计算机检索网络或终 端上,使用特定的检索指令、检索词和检索策略,从 计算机检索系统的数据库中检索出所需要的信息的过 程,其检索是在人机的协同作用下完成的。
(3) 事实信息检索 是指以特定的事实作为检索对象的
一种信息检索。其检索结果是基本事实。如某个人或某个组织 的基本情况,某一件事发生的时间、地点、过程等。
文献、事实、数据检索关系图
2、 按信息组织方式划分
(1) 全文检索 是指检索系统中存储的是整篇文章或整本书。 检索时,用户可以根据自己的需要从中获取有关的文章、段、 句、节等信息,还可以进行各种频率统计和内容分析。