信息检索的基本方法和基本技术

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3、按使用不同的工具和手段划分
(1)手工检索 是指人们通过手工的方式来存储和 检索信息,其使用的检索工具主要是书本式、卡片式 的信息系统,如目录、索引、文摘等。
(2)计算机检索 是指人们在计算机检索网络或终 端上,使用特定的检索指令、检索词和检索策略,从 计算机检索系统的数据库中检索出所需要的信息的过 程,其检索是在人机的协同作用下完成的。
(3)明确信息检索课题对查新、查准 和查全的指标要求。
2、选择信息检索工具
选择恰当的检索工具,是成功实施检
索的关键。选择检索工具一定要根据待查 项目的内容、性质来确定。
选择的检索工具要注意其所报道的学 科专业范围、所包括的语种及其所收录的 文献类型等。
在选择中,要以专业性检索工具为主 ,再通过综合型检索工具相配合。
3、确定信息检索途径和标识
一般来说,每种信息检索工具都为检索者提供多条检索 途径,归纳起来主要有分类途径、主题途径、题名途径等。 (1)分类检索途径。是按文献所属的学科类别来检索文献的 途径。主要运用于检索课题要求的是泛指性较强的文献信息。 (2)主题检索途径。是从文献的主题概念出发,按确定的主 题词来检索文献的一种途径。 (3)题名检索途径。是根据文献名称来检索文献的途径。文 献题名主要指书名、刊名、篇名等。 (4)著者检索途径。是通过已知著者(个人著者、团体著者 )的名称来检索文献的途径。 (5)号码检索途径。是通过已知号码(专利号、标准号、报 告号)来检索文献的途径。 (6)其它检索途径。在检索某些学科或专业的文献时,有一 些特殊的检索途径。如美国《化学文摘》中有分子式索引,从 分子式入手来查找有关文献。
(一)检索工具的特点
丰富的文献记录。检索工具收录的文献信息量大,学科知识全面、系统,专 业性强。 必要的检索标识。检索工具能提供各种检索标识,如学科分类号、主题词、 著者名称、汉语拼音等。 多途经的检索手段。检索工具能提供多样化的检索途径和检索方法,如分类 索引、主题索引、著者索引和专门索引等。
(二)检索工具的基本类型
三、信息检索方法和途径
(一)信息检索的方法
所谓信息检索的方法,即查找文献信息的方法。信息检索的方法
往往与文献信息检索的课题、性质和所检索的文献类型有关。归纳起来一般 有以下几种。
如图所示:
顺查法
直接法
倒查法 抽查法
检索方法
追溯法
综合法
1、直接法
直接法又称为工具法或常用法,是直接利用文献信 息检索工具来查找文献的方法。其常用方法分为顺查法 、倒查法和抽查法。
(3) 事实信息检索 是指以特定的事实作为检索对象的
一种信息检索。其检索结果是基本事实。如某个人或某个组织 的基本情况,某一件事发生的时间、地点、过程等。
文献、事实、数据检索关系图
2、 按信息组织方式划分
(1) 全文检索 是指检索系统中存储的是整篇文章或整本书。 检索时,用户可以根据自己的需要从中获取有关的文章、段、 句、节等信息,还可以进行各种频率统计和内容分析。
1、按检索手段,可分为手工检索工具、机械检索工具 和计算机检索工具。
2、按出版形式,可分为印刷型、缩微型和电子型。
3、按著录方式,可分为目录型、题录型(索引型)文 摘型和索引型。
4、按收录范围,可分为综合性检索工具、专科性检索 工具。
5、按其载体形式,可分为书本式工具书、卡片检索工
具、机读型检索工具及缩微型检索工具。
《中图法》由编制说明、类目表、标记符号、说明和注释、索 引五个部分组成。
类目表是整个《中图法》的主体,是类分图书的依据。它由5 个基本部类、22个基本大类、简表、详表和复分表五个部分组成。
如下表所示:
一、马克思主义、列宁主义、毛泽东思想
............A 马克思主义、列宁主义、毛泽东思想 二、哲学.................. B 哲学 三、社会科学...............C 社会科学总论
“中图法”的类目配号采用汉语拼音和阿拉伯数字相结合的混 合号码制,即一个字母标识表示一个大类,以字母的顺序反映大 类的序列,在字母后用数字表示大类下的类目划分。如 I247.57
为适应“工业技术”领域中的图书文献分类的需要,对其下一 级类目的复分,也采用了字母标志,即工业技术(T)类下细分 了16个二级类目(采用双字母标识)。
T 工业技术
TB 一般工业技术
TL 原子能技术
TD 矿业工程
TM 电工技术
TE 石油、天然气工业 TN 无线电电子学、电讯技术
TF 冶金工业
TP 自动化技术、计算机
TG 金属学、金属工艺 TQ 化学工业
TH 机械、仪表
TS 轻工业、手工业
TJ 武器工业
TU 建筑科学
TK 动力工程
TV 水利工程
(2)主题语言
3、综合法 综合法又称为分段法或交替法,是顺查
法、倒查法、抽查法与追溯法交替使用的 一种方法。这种方法既利用检索工具检索 文献,又利用文献后边的参考文献进行追 溯,两种方法交替使用,直到结果满意为 止。
(二)信息检索的途径
1、分类途径 2、主题途径 3、著者途径 4、其它途径
四、信息检索的程序
第三节 现代信息检索语言、工具及 检索工具的编排结构
一、信息检索语言 1、信息检索语言概念:应文献信息的加工、存储和检索的共
同需要而编制的专门语言,是表达一系列概括文献信息内容和 检索课题内容的概念及其相互关系的一种概念标识系统。分为 规范化语言和非规范化语言(自然语言)两类。
2、信息检索语言主要作用:(略)
根据出版类型在图书馆或情报机构查找馆藏 目录或联合目录确定馆藏。原则上说,应该 按“由近及远”的顺序逐步扩大查找馆藏目录 或联合目录确定馆藏;也尽可能多渠道、多 方式地获取原文,如利用与国外图书馆的馆 际互借,大型国际联机信息检索系统的联机 订购,Internet上的电子邮件和下载服务, 或者与出版商直接联系等。
信息检索一般可按照下面程序来进行检索。如 图所示:
Fra Baidu bibliotek
分析研究 检索课题
选择 检索工具
确定检索 途径和标识
确定 检索方法
索取 原始文献
掌握获取 原文的线索
检索并调整 检索策略
构建检索 表达式
1、分析研究信息检索课题 (1)明确信息检索课题所涉及的学科 范围。 (2)明确所需信息的类型,包括文献 媒体、出版类型、所需文献量、年代范 围、涉及的语种、有关著者、机构等。
(2)表达文献内容特征的检索语言——分类语言、主题 语言、代码语言三大类型。
文献的外表特征与文献是一一对应的,而文献的内容特 征与文献却是一种模糊的对应关系。
二、信息检索工具
检索工具是指用于报道、存储和查找文献信息资源线索的工具和设备的总 称,是以一次文献为基础,在广泛收集并经过严格筛选后,对其进行描述、 标引或汇集,充分揭示其物质外部特征和内容特征,并按一定的规则组织而 成的。
(1)顺查法 是以研究课题所要求的起始年代为起点,由远及近
,利用信息检索工具逐年进行查找的信息检索方法。检索的时间跨 度一般规定为10年,检索范围要根据研究课题的具体情况而定。这 种方法的特点是文献的查全率高,但费时、工作量大。
(2)倒查法 与顺查法相反,是由近及远逐年进行查找的信息检
索方法。这种方法检索效率较高,省时省力,但查全率相对来说不 如顺查法。
D 政治 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 四、自然科学.............N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、宇宙飞行 X 环境科学 五、综合性图书...................Z 综合性图书
(2) 超文本检索 是指信息在系统中的组织方式不同而言的。 从组织结构上看,超文本的基本组织元素是节点和节点间的逻 辑联接链。与传统文本的线性顺序不同,超文本检索强调中心 节点之间的语义联接结构。其检索模式是“哪里”到“什么”。
(3) 超媒体检索 是对超文本检索的补充。其存储对象超出了 文本范畴,融入了静、动态图像(形)以及声音等多种媒体信 息。信息的存储结构从单维发展到多维,存储空间范围在不断 扩大。
《中图法》分类法简介
《中国图书馆分类法》(简称《中图法》)是我国图书情报部门 通行的分类方法,也是许多国内检索刊物用以组织文献的主要分类 法。这个分类法1971年由北京图书馆、中国科技情报所等单位编 制的。目前使用的是第四版。
“中图法”的体系结构是以科学分类为基础,结合图书文献的 特点进行划分,遵循从总到分,从一般到具体,从理论到应用,从 简单到复杂,全表共划分为五大部类,往下展开成22个大类。在每 一大类下再层层展开为二级、三级、四级……类目,形成一个等级 列举式的分类体系。在“中图法”这样层层细分的分类体系中,处 于被区分的类称为上位类,相应地说,区分出来的类就是下位类。 “中图法”总共设置了53811个类目。
6、检索并调整检索策略
通过检索表达式对检出的检索结果进行分析,分析 检索结果是否与检索要求一致,不时要修改检索词和 检索表达式,直到得到满意的结果。
7、掌握获取原文的线索 在获取信息线索时要仔细阅读,
判断所检出的信息是否符合检索的要 求,不仅看篇名,还要阅读整个著录 格式,进行综合分析。
8、索取原始文献 索取原始文献是信息检索的最后一步,
如:《中图法》正表之一项为: TP24 机器人技术
机器人工程学入此。机器人语言入TP31
图书馆分类法简介
图书分类法是在一定的哲学思想指导下, 运用知识分类的原理,结合图书的特点,采 用逻辑方法编制出来的对图书文献进行分类 的体系分类表。
图书分类法是图书分类的依据,是组织藏 书的工具。
目前我国图书情报单位常用的分类法主要 有《中国图书馆分类法》(简称《中图法》 )、《中国科学院图书馆图书分类法》、( 简称《科图法》)及《中国人民大学图书馆 图书分类法》(简称《人大法》)等。
第二章 信息检索的基本方法和基本技术
第一节 现代信息检索的概念与类型
一、信息检索概念
信息检索(广义):是从任何信息集合中识别 和获取所需信息的过程及其所采取的一系列 方法和策略。它包括存储与检索两个方面。
信息检索(狭义):即从检索工具和检索系统 中查找出所需信息的过程。
二、 现代信息检索的类型
1、 按存储和检索内容划分
是以自然语言的字符为字符,以名词术语为基本词 汇,用一组名词术语作为检索标识的一类检索检索语言 。
分为标题词、元词、叙词和关键词。
(3) 代码语言
是指对事物的某方面特征,用某种代码系统来表 示和排列事物概念,从而提供检索的检索语言。如化学 分子式。
按照表达文献的特征划分:
(1)表达文献外部特征的检索语言——题名、责任者、 文献编号等。
(1) 文献信息检索 即查找出用户所需文献线索或原文
的检索。其检索结果是文献信息。如查找某一研究课题一定年
限内的有关文献,或对一项发明创造进行文献查新等。
(2) 数据信息检索 是指查找出用户所需特定数据、公
式或图表形式的检索。其检索结果是数据信息。如查找某一数 据、公式、图表、价格,某种物质的化学分子式,某种设备的 型号与参数等。数据检索是一种确定性检索。
(3)抽查法 这是一种针对研究课题发展的特点,抓住学科发
展迅速、发表文献较多的年代进行查找的方法。此种方法花费时间 较少,却能获得较多文献,但使用抽查法要求检索者必须熟悉学科 的发展情况,熟悉学科文献较为集中的时间范围,以便正确地选择 抽查的时间跨度。
2、追溯法
追溯法又称回溯法,是利用文献末尾所 附的参考文献线索,进行追溯查找的方法, 这是一种传统的获取文献信息的方法,是在 没有检索工具或检索工具不全的情况下使用 的一种方法,这种方法查找的文献不全。
3、信息检索语言的类型
按照标识的性质与原理划分:
(1)分类语言——是以数字、字母(即分类号)或 字母与数字结合作为基本字符,采用字符直接连接 并以圆点(或其他符号)作为分隔符的书写法,以 基本类目作为基本词汇,以类目的从属关系来表达 复杂概念的一类检索语言。
分类表基本结构:正表、附表、说明、索引组成 。其中正表是主要部分,它由类号、类名、注释三 部分组成。
4、确定信息检索方法 检索方法的选择可根据课题性质、
检索的对象、检索的范围和实际可能 ,确定某个具体课题的检索方法,如 采用直接法、追溯法、综合法等。
5、构建检索表达式
检索表达式是计算机检索中用来表达用户提问的逻 辑表达式,由检索词和各种布尔逻辑算符、位置算符 、截词符以及系统规定的其他组配连接符号组成,是 检索策略的具体体现。
相关文档
最新文档