信息检索 第二讲 信息检索概述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.信息检索语言的类型
按表达文献 主题概念的 词语形式
分类语言 主题语言(标题词、单元词、 叙词、关键词)
检索语言 书名、刊名、篇名等 著者名称
按表达文献 外部特征的 词语形式
号码(如报告号、专利号、文献序号) 文献类型
42
(1)分类语言

分类语言是用分类号和相应分类款目来表达各
种概念,以学科体系为基础,将各种概念按学
科性质进行分类和系统排列 。

特点:能集中体现学科的系统性,反映事物的
从属、源生关系,便于按学科门类进行族姓检
索。
(1)分类语言

按照分类方式的不同:
混合分类语言 体系分类语言 分类语言
体系分类法是基于概念
的划分和概括,以学科 分类为基础,把概括文
献内容与事物的各种类
目组成一层层隶属、详 细列举的等级结构体系。
的巨大进步,使你能够在一张单
碟上存储25GB的文档文件。这
东芝和NEC联合推出 HD-DVD
是现有(单碟)DVDs的5倍。
手工检索与计算机检索区别
手工检索特点:
计算机检索特点: 检索效率高、响应 速度快,但是成本 和检索费用高。
它使用方便、成本
低廉,但检索效率 和响应时间均较差。
22
二、信息检索的途径与程序
检索。
3.信息检索的类型

(2)根据检索实现手段不同,信息检索可以分为:
手工检索
计算机检索
人工检索与计算机检索
手工检索系统:
以印刷型检索工具为基础 的检索系统,它可以直接
计算机检索系统:
利用计算机和一定的通信 设备查找所需信息的检索 方式;包括:硬件部分、 软件部分、信息数据库。
进行利用,不需要依赖任
信息检索与分析
1
第二讲 信息检索概述

一、信息检索的概念、原理、类型 二、信息检索的途径和程序 三、信息检索语言 四、信息检索技术
2
一、信息检索的概念、原理、类型

1.信息检索的概念
2.信息检索的原理
3.信息检索的类型
1.信息检索的概念

信息检索是指利用一定的检索算法,借助于
存储是获取的前提和基础,没有存储就没有获取,而获取是存储的目的。
5
Baidu Nhomakorabea
2.信息检索的原理
苏新宁.信息检索理论与技术.北京:科技技术文献出版社,2004 :3
信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进
行异同的比较和匹配,选取两者相符或部分相符的信息予以输出。
3.信息检索的类型

(1)根据检索对象不同,信息检索可以分为:
式目录、卡片检索机、缩微胶卷检索机。
美国斯坦福大学公开蒋介石早年日记
缩微胶片和手稿
计算机检索系统

单机检索(计算机、光盘等) 网络检索(联机、www)
蓝 光 ( Blu - ray ) 或 称 蓝 光 盘
(Blu-ray Disc,缩写为BD)利
用波长较短(405nm)的蓝色激 光读取和写入数据,并因此而得 名。目前为止,蓝光是最先进的 大容量光碟格式,BD激光技术
信息检索包含信息存储 与信息获取两个过程。
从狭义的角度讲:
信息检索是广义信息检索 的后一过程,即信息获取
的过程。
信息存储:通过对大量无序信息的选择和收集、著录和标引等方法,建成各 种各样的信息检索工具或信息检索系统,使之成为有序化信息的过程。 信息获取:获取是存储的逆过程,其实质是根据特定要求,运用已组织好的 检索系统,将特定信息查找出来。

《中图法》即《中国图书馆图书分类法》,这部分类法
设有5个基本部类(马列主义、毛思、邓论A;哲学B;社
会科学CDEFGHIJK;自然科学NOPQRSTUVX;综合类图书Z)
和22个基本大类。
A.中图法简介

该分类法采用字母与数字相结合的混合号码构成,用字
母表示22个以及工业技术中的二级类目,其他各级类目
特定的检索工具,并针对用户的检索需求,
从结构化或非结构化的数据中获取有用信息
的过程。(苏新宁.信息检索理论与技术.北京:科
技技术文献出版社,2004 )

信息检索是从一个信息集合中找出与用户需
求相关的信息。(刘挺等.信息检索系统导论.北
京:机械工业出版社,2008)
1.信息检索的概念
从广义的角度讲:
3.信息检索的类型

数据检索。以数据为检索对象,可直接选择专 类的数据性工具,从中查检,从而得到数值性 数据、图表、化学结构式、计算公式等等,它 们都是经过人们精心测试、绘制、评价、处理 而得出来的确切数据。
例如: 查找喜马拉雅山有多高;
3.信息检索的类型

事实检索。是以特定的事实为检索对象,通过
CALIS公共目录检索系统检索界面
读秀知识库检索界面
三、信息检索语言

1.检索语言的概念
2.信息检索语言的功能与作用
3.信息检索语言的类型
1.信息检索语言的概念

信息检索语言是一种专门的人工语言,又 称标引语言和索引语言,是信息系统中用 以描述信息的内容及外表特征和检索者表 达检索提问的语言,是两者相互沟通的共 同依据,是用于信息标引和检索提问的约 定语言。
经济类
——主要检索工具
4)检索该教授指导的研究生论文的主要工具
(1)CNKI《中国优秀博硕士学位论文全文数据库》 (2)万方《中国学位论文全文数据库》
5)检索报纸论文的主要工具
CNKI《中国重要报纸全文数据库》
国家图书馆检索结果
http://opac.nlc.gov.cn/F/B2LYQVUJH7V1LX1Q879MVTBI6FSA3XR8 QTFMLLTCE1I6DSNA8G-84640?func=file&file_name=login-session
1.信息检索语言的概念

标引人员可以用检索语言来标引文献,以便将 文献进行整理,加工,存储于检索系统中;同 时,检索人员也可以用检索语言来表达信息检
索课题的内容,以便把特定文献从检索系统中
检索出来。因此,检索语言是一种把文献的存
储与检索联系起来,把标引人员和检索人员沟
通起来的人工语言。
2.信息检索语言的功能与作用
均用数字表示,每三位数字后用分隔符号“ ·”以示醒
目。分类号排列的时候先按照字母顺序进行排序,字母 相同按照字母后的数字一位一位地进行比较来排序。
示例:《中图法》
社 会 科 学
自 然 科 学
48
(一级)
(二级)
(三级)
(四级)
F0政治经济学 F1世界各国经济概况 F2经济机化与管理 F3农业经济 F经济 F4工业经济 F5交通运输经济 F71贸易经济理论方法 F72中国贸易经济 F6邮电经济 F73各国贸易经济 F7贸易经济 F74国际贸易 F8财政经济 F75各国对外贸易 F761一般性著作 F76商品学 F762农产品 F763医疗用品 F764重工业产品 F765建筑器材 体系分类法中的经济类示意图 F766交通运输器材 F767化学工业产品 F768轻工业产品
课题分析
该检索课题可以通过检索给定人名的期
刊论文、图书书目、会议论文、硕博士学位
论文等来解决。关于查找几位也在关注该教
授研究领域的人员信息的问题,则可以通过
引文类数据库来解决。因为只是初步了解,
检索中文信息即可。主要采用“作者”的检
索途径。
经济类——主要检索工具
1)检索该教授的基本情况和研究领域的主要工具

通过分析信息存储和检索的全过程可以看出检索语言
大致有以下四个主要的功能:

对文献的情报信息内容及其外表特征加以规范化的标引;
对内容相同及相关的文献信息加以集中或揭示其相关性;
可使文献信息的存储集中化、系统化、组织化,便于检
索者按一定的排列秩序进行有序化检索;

便于将标引用语和检索用语进行相符性比较。
选择检索工具
确定检索途径和检索方法
实施信息检索

获取原始文献
3.检索案例分析
某校学生欲报考西南财经大学副校长卓志 教授的博士研究生,现在需初步了解该教授 的研究领域、论文发表和专著出版情况、曾 经指导的研究生学位论文的情况等,以便作 好充分的准备。同时,还想找到几位国内也 在关注该教授研究领域的人员的信息。
文献检索
事实检索
数据检索
7
3.信息检索的类型

文献检索。以文献或其索引、文摘为检索对象, 目的是核实已知文献的不确切项目,如著者名、 年代、出处等,或查检某课题原始文献的线索 及它们的具有收藏情况。

文献检索是相关性检索,不直接回答用户所提 技术问题本身,只提供有关的文献供参考。
举例: “关于自动控制系统有些什么参考文献”
可通过其机构网站进行检索,也可通过搜索引擎进行搜索。
2)检索期刊论文的主要工具
(1)CNKI《中国期刊全文数据库》(1979-) (2)重庆维普《中文科技期刊数据库》(1989-) 通过检索其发表论文的情况,可以大致判断出其研究领域。
3)检索图书书目的主要工具
(1)中国国家图书馆网站(http://www.nlc.gov.cn/) (2)CALIS公共目录检索系统(http://opac.calis.edu.cn) (3)读秀知识库(http://duxiudsr.com) (4)馆藏书目(指各单位的馆藏书目查询系统) (5)其他电子图书和网上书店
检索途径可以分为:
(1)文献外部特征的检索途径

(2)文献内容特征的检索途径。
(1)文献外部特征的检索途径

责任者途径。即通常所说的著者姓名途径。责任者是指对
文献内容负责或作出主要贡献的个人或团体,包括著者名、 评者、编者等。

题名途径。也称书名途径。题名是表达、象征、隐喻文献 内容及特征的词或短语,是文献的标题或名称,包括书名、 刊名、篇名等。

分类主题途径。是分类途径与主题途径的结合。 其它途径。主要是指一些辅助检索途径,如按化学分子
式排出的“子式索引”。
安徽图书馆书目查询
http://211.86.245.190:81/default.aspx
南京大学图书馆书目检索系统
当当网的图书分类
2.信息检索的程序

分析检索课题,明确提问要求
49
中图法分类简表
(http://www.lib.sjtu.edu.cn/view.do?id=516)
A B C D E F G H I J K 马克思主义、列宁主义、毛泽东思想、邓小平理论 哲学、宗教 F 经济 社会科学总论 F0 经济学 F1 世界各国经济概况、经济史、经济地理 政治、法律 F2 经济计划与管理 军事 F3 农业经济 经济 F4 工业经济 F49 信息产业经济(总论) 文化、科学、教育、体育 F5 交通运输经济 语言、文字 F59 旅游经济 文学 F6 邮电经济 艺术 F7 贸易经济 F8 财政、金融 历史、地理
对存储的文献中已有的基本事实,或对数据进
行处理(逻辑推理)后得出信息的(即未直接
存入或所藏文献中没有的)事实过程。
如:本学期成绩优秀的学生有多少?某同类产品中,哪种 牌号的销量最大?
三者关系:

事实和数据检索是要检索出包含在文献中的具
体情报;

文献检索则是要检索出包含所需要情报的文献;
文献检索时最典型和最重要也是最常用的情报

1.信息检索的途径
2.信息检索的程序
3.检索案例分析
1.信息检索的途径

检索途径依赖于信息的特征。如文献具有两种特 征:外部特征和内容特征。文献的外部特征主要 是指文献载体上 标明、易见的项目,有文献题名、
责任者、序号、出版者、出版地、出版年等;文
献的内容特征有所属学科及所属主题等。



文献类型途径。文献信息检索工具收选的信息源多种多样,
如期刊、图书、科技报告、专利、技术标准、政府出版物、
会议录等。
(2)文献内容特征的检索途径

分类途径。是指按文献内容的学科分类体系查找文献信
息的途径。分类目录和分类索引是普遍使用的分类检索
工具。

主题途径。主题是文献所表达的中心思想、所讨论的基 本问题和研究对象。主要检索工具是主题目录和主题索 引,或标题词索引、关键词索引、叙词索引等。
何计算机或其他设备。
手工检索系统


A.书本式的手工检索系统
B.卡片式的手工检索系统
直接查检法
书本式 手工检索系统
间接检索法
追溯法
14
A.书本式的手工检索系统

直接查检法。指不依靠检索工具,而通过浏览或查阅原
始文献直接获取文献信息的方法。

间接检索法。即借助于检索工具获取所需文献的方法,
一般包括顺查法、倒查法和抽查法。

追溯法:也称为文献追踪法。此法不是利用确定的检索 工具,而是利用已知文献的某种指引,如文献附的参考 文献、有关注释、辅助索引、附录等,追踪查找文献。

综合法:是以上各种检索方法的综合使用。
书本式检索工具
书本式检索工具(续)
《四库全书》
《 永 乐 大 典 》
B.卡片式的检索系统

以卡片形式出现的检索系统。如图书馆的卡片
组配分类语言
如《杜威十进制分类
法》、《美国国会图书 馆分类法》、《中国图
书馆分类法》等
(1)分类语言

按照分类方式的不同:
混合分类语言 组配分类语言 分类语言
组配分类法是将一个复
杂的文献主题概念用若 干个表达简单概念的标
识来表达。
如《冒号分类法》、
《布里斯书目分类法》 等
体系分类语言
A.中图法简介
相关文档
最新文档