第2章--信息检索PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
经济
文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
S
T U V X Z
农业科学
工业技术 交通运输 航空、航天 环境科学、安全科学 综合性图书
《中国图书馆分类法》
中国图书馆分类法分类表共分22个大类,再分17个 二级目录,医药卫生属于R大类。 《中图法》采用汉语拼音字母和阿拉伯数字组成的 混合制号码作类目标识,用一个字母标记一个基本
的问题;
另一方面是特定原始文献的查找,即在查找特定
的文献线索后,找出原始文献的过程。
第一节 信息检索基础
一、信息检索概念
(二)信息检索的意义和作用 信息检索 有助于知识更新 ,有助于同学们扩大视野 ,了解和把握有关学科中出现的新思想、新观点与 新知识。掌握信息检索技术是快速、准确地获取和 利用最新信息的有效途径。 信息检索有助于科学研究,了解和把握有关学科的 起源和发展过程。 有助于独立自主地解决自己在学习、生活和工作中 所遇到的疑难问题。 是接受终身教育的必要手段。 节省时间,提高效率。
第二节 信息检索语言
二、检索语言的种类
(一)分类检索语言 分类检索语言又称分类法,是用分类号(字母、数 字或它们的组合)来表达各种概念的,并将各种概 念按学科性质进行分类和系统排列的信息检索语言。 它以树状结构的形式,按知识门类的逻辑次序反映事物 的从属、派生关系,构成具有上位类和下位类隶属、同 位类并列的概念等级体系。 能较好体现概念的族性关系,从学科专业的角度检索资 料,比较方便,扩大、缩小检索范围方便。
(一)按信息检索的对象划分
数据信息检索 利用数据库、工具书等以数值或数据为对象的检 索,也称为数值检索。检索包含分子式、分子量 、公式 、图表等特定数据的信息。
事实信息检索
是指利用百科全书等检索工具从存储事实的信息 系统中查找出特定事实的检索。查找某一事件发 生的时间、地点、过程,如谁首次报道SARS疫 情。以机构、企业、任务、历史等为对象。 是指利用目录、索引或文摘等检索工具查找文献 线索和根据这些线索查找原始文献。以文献为检 索对象,并不解答用户提出的问题,只提供相关 文献的线索或全文。
(一)分类检索语言
《中国图书馆图书分类法》 五大部,二十二个大类
分类号
A B C D E
内容
分类号
内容
自然科学总论 数理科学和化学 天文学、地球科学 生物科学 医药、卫生
马克思主义、列宁主义、毛泽东思想、邓 N 小平理论 哲学、宗教 社会科学总论 政治、法律 军事 O P Q R
F
G H I J K
信息检索:是指将信息 (主要指文献信息)按一定 的方式组织和存储起来,并 根据用户的需要找出相关信
息的过程。 存储
信息检索 检索
存储:是对信息进行著录、 检索:是指面向信息需求 标引、整序,编制检索工 而进行高度选择性的查找 具和建立检索系统的过程。 过程。
信息检索包括两方面的内容
一方面是信息线索的查找,即如何利用检索工具
第一节 信息检索基础
三、信息检索的类型
(二)按信息检索的组织方式划分
即将存储在数据库中的整本书、 整篇文章中的任意内容信息查找 出来的检索。包括文字和图像.
多媒体(文本、图像、声音) 信息检索是指能够检出支持 两种以上媒体的数据库检索。
全文文本信息检索
多媒体信息检索
超文本信息检索 超文本信息检索是对每个 节点中所存的信息以及信息链 构成的网络信息的检索。浏览 式检索,可跨库检索。
第一节 信息检索基础
三、信息检索的类型
(四)按信息检索的途径划分 按信息检索 的途径划分
直接检索
就是从信息源或 信息载体中直接 获取信息的方法 。
间接检索
就是通过检索工 具的指引间接获 取所需信息的方 法。
第一节 信息检索基础
[点滴积累]
信息检索就是从数据库、检索工具以及馆藏中查 找所需信息的活动。它包括信息的存贮和检索两 个方面。 信息检索的基本原理就是检索者将检索提问的标 识与存贮在检索工具中的信息特征标识进行对比 ,找出符合两者特征一致的信息。 根据检索对象的不同、检索组织方式的不同、检 索手段的不同和检索途径的不同,信息检索可检索语言
一、检索语言的定义与作用
(一)检索语言的定义 检索语言是文献信息的加工、存储和检索的共同制 的专门语言,是表达一系列概括文献信息内容和检 需要而编索课题内容的概念及其相互关系的一种概 念标识系统。 是用来描述信息源特征和进行检索的人工语言。 按检索语词规范化程序划分:规范化语言(例如,用 词表来规范)和非规范化语言(自然语言)两类。 按所描述的文献信息的特征划分:文献外表特征检索 语言和文献内部特征检索语言。
网络信息资源检索 是一种集各种新型技术于一 体,对各种类型、各种媒体的信 息进行跨时间、跨空间的检索。
第一节 信息检索基础
三、信息检索的类型
(三)按信息检索的手段划分
按信息检索的 手段划分
手工检索
简称手检,是人工处 理和查找文献信息的 检索方式。即利用目 录、索引、文摘、题 录等手工检索工具查 找和获取所需信息的 方法。
信息 存储 收集 选择 著录 加工 标引 加工 存储 标识
存储与检 索系统进 行匹配
检索 语言
信息 检索 分析 需求 检索 提高 提供 标识
输出
检索 标识
信息检索原理示意图
信息的检索过程
用户利用检索工具获取所需信息的过程。
用户在分析待检内容范围的基础上,将检索需求
转换成检索提问标识,利用相应的检索系统,查
出所需信息。
本课程目的就是学习如何才能提高检索效率。
信息检索一般过程
信息源 信息分析、 著录、标引
用户
检索语言 数据库
用户需求分析
信息的表示
检索表达式
匹配过程
输出检索结果
信息检索的过程往往需要一个评价反馈途径,多次比较匹 配,以获得最终的检索结果。其图示如下:
第一节 信息检索基础
三、信息检索的类型
一、信息检索概念
(一)信息检索的含义 信息检索(Information Retrieval )又称情报检索 ,是指信息按一定的方式组织和存储起来,并根据信息 用户的需要找出有关信息的过程和技术。 广义的信息检索包括“信息存储与检索”两部分; 狭义的信息检索仅指信息查询过程,即借助于检索 工具,从信息资源的集合中迅速、准确地查找出所需信 息的过程和方法。 信息检索的目的就是使用户的查询能够从大量的信 息中找到满意的相关结果。
第二节 信息检索语言
二、检索语言的种类
[知识链接] 典型的分类法 目前,分类法种类很多,国际上比较有影响的有 :《美国国会图书馆图书分类法》、《国际专利分类 法》和《杜威十进分类法》。我国图书情报界广泛采 用的是《中国图书馆图书分类法》和《中国科学院图 书馆图书分类法》。
第二节 信息检索语言
(一)分类检索语言 《中国图书馆图书分类法》 (简称《中图法》)是我国文献分类标引工作的国家推 荐标准,被我国图书信息行业广泛应用,它是一部综合 性的分类法。 始编于1971年,到目前已出版至第五版。 体系分类法:由五大基本部类、二十二个基本大类、简 表、详表及复分表五个部分组成。 每个大类采用拉丁字母和阿拉伯数字相结合的混合号码 ,并以层累制(等级制)为标记制度。
信息(information)
是物质存在的一种方式,一般指数据、消息中
所包 含的意义。
普遍性、差异性、特征性 可传递性、可存储性
医学文献信息的作用
记录、保存、传递医学信息 科研和临床实践借鉴、交流的重要载体 评价科研水平与成果的主要依据 推动促进科研发展的资源动力
第一节 信息检索基础
R54 心脏、血管(循环系)疾病
R57 消化系及腹部疾病 R571 食管疾病
R575 肝及胆疾病
R575.2 肝硬变 R6 外科学
(一)分类检索语言
类目级别划分
(一)分类检索语言
类目级别划分
第二节 信息检索语言
(一)分类检索语言 [难点释疑] 由于分类体系的系统性和聚类特点,可方便地进行 扩检或缩检,在查找某一学科或专业文献时,利用类系 层层隶属、外延渐小的原理,满足不同查全和查准的要 求;利用类列外延相斥、同位详列的特性,进行相关查 询。即类以求,触类旁通是分类检索的显著特征。
大类,在字母后用数字表示大类的下位类划分。号
码的位数一般能反映相应类目的分类等级。如:R5 、 R55、R551 用于书刊排架和数据库标引、检索。目前我国95% 以上的图书馆都采用这种分类法。
(一)分类检索语言
《中图法》的结构
R 医药卫生
“类” R5 内科学 R51 传染病
“类名”
“类目” “上位类” “下位类” “同位类”
文献信息检索
第一节 信息检索基础
检索的主要类型列举: 数据检索 锑的原子量是多少?(121.75) 事实检索 中国辛亥革命是哪年?(1911) 文献检索 图书馆有关于“医学心理学”的书吗?
哪里可以找到?
关于“食品安全法规” 有哪些文献报道?
第一节 信息检索基础
三、信息检索的类型
[知识链接]文献检索与数据检索、事实检索的关系 文献信息检索是一种相关性的检索,检索的结 果是文献线索;数据与事实信息检索是一种确定性 检索,检索的结果是可供用户直接利用的信息。通 常,文献信息检索通过二次信息资源来实现,而数 据与事实信息检索则是通过三次信息资源来完成。
计算机检索
简称机检,指人们在 计算机或计算机检索 网络的终端机上,使 用特定的检索指令、 检索词和检索策略, 从计算机检索系统的 数据库中检索出需要 的信息。
手工检索与计算机检索的特点
手工检索
优点:经济、灵活、判别直观、查准率高
缺点:速度慢、效率低、漏检严重、不便于复杂概念的课题
计算机检索
优点:方便、快捷、功能强大、获得信息类型多、检索范 围广。 缺点:回溯文献少、对读者要求高、检索技术难。
信息检索
存储过程—建立数据库
机械匹配
检索过程—利用数据库
检索原理-机械匹配举例
作者为“张平”写的文章
• 手工检索:得到只有张平写的文章
• 计算机检索:得到张平才、张平安、沈张平等作者
写的文章或包含“一张平片”的文章
机械匹配举例
艾滋病-爱滋病-获得性免疫缺陷综合症-Aids 钠泵-钠钾泵、Na+-K+ -ATPase、 Na+,K+ -ATPase 、Na+,K+ -ATP酶、Na, K- ATP酶、Na(+)K(+)交换 ATP酶等
文献检索特殊意义
一是确定有无类似的研究成果,是否要立项?
二是参考其他文献,理清思路,搞清楚要做的研
究是什么?
三是取长补短,推陈出新,设立新论题,取得新
成果。
文献检索在课程设计、毕业设计、开题立项、成
果查新方面都具有重要作用。
第一节 信息检索基础
二、信息检索原理
信息检索系统由文献的存储和检索两个部分组成。
第二节 信息检索语言
按所描述的文献信息的特征划分:
第二节 信息检索语言
(二)检索语言的作用 沟通信息存储与信息检索两个过程的桥梁 标引文献信息内容及其外表特征,保证不同标引人员表征 文献的一致性。 对内容相同及相关的文献信息加以集中或揭示其相关性。 使文献信息的存储集中化、系统化、组织化,便于检索者 按照一定的排列次序进行有序化检索。 便于将标引用语和检索用语进行相符性比较,保证不同检 索人员表述相同文献内容的一致性,以及检索人员与标引 人员对相同文献内容表述的一致性 保证检索者按不同需要检索文献时,都能获得最高查全率 和查准率。
LOGO
第二章 信息检索
掌握信息检索的概念;
掌握信息检索的原理; 了解信息检索的类型,以及信息检索类型的几种 划分方法; 掌握检索语言的种类,及检索语言的作用; 掌握信息检索的方法、途径与步骤。
第一节 信息检索基础 一、信息检索概念
二、信息检索原理 三、信息检索的类型 第二节 信息检索语言 一、检索语言的定义和作用 二、检索语言的种类 第三节 信息检索的方法、途径与步骤 一、信息检索方法 二、信息检索途径 三、信息检索步骤与策略 四、检索效果的评价
人的特征
特征1 特征2 特征3 特征4 特征5
提取特 征
特征n
文献的特征
文献的外部特征:
与文献主题内容没有关系或关系不大的信息称为文献的外
部特征,包括作者、作者工作单位,发表时间、专利号、 报告号等。
文献的内容(主题)特征
与文献主题内容密切相关的信息称为文献的内容特征。文 献信息内容特征主要有各种形式的主题词和分类号。