第2章信息检索原理与技术[1]
第二章 信息检索原理及技术
• ②词族表 computer applications .administrative data processing ..distributive data processing .computerized signal processing ..computerized pattern recognition ..computerized picture processing ...computer-generated holography
3、检索途径 、
• 检索途径又称检索入口,指信息用户在检索时,把所需信息的某 种特征标识转换为检索标识,以此为入口进行检索
信息内部特征 检索途径 题名途径 著者途径 机构途径 代码/序号途径 信息源类型途径 其它途径 分类途径 主题途径 关键词途径
信息外部特征
信息检索途径及其选择
内容特征检索途径
作用: 、保证不同标引人员表征文献信息的一致性。 作用:1)、保证不同标引人员表征文献信息的一致性。 2)、使内容相同及相关的文献集中化。 、使内容相同及相关的文献集中化。 3)、保证检索提问与文献信息标引的一致性。 、保证检索提问与文献信息标引的一致性。 4)、保证检索者按不同需求检索文献信息时, 、保证检索者按不同需求检索文献信息时, 都能获得最高的查全率和查准率。 都能获得最高的查全率和查准率。
※
纯自然语言
指完全使用自然语言,即对一条完整的信息中任何词汇都可以进行检索。 指完全使用自然语言,即对一条完整的信息中任何词汇都可以进行检索。 它采用全文匹配法检索,主要运用于计算机全文数据库和网络信息检索中。 它采用全文匹配法检索,主要运用于计算机全文数据库和网络信息检索中。 使用纯自然语言中检索中最大的问题是误检率极高。 使用纯自然语言中检索中最大的问题是误检率极高。
第2章--信息检索PPT课件
经济
文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
S
T U V X Z
农业科学
工业技术 交通运输 航空、航天 环境科学、安全科学 综合性图书
《中国图书馆分类法》
中国图书馆分类法分类表共分22个大类,再分17个 二级目录,医药卫生属于R大类。 《中图法》采用汉语拼音字母和阿拉伯数字组成的 混合制号码作类目标识,用一个字母标记一个基本
的问题;
另一方面是特定原始文献的查找,即在查找特定
的文献线索后,找出原始文献的过程。
第一节 信息检索基础
一、信息检索概念
(二)信息检索的意义和作用 信息检索 有助于知识更新 ,有助于同学们扩大视野 ,了解和把握有关学科中出现的新思想、新观点与 新知识。掌握信息检索技术是快速、准确地获取和 利用最新信息的有效途径。 信息检索有助于科学研究,了解和把握有关学科的 起源和发展过程。 有助于独立自主地解决自己在学习、生活和工作中 所遇到的疑难问题。 是接受终身教育的必要手段。 节省时间,提高效率。
第二节 信息检索语言
二、检索语言的种类
(一)分类检索语言 分类检索语言又称分类法,是用分类号(字母、数 字或它们的组合)来表达各种概念的,并将各种概 念按学科性质进行分类和系统排列的信息检索语言。 它以树状结构的形式,按知识门类的逻辑次序反映事物 的从属、派生关系,构成具有上位类和下位类隶属、同 位类并列的概念等级体系。 能较好体现概念的族性关系,从学科专业的角度检索资 料,比较方便,扩大、缩小检索范围方便。
(一)按信息检索的对象划分
数据信息检索 利用数据库、工具书等以数值或数据为对象的检 索,也称为数值检索。检索包含分子式、分子量 、公式 、图表等特定数据的信息。
信息检索原理与技术
专利分类法
《国际专利分类表》 《国际专利分类表》(International Classification of Patent for Invention, 简称Int.Cl或IPC) 1968年9月1日在国际 范围生效,以后每5年修订一次。 《IPC》按照技术主题来设立类目 表。首先将与发明专利有关的全部技术 领域划分为八个部,部号分别用大写英 文字母A到H来表示。各部(Section) 按等级形式再细分为大类(Class)、 小类(Subclass)、主组 (Maingroup)、分组(Subgroup), 形成五级分类的结构形式。 《IPC》由9个分册组成,1~8分 册分别对应八个部,第9分册是 《使用指南》。在《IPC》中, 八个部分别是: A:生活必需 B:作业运输 C:化学与冶金 D:纺织与造纸 E:固定建筑物 F:机械工程; G:物理 H:电学
关键词:对表征文献主题内容具有实质意义的或对揭示文 献内容来说是重要的、关键性的、只做少量规范化处理或 不做规范化处理的自然词语。
1 例如:课题是“经济体制改革有关资料(1998-1999)”, 如何确定检索标识? 主题词:国企改革、所有制改革、国有资产管理与制度 改革、金融改革、社会保障改革、劳动就业改革等。 2 例如:检索“图书馆虚拟参考咨询服务”方面的文献,如 何提取关键词? 关键词:虚拟参考咨询服务、图书馆服务、参考咨询服务等
1.2 信息检索的类型
计算机检索
光盘检索
用光盘作为信息存储介质的数据库。
分为单机检索和局域网内的联机光盘检索。
1.2 信息检索的类型
计算机检索
网络信息检索
用户在自己的客户端上,通过互联网和浏览器界面对网络信 息进行检索。 特点 数据库分布式存储,数量多,信息量大;由于超文本 语传输协议,提供了大量相关链接; 内容向多媒体发展,不仅有文本,还有图像、声音等; 数据库更新速度快; 检索功能强,索引多,易学易懂;但目前各数据库检索 界面和检索技巧不尽相同,给使用者造成不必要的麻烦; 检索环境宽松,检索费用比联机检索低很多。 (网络信息检索也包括通过网络进行的数据库检索)
信息检索的基本原理与方法
它要求检索系统不仅能够从数据 (事实) 集合中查出原来存入的数据或事实,还能够从已有的
基本数据或事实中推导、演绎出新的数据或事实。
例如,该系统中存储有如下事实:①李明是A校的学生。②A 校的学生都学外语。如果该系统
(3)、光电检索:即把检索标识变成黑白点矩阵或条形码,存储在缩微胶片 (卷)上,利用光电效应, 通过检索机械进行查找。
(4)、计算机检索:即把情报及其检索标识转换成电子计算机可以 阅读的二进制编码,存储在磁性载体上,由计算机根据程序进 行查找与输出。根据检索者同计算机进行的不同通信方式,计 算机检索又可以分为脱机检索、联机检索及多机网络化检索等。
信息检索的意义和作用主要是能有效提高人们检索信息和利 用信息的效率。对大学生来说,文献信息检索是培养学生能 力的基本技能和方法之一,最主要的是自学能力、研究能力、 思维能力、表达能力和组织管理能力的培养,是科学研究不 可缺少的一项工作。
具体地说信息检索有下面三个方面的作用:
(1).信息检索是获取知识的捷径
检索标识是信息存储时,对信息内容进行分析提出能代表信息内容实 质的主题词、分类号或其它符号,硅藻土、通用塑料、工程塑料、特种 塑料等、聚氯乙烯、聚乙烯、聚丙烯、聚酰胺、聚酰亚胺、聚酯、玻璃 钢等都是检索标识。
检索时,将提问特征与检索标识进行对比匹配,若达到一致或部分一 致,即为所需信息。
2、信息检索的起源
(3).信息检索是终身教育的基础
学校培养学生的目标是学生的智能:包括自学能力、研究能力、思维能
力、表达能力和组织管理能力。
联合国教文组织提出,教育已扩大到一个人的整个一生,认为唯有全面
清华大学-信息检索-第2章
28
2.3 检索系统与检索方法
2.3.2 检索方法 1. 常用法
常用法是利用检索工具查找信息的一种方法, 因为这种方法是目前查找信息中最常使用的,故亦 称常用法。 (1) 顺查法 (2) 倒查法 (3) 抽查法
29
2.3 检索系统与检索方法
(1) 顺查法
是指按年代由远及近的顺序进行查找的方法, 如检索“电视文化”这一课题,首先要弄清起始时 间,即“电视文化”产生的时间是哪一年,然后从 这一年开始查起,一直查到当前“电视文化”方面 的相关信息为止和查准率都较高,但是检 索整个课题较费时费力。
1) 手工检索 手工检索简称“手检”,是指人们通过手工 的方式检索信息,其使用的检索工具主要是书本 型、卡片式的信息系统,即目录、索引、文摘和 各类工具书。检索过程是由人工以手工的方式完 成的。 2) 计算机检索 计算机检索简称“机捡”,是指人们利用数 据库、计算机软件技术、计算机网络及通信系统 进行的信息检索,其检索过程是在人机的协同作 用下完成的。
11
2.1 信息检索概念及类型
3) 数据型信息检索
数据型信息检索是一种确定性检索,是以 数值或图表形式表示的数据为检索对象的信息检 索,又称“数值检索”。检索系统中存储的是大 量的数据,这些数据既包括物质的各种参数、电 话号码、银行账号、观测数据、统计数据等数字 数据,也包括图表、图谱、市场行情、化学分子 式、物质的各种特性等非数字数据。
22
2.2 检索途径与检索语言
(2)主题语言 主题“是一组具有共性事物的总称,用以表达 文献所论述和研究的具体对象和问题”,即文献的 “中心内容”。每种文献都包含着若干主题,研究 或阐述一个或多个问题。主题词就是表达主题概念 的词汇。
23
文献检索,信息检索(2)第二章 信息检索原理
数据库
检索提问
匹配过程
输出检索结果
二、信息检索的类型
按检索内容划分 1、文献检索
是以文献为检索对象的信息检索。
2、数据检索
是以数据为检索内容的信息检索,要求
从检索系统存储的大量原实检索
是以具体事项为检索内容的信息检索, 要求从检索系统存储的各种原始信息资源中查出专门的 事实材料。
三、检索工具的结构
(一)计算机检索工具结构 1、检索软件 (二)手工检索工具结构
1、使用说明(凡例)
2、目次表 3、正文 4、辅助索引 5、附录
2、数据库
(1)字段 (2)记录
(3)文档(顺排、倒排)
(4)帮助文件
工具书的类型
类型 概念 内容 举例 提供可资参考的知 根据特定的社会需要, 识 内 容 , 如 数 据 、 字典、词典、百科 广泛汇释一定范围内 史实、观点、结论、 全书、类书、政书、 比较成熟的知识,按 定 义 、 公 式 、 分 子 年鉴、手册、名录、 一定的规则编排组织 式 、 人 物 简 介 等 数 表谱、图录等 的工具书。 据和事实信息。 又称线索性工具书 提供查找文献线索 书目、索引、文摘
分类途径 信息内部特征 检索途径 信息外部特征 主题途径 关键词途径 题名途径 著者途径 其它途径
一、根据信息内容特征的检索途径 二、根据信息外部特征的检索途径
第四节
检索工具
检索工具:是在不同学科范围内对 一、检索工具的功能 某阶段出版的有关文献进行收集、整理 二、检索工具的类型 或对新文献加以及时报道的二次文献。
一、检索算符 逻辑与
(一)布尔逻辑算符
布尔逻辑组配运算是采用布尔代数中的 逻辑“与”逻辑“或”、逻辑“非”等算符,
课件讲稿 第二章 信息检索原理与检索技术
• 1. 如何提高信息素质,谈谈你的的学习方 法或途径。 • 2. 浏览我校图书馆网站,说出图书馆都收 藏有哪些类型的文献资源(信息源)? (列出3种以上) • 3.请用图示的方法说明布尔逻辑检索概念 之间的逻辑关系。 • 4. 信息检索步骤主要有哪些? • 5. 列举自己感兴趣的3个课题,其中1个与 所学专业有关。
容词均不能做关键词。(禁用词表)
38
关键词法一般不编关键词表,而是相反, 编制“非关键词表”或称“禁用词表”,如: • a
• in • an • is
as
of at on be or
but
that by this for to
from
was had which have with
he
you her & his
27
• 以文献的内容特征为检索途径:
分类途径:课题的学科属性,学科分类体系 利用学科分类表、分类目录、分类索引 若课题所需信息范围较广,应选用分类途径,这样 可以比较准确地检索到与课题相关领域的资料。
主题途径:按主题内容进行检索的途径, 它冲破了按学科分类的束缚,使分散在各个学科领 域里的有关同一课题的信息集中于同一主题,当课 题所需信息范围窄而具体时,以主题途径检索为宜。
22
文献的著录
题名:书名、刊名、会议名 作者 号码:书号ISBN、ISSN、 标准号、专利号 出版:出版社、出版时间、地点 分类号 主题词
外部特征
内容特征
23
24
信息检索途径
•责任者途径 •题名途径 •代码途径
•引文途径
•出版情况(出版时间、出版社) •分类途径
•主题词途径
25
• 外部特征: 题名途径 著者途径 代码途径 • 内部特征: 分类途径 主题途径
第二章 信息检索基本方法与基本技术
2. 主题检索语言
• 标题词:经规范化处理的词或词组,先组式
语言
• 叙 词(单元词):经规范化处理的词或词
组,后组式语言,可自由灵活组配
• 关键词:未经规范化处理,直接从文献题名、
原文或文摘中选取的能反映原文主题内容的自 由词汇
二、检索工具
定义:检索工具是人们用来存储、报道和查找 文献的工具,它具有存储和检索的功能。
点击预约书刊可预约该书 预约图书:选定所需图书,输入证号、密码,执行预约 点击机读格式可查看该书的MARC信息
高级查询
• 在题名、著者、丛书名、主题词、出版社、 ISBN(书)、ISSN(刊)、索取号、起始年 代中填入自己确定的内容,其余的可以不填 写;选定语种(17种)和文献类型,然后进 行检索。 • 结果可检索到所需文献的题名、著者、出版 信息、索取号 • 查看选中图书的相关信息
图书馆信息查询系统
•书目查询 •读信者息 •新书通报:一个月内到馆的新书、馆藏 地,并可查看新书 •订购征询 •信息发布:预约到书列表、超期罚款、 超期催还、委托借阅到书列表
如何利用计算机进行检索
书刊查询
读者信息查询
图书馆主页的功能
信息发布功能:
图书馆最新服务动态、电子 资源试用等均及时在主页上发布。
一、信息检索原理
信息检索的原理(示意图)
存 储
特征化
表示
查 询
特征化
表示
信息 集合
选择与匹配
需求 集合
二、信息检索类型
手工检索 计算机检索 文献信息检索
• 信息检索(内容)
• 信息检索(工具手段)
数据信息检索
事实信息检索
第二节 信息检索语言与工具
一、信息检索语言
信息检索原理与技术
规范词(controlled term)。人工语言的规范处理重 在两个方面:一是使一个概念只用一个词汇来表达,这 样就避免了多词一义的情况;二是使一个标引词只能表 达一个概念,这样就排除了一词多义现象。
natural language :自然语言是取其自然形态,不
(2)按照代表文献所描述的主题内容的主题词的音 序、字顺等组织文献——主题组织法
《汉语主题词表》以及各种主题索引
4.工具书
情报源
无序流
2021/8/2
检 目录
整 序 方 法 ( 即
外 文献篇名
表 特
作者姓名(含团体作者)
征
等等
内 分类—(表)
部
全文 全文数据库
工具书 工具类数据库
索 题录
工 具
文摘 索引
O123初等几何
2、特征对应关系
特 外表特征 主题特征 内容特征 分类特征 征
标 标题、作 主题词、 文摘、说 分类号 者、作者 关键词 明、全文
识 工作单位
对 精确对应 模糊对应 模糊(精 模糊对应
应
确)对应
3.情报源根据特征标引、整序、编排
文献篇名
排整 方序 法方 )法
( 即 编
特 外 作者姓名(含团 征 表 体作者)
IPC
(1)体系分类语言 《中国图书馆分类法》:分五大部22大类。 A 马克思主义、列宁主义、毛泽 东思想、邓小平理论
B 哲学、宗教 C 社会科学总论 D-K 社会科学各学科 N 自然科学总论 O-X 自然科学各ห้องสมุดไป่ตู้科 Z 综合性图书
其中文学类类目展开情况如下:
I
信息检索原理与技术.ppt
2.2.2 信息检索系统
信息检索系统是拥有一定的 存储、检索技术装备、存储 有各种信息,并能为用户检 索所需信息的服务工作系统。 目前常用的是手工检索系统 和计算机检索系统。
2019/4/24 17
2.2.3
信息检索语言
检索语言又称标引语言, 是系统存储和检索时共同使 用的一种约定语言,以达到 信息存储和检索的一致性, 提高检索效率。
数据信息检索
以具有数量性质并以数值形式表示的数据为检 索对象,是一种确定性检索。检索的结果是经 过测试和评价过的各种数据,可用于比较分析 和定量分析。它一般以数据大全、手册、年鉴 等为检索工具。 例如:乙二胺登记号? 登记号: 107-15-3 [87-79-6] 检索工具:化工产品手册、搜索引擎.2.2 2.2.3
信息检索原理
信息检索效率 信息检索系统 信息检索语言
2019/4/24
15
2.2.1 信息检索效率
信息检索效率是评价一个检索系 统性能优劣的质量标准,它贯穿 于信息的存储和检索的全过程。 其评价指标主要是:
查全率 查准率
2019/4/24 16
2019/4/24 18
检索语言的类型
分类语言
主题语言
体系分类语言 组配分类语言 混合分类语言 标题词语言 关键词语言 叙词语言 单元词语言
19
2019/4/24
体系分类语言
体系分类语言是按学科逻辑分类的原 理,运用概念划分的方法,按知识门类 从总到分,从上到下,层层划分,逐级 展开组成分类表,并以分类表来标引、 存储信息和检索信息。特点是体现学科 的系统性,反映事物的平行、隶属和派 生关系,有利于从学科的角度进行族性 检索,达到较高的查全率。
TQ324 TQ325 TQ327 TQ328
信息检索的基本原理与方法
二十世纪七十年代,美国核专家泰勒收到一份题为《制造核弹的方法》
的报告,他被报告精湛的技术设计所吸引,惊叹地说:“至今我看到的报
告中,它是最详细、最全面的一份。”但使他更为惊异的是,这份报告竟
出于哈佛大学经济专业的青年学生之手,而这个四百多页的技术报告的全
部信息来源又都是从图书馆那些极为平常的、完全公开的图书资料中所获
(2)、信息的需求分析和检索过程。分析用户的信息需求,利用组织好的检索 系统,按照系统提供的检索方法和途径检索有关信息——检索系统的应用过 程。
因此,信息检索的实质是将描述用户所需信息的提问特征与信息存
储的检索标识进行比较,从中找出与提问特征一致或基本一致的信息。
所谓提问特征就是对信息的需求分析后,从中选出能代表信息需求的 主题词、分类号或其它符号。
狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程, 也就是我们常说的信息查询(Information Search 或Information Seek) 。
可见,信息检索的全过程应包括两个主要方面:
(1)、信息标引和存储过程。标引是用检索语言和分类号、主题词等标识符号 来表示信息,通过对大量无序的信息资源进行标引处理,使之有序化,并按 科学的方法存储起来,并组成检索工具或检索文档——组织检索系统的过程;
例如:要查找“硅藻土在塑料工业中的应用”方面的信息,根据信息 需求的范围和深度,可选择“硅藻土”和“塑料”为第一层的提问特征, “硅藻土”和“通用塑料、工程塑料、特种塑料等”为第二层面的提问 特征,“硅藻土”、“聚氯乙烯、聚乙烯、聚丙烯、聚酰胺、聚酰亚胺、 聚酯,玻璃钢”等塑料品种名称作为第三层面的提问特征。
☺ 目录 ☺ 题录 ☺ 文摘 ☺ 索引
信息检索原理
“检索就是查找”,这仅仅是一种狭义旳解释。从广义旳角度讲, 检索涉及“存贮”和“查找”两个过程。没有存贮就没有查找, 存贮是为了查找,但查找必须有存贮,两者缺一不可。
是以文件为检索对象旳信息检索。也就是说文
件检索是以图书、期刊、资料、数据库中旳篇章或
全书刊为检索对象旳一种检索。
如:检索有关“花卉组织培养技术”旳文件。
文件检索是一种有关性检索,检索成果不直接
回答顾客提出旳技术问题,只是提供与之有关旳文
件信息供顾客参照。
7
(2) 事实检索(Fact Retrieval)
5
信息检索原理示意图:
原始信息
信息处理人员
存贮过程
检索成果 检索 工具
信息分析、著录
和标引
存入
检索语言
(主题词/分类号)
检索
课题分析
检出
6
检索课题 用户
检索过程
3.信息检索旳类型
以检索内容区别:
根据检索对象不同,信息检索可分为文 件检索、事实检索和数据检索三种类型。
(1) 文件检索(Document Retrieval)
┆
O3 力学
O31
理论力学
19
第2章 信息检索原理
分类法途径旳特点: 它体现了学科旳系统性,便于从学
科或专业旳角度出发进行族性检索,但 缺乏进行多概念灵活组配旳能力。
20
索书号又称为排架号
反应了某种图书在整个图书组织 中旳排列顺序和在书库中旳详细位置 (架位)
构成:分类号+书次号
第三节课 第二章 文献检索原理与方法
思考题
1.《中国图书法》(简称《中图法》)将图书分为() A. 5大部类,22个大类 B. 5大部类,26个大类 C. 6大部类,22个大类 D. 6大部类,26个大类 2.《中国图书法》(简称《中图法》)是我国常用的分类法,要 检索农业方面的图书,需要在( )类目下查找。 A. S类目 B. Q类目 C. T类目 D. R类目
第一步,《全国新书目》的新书是安排在"新书视窗"专栏,在 2000年第3期《全国新书目》的目录中寻找到"新书视窗"专栏, 在第41~77页。 第二步,在第41~77页的"新书视窗"专栏里,我们可以看到, 该专栏是按照出版社的顺序排列的。高等教育出版社在第45页, 广东经济出版社第46页,教育科学出版社在第52页。 第三步,在第45、46、52页,你可以看到这几个出版社最 近所出版的新书目录。 如广东经济出版社的目录中有以下记载: 知识经济与改革创新 黄铁苗主编 2000 20cm 25.00元 本书围绕改革开放中的热点、难点问题进行探索,具体内容 包括:所有制问财政金融问题、农村经济问题、就业问题、地方 经济问题和其他问题。
2.检索工具-类型
目录 (bibliography,catalogue) 文摘(abstract) 索引(index)
2.1 目录
目录是一批相关文献信息的著录集合,是以报道文献 出版信息为主要功能的工具。 特点:以单位出版物为著录对象,反映馆藏情况,主 要揭示文献外部特征 目录的著录项目:出版名称、责任者、出版项和稽核 项 目录的类型:《全国总书目》《全国新书目》《全国 西文期刊联合目录》
主题词法与分类法的比较
主题词法 分类法
信息检索原理与技术资料整理
信息检索原理与技术资料整理信息检索原理与技术资料整理华中师范大学信息检索原理与技术第一章信息检索概论1.1信息检索基础简述1.信息:事物发出的信号所包含的内容。
2.知识:知识是人类的主观世界对客观世界的概括和反映,是大量有组织的信息,是关于事实和思想的有组织的陈述,提供某种思考的判断和某种实验的结果。
3.知识的分类:①“知事”(know-what):指关于事实方面的知识,也可理解为know-when、know-where,即在什么样的时间(know-when)、什么样的地点或条件下(know-where)能解决什么样的问题。
②“知因”(know-why):指自然原理和规律方面的科学理论,知识的产生是在专门研究机构如实验室和大学完成的。
③“知道怎样做的知识”(know-how):指做某些事情的技艺和能力,被称为技术情报和商业秘密,其典型是企业开发和保存于其内部的技术诀窍或专有技术。
④“谁以及是怎样创造知识的”(know-who):侧重对创造思想、方法、手段、过程及特点等的了解。
4.文献:文献是记录有知识的一切载体,即知识信息必须通过文献载体进行存储和传递。
构成三要素:①构成文献内核的知识信息②负载知识信息的物质载体③记录知识信息的符号和技术特点:知识性(本质)、传递性、动态性。
分类标准:内容加工程度划分:①一次文献信息:指作者以自己的研究成果为基础创作和撰写的、未经过加工的原始文献。
②二次文献信息:指对一次信息加工整理而成的文献,如目录、文摘、索引等各种书目信息,它具有汇集性。
③三次文献信息:是对一次、二次信息综合、分析等深加工的产物,如评论、进展报告、评述、百科全书、年鉴、指南、期刊书目等。
载体形式划分:书写型、印刷型、缩微型、声像型、机读型五大类。
5.文献信息链:文献作为人类文化信息的承载物,从其产生、替代、反复被利用、再创造,直至产生新知识,是一个不断演进的运动过程。
6.信息、知识和文献三者之间的关系(重点):信息>知识>文献信息、知识和文献的联系在于:信息作为物质的一种普遍属性,是生物以及具有自动控制系统的机器通过感觉器官和相应的设备与外界进行交换的一切内容。
第二章信息检索基础1
化学物质登记号(CAS registry number)检索
分子式(formula)检索 记录顺序号(accession number)检索 化合物结构图检索(structure search)检索 ……
不同检索途径常用字段名称
题名途径:题名、标题、篇名、题目、title 分类检索途径:分类号,中图分类号 主题途径:主题词、MeSH、MeSH terms、 Thesaurus、map term to subject headings 关键词途径:关键词、keywords、text words 著者途径:(第一)作者、著者、责任者、 author、first author
研、生产中的具体问题所需要的特定知识或信息。(微波炉
发明) (四)文献(Literature) 文献是记录有知识的一切载体,是知识的外在形式。
情报的基本属性
知识或信息 经过传递
经用户使用产生效益 情报的 基本属性
信息与知识、情报、文献的关系
知识源于信息,是信息的一部分 情报源于知识或信息,是激活了的知识或信息 文献是信息、知识、情报的主要载体形式
形成系统,便于检索的文献。
如:题录、书目、索引和文摘。
特征1 特征2 特征3 特征4 特征5
提取特 征
特征n
二次文献
二次文献
二次文献
2013-8-10
40
三次文献
三次文献是利用二次文献并在其指引下,对大 量的一次文献进行综合分析研究,加以浓缩和提 炼而成的文献。 包括综述、述评、进展、预测等,各类词典、 手册、年鉴、百科全书、指南等参考工具书也属 于三次文献的范畴。
一次文献、二次文献、三次文献
一次文献:
又称原始文献,是首次公开发表的文献,直 接记录了科研成果,报道了新发明、新技术、新 知识和新观点。 一次文献主要包括专著、期刊论文、科技报 告、会议文献、学位论文、专利文献等。
信息检索原理与技术PPT演示文稿
12
事实信息检索
以事项为检索对象,检索 结果是有关某一事物的具体 答案,也是一种确定性检索。 一般利用字词典、年鉴、百 科全书、手册等为检索工具。
13
示例
问题:国内计算机软件的研究机构? 检索工具:中国企业、公司及产品数据库 中油油气勘探软件国家工程研究中心有限公司 四川省嵌入式计算机软件技术重点实验室 信息产业部实时计算机系统及应用重点实验室 电子科技大学嵌入式实时计算研究所
TB 一般工业技术 TD 矿业工程 TE 石油、天然气工业 TF 冶金工业 TG 金属学与金属工艺 TH 机械、仪表工业 TJ 武器工业 TK 能源与动力工程
TL 原子能技术 TM 电工技术 TN 无线电电子学、电信技术 TP 自动化技术、计算机技术 TQ 化学工业 TS 轻工业、手工业 TU 建筑科学 TV 水利工程
6
示例二
食品中常见病原菌快速检测
提问特征(关键词)
食品、食物 病原菌 检测
7
2.1.3 信息检索的类型和特点
1. 书目信息检索 2. 全文信息检索 3. 数据信息检索 4. 事实信息检索 5. 小结
8
书目信息检索
以标题、作者、原文来源、摘要及收藏地点为检 索对象,是一种相关性检索。特点:检索结果不直接 解答课题用户提出的技术问题,只提供与之相关的线 索。一般以目录、索引、文摘数据库为检索工具。
1. 信息标引和存储过程 2. 信息的检索过程
4
2.1.2 信息检索的实质
将描述特定用户所需信息的提问 特征,与信息存储的检索标识进行 异同的比较,从中找出与提问特征 一致或基本一致的信息。提问特征 是指从欲检索课题中选择出能代表 信息需求的主题词、关键词或分类 号等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
小结:
书目信息检索是利用各种目录、题录 和文摘工具获取有关信息的线索。 例如:
• 各种图书目录、期刊目录 • 国内外著名的题录和文摘有《全国
报刊索引》、《工程索引》(EI)、 《科学引文索引》(SCI)等。
第2章信息检索原理与技术[1]
全文信息检索是利用各种全文系统获 取有关的全文信息。
例如:中国科技期刊全文数据库 数据和事实检索是利用各种参考工具
数据信息检索
以具有数量性质并以数值形式表示的 数据为检索对象,是一种确定性检索。 检索的结果是经过测试和评价过的各种 数据,可用于比较分析和定量分析。它 一般以数据大全、手册、年鉴等为检索 工具。
第2章信息检索原理与技术[1]
示例
2008年申请中国发明专利和 获得授权发明专利的国家有哪些?
检索工具 中国统计年鉴
Ú 式1:(相变材料or 相变纤维)and (原位微胶囊化 or 微胶囊化) and 制 备
Ú 式2:phase change material and microencapsulation
Ú 式3:phase change fibers and microencapsulation
Ú 式4:phase change material and preparation Ú 式5:phase change fibers and preparation
第2章信息检索原理与技术[1]
检索语言的类型
分类语言 主题语言
体系分类语言 组配分类语言 混合分类语言 标题词语言 关键词语言 叙词语言 单元词语言
第2章信息检索原理与技术[1]
体系分类语言
Ú 体系分类语言是按学科逻辑分类的
原理,运用概念划分的方法,按知
识门类从总到分,从上到下,层层
划分,逐级展开组成分类表,并以
TL 原子能技术 TM 电工技术 TN 无线电电子学、电信技术 TP 自动化技术、计算机技术 TQ 化学工业 TS 轻工业、手工业 TU 建筑科学 TV 水利工程
第2章信息检索原理与技术[1]
关键词语言
关键词语言是一种主题语言(采 用表达某一事物或概念的名词术语 标引、存储和检索的一种语言)。 它是直接从原文的标题、摘要、全 文中,研究课题中抽选出来的具有 实质意义的、未经规范化处理的自 然语言词汇作为存储和检索依据的 一种检索语言。
以标题、作者、原文来源、摘要及收藏地点为检 索对象,是一种相关性检索。特点:检索结果不直接 解答课题用户提出的技术问题,只提供与之相关的线 索。一般以目录、索引、文摘数据库为检索工具。
例如:查找有关“城市生态环境及 可持续发展”方面的国内外信息有那
些?
检索工具: 中文科技期刊数据库、万方数据资源系统、 EI等。
分类表来标引、存储信息和检索信
息。特点是体现学科的系统性,反
映事物的平行、隶属和派生关系,
有利于从学科的角度进行族性检索,
达到较高的查全率。
第2章信息检索原理与技术[1]
《中图法》第四版分类体系组成及结构
第2章信息检索原理与技术[1]
《中图法》T 工业技术及环境科学 大类简表(二级类目表)
TB 一般工业技术 TD 矿业工程 TE 石油、天然气工业 TF 冶金工业 TG 金属学与金属工艺 TH 机械、仪表工业 TJ 武器工业 TK 能源与动力工程
第2章信息检索原理与技术[1]
2.制定检索策略
(1)选择检索词:
相变材料—phase change material 相变纤维—phase change fibers 微胶囊化—microencapsulation 制备—preparation
第2章信息检索原理与技术[1]
(2)使用相关检索技术构造提问式
第2章信息检索原理与技术[1]
式6:phase change material* and microencapsulation
第2章信息检索原理与技术[1]
2.4.1 布尔检索
布尔检索技术使用的逻辑算符及含义
(1)逻辑与 (2)逻辑或 (3)逻辑非
第2章信息检索原理与技术[1]
逻辑与
1. 概念:逻辑与是一种具有概念交叉 或概念限定关系的组配。
2. 算符:“ * ” 或 “ AND ” 3. 特点:增强专指度,提高查准率。
第2章信息检索原理与技术[1]
2.1.1 信息检索的含义
信息检索通常是指从任何方式 组成的信息集合中,查找特定用户 在特定时间和条件下所需信息的方 法与过程。因此,完整的信息检索 应包括以下两个方面:
1. 信息标引和存储过程 2. 信息的检索过程
第2章信息检索原理与技术[1]
2.1.2 信息检索的实质
将描述特定用户所需信息的提问 特征,与信息存储的检索标识进行 异同的比较,从中找出与提问特征 一致或基本一致的信息。提问特征 是指从欲检索课题中选择出能代表 信息需求的主题词、关键词或分类 号等。
第2章信息检索原理与技术[1]
示例一
区域发展中的生态环境特征研究 提问特征(关键词) 1.区域发展 生态环境 2.区域 生态 环境
第2章信息检索原理与技 术[1]
2020/11/25
第2章信息检索原理与技术[1]
2.1 信息检索概述 2.2 信息检索原理 2.3 信息检索方法 2.4 信息检索技术
第2章信息检索原理与技术[1]
2.1 信息检索概述
2.1.1信息检索的含义 2.1.2信息检索的实质 2.1.3信息检索的类型和特点
查全率 查准率
第2章信息检索原理与技信息检索系统是拥有一定 的存储、检索技术装备、存 储有各种信息,并能为用户 检索所需信息的服务工作系 统。目前常用的是手工检索 系统和计算机检索系统。
第2章信息检索原理与技术[1]
2.2.3 信息检索语言
检索语言又称标引语言, 是系统存储和检索时共同 使用的一种约定语言,以 达到信息存储和检索的一 致性,提高检索效率。
第2章信息检索原理与技术[1]
黑龙江省计算机软件工程技术研究中心 江苏省计算机软件工程研究中心 中山大学计算机软件研究所 云南省计算机软件技术开发研究中心 计算机软件国家工程研究中心 武汉大学计算机软件工程研究所 贵州大学计算机软件与理论研究所 浙江大学计算机软件研究所
第2章信息检索原理与技术[1]
例如:air NEAR pollution air SAME pollution
第2章信息检索原理与技术[1]
2.4.3 截词检索
截词检索是防止漏检,提高查全率的一种 常用检索技术,大多数数据库都提供了截词检 索的功能。用*或?表示。
截词是在检索词的适当位置进行截断,节 省输入的字符,达到较高的查全率,常用的有 后截词方式。
相关概念分别在一条记录中出现或同时 在一条记录中出现。
第2章信息检索原理与技术[1]
逻辑非
1. 概念:逻辑非是一种具有概念排除 关系的组配。
2. 算符: “ - ” 或 “ NOT ” 3. 特点:提高查准率,影响查全率。 4. 举例: 制药废水 NOT 放射废水,
表示检索出的记录中要排除含有 “放射废水 ”的记录。
书获取有关的确定性数据或事实信息。 例如:各种百科全书、年鉴、手册等。
第2章信息检索原理与技术[1]
2.2 信息检索原理
2.2.1 信息检索效率 2.2.2 信息检索系统 2.2.3 信息检索语言
第2章信息检索原理与技术[1]
2.2.1 信息检索效率
信息检索效率是评价一个检 索系统性能优劣的质量标准,它 贯穿于信息的存储和检索的全过 程。其评价指标主要是:
一、检索目的和要求: 目的:科技立项 要求:国内外有无 1.相变储能纤维制备的研究报道; 2.已采用的制备方法有哪些?
第2章信息检索原理与技术[1]
二、主题分析
第一层面:相变储能纤维—相变材料 第二层面:制备—微胶囊化
第2章信息检索原理与技术[1]
2.3.2 制定检索策略
检索策略是为了达到检索 目标而制定的具体检索方案。 包括选择检索系统、确定检 索途径或检索词、拟定检索 程序。按检索手段分为手工 检索策略和上机检索策略。
第2章信息检索原理与技术[1]
2.4.2 词位检索
词位检索具有限定检索词词 间位置关系的功能,可弥补布尔 逻辑算符只是定性规定检索词的 范围,达到提高检准率的效果。
第2章信息检索原理与技术[1]
邻近检索
用于网络数据库,常用的位置逻辑算 符有: 同句、同段、NERA 、SAME。
NERA表示两词之间不得多于9个词, 词前后位置任意,SAME要求检索词在同 一个句子中,这里所指的同一个句子是 两个句号之间的字符串,检索词在句子 中的顺序任意。
第2章信息检索原理与技术[1]
示例二
食品中常见病原菌快速检测
提问特征(关键词)
食品、食物 病原菌 检测
第2章信息检索原理与技术[1]
2.1.3 信息检索的类型和特点
1. 书目信息检索 2. 全文信息检索 3. 数据信息检索 4. 事实信息检索 5. 小结
第2章信息检索原理与技术[1]
书目信息检索
限制检索在光盘数据库中一般用 前、后缀表示,在网络数据库中一 般使用下拉菜单进行选择限制。
第2章信息检索原理与技术[1]
2.4.5信息检索方法及技术应用实例
检索课题:相变储能纤维的制备
1.信息需求分析 (1)明确检索目的与要求
1)检索目的:学位论文开题查新 2)检索要求:国内外相变储能纤维的制备 的相关信息。 (2)进行主题分析,确定主题范围。根据检索 目的与要求,该课题涉及的主题范围重点为: 相变储能纤维、制备。
4.举例: “遥感技术” AND “监测”,
表示两个概念应同时包含在一条记录中。
第2章信息检索原理与技术[1]
逻辑或