信息检索基础知识

合集下载

第三章 信息检索的基本知识

第三章 信息检索的基本知识

1、逻辑“或”(和) 、逻辑“
————————————————— A
B
用符号“ 或 表示, 用符号“or”或“+”表示,其逻辑表达式为: 表示 其逻辑表达式为: A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词 , 其意义为检索记录中凡含有检索词 或检索词B, 或检索词 或同时含有检索词A和 的 均为命中文献。 或同时含有检索词 和B的,均为命中文献。
分 析 课 题
检索词: 检索词: : :
富营养化(水华), ),处理 富营养化(水华),处理 治理,修复), ),湖泊 (治理,修复),湖泊
ቤተ መጻሕፍቲ ባይዱ
, ,

检索工具: 检索工具:
1. 2. 3. 4. 5. 6. 7. 8. 中文科技期刊全文数据库(维普) 1989中文科技期刊全文数据库(维普) 1989-现在 中国科技成果数据库(万方) 1986中国科技成果数据库(万方) 1986-现在 中国期刊全文数据库(同方) 1979中国期刊全文数据库(同方) 1979-现在 中国优秀博硕士学位论文全文数据库(同方)1999中国优秀博硕士学位论文全文数据库(同方)1999-现在 中国学位论文文摘数据库(万方) 1989中国学位论文文摘数据库(万方) 1989-现在 中国学术会议论文全文数据库(万方) 1995中国学术会议论文全文数据库(万方) 1995-现在 中国重要会议论文全文数据库(同方) 2000中国重要会议论文全文数据库(同方) 2000-现在 中国重大科技成果数据库(万方) 1990中国重大科技成果数据库(万方) 1990-现在
中图分类法
中图法》 个基本部类, 《中图法》分 5个基本部类,将知识门类分为 哲学” 社会科学” 自然科学” “哲学”、“社会科学”、“自然科学”三大部 马克思主义、列宁主义、 类。马克思主义、列宁主义、毛泽东思想是指导 我们思想的理论基础,作为一个基本部类, 我们思想的理论基础,作为一个基本部类,列于 首位。此外,考虑到图书本身的特点, 首位。此外,考虑到图书本身的特点,对于一些 内容庞杂,类无专属, 内容庞杂,类无专属,无法按某一学科内容性质 分类的图书,概括为“综合性图书” 分类的图书,概括为“综合性图书”,作为一个 基本部类,置于最后。 22个大 基本部类,置于最后。在此基础上扩展为 22个大 类。 标记符号采用拉丁字母与阿拉伯数字相结合的混 合号码制。 合号码制。

信息检索基础知识

信息检索基础知识

TP 自动化技术、计算技术
3 计算技术、计算机
31
计算机软件
316
操作系统
.1
分时操作系统
.2
实时操作系统
.7
Windows操作系统
39
计算机的应用
… F25 物资经济 F250 物资经济理论 F252 物资流通
… F5 交通运输经济 F50 交通运输经济理论
… F53 铁路运输经济 F54 陆路、公路运输经济
匹配有其匹配标准,这里涉及到两者一致性、 相关度等问题,按一定的标准筛选出符合要求的 信息。
精选ppt
3
信息检索一般过程
信息源
信息分析、 著录、标引
信息的表示
用户
检索语言
用户需求分析
数据库 匹配过程
输出检索结果 精选ppt
检索表达式
4
信息检索的过程往往需要一个评价反馈途径,多次比较匹配, 以获得最终的检索结果。其图示如下:
9
责任者 及其单位
中图分类号 文献标示码
关键词
正文
精选ppt
题名 摘要
10
分类语言
也属于主题语言。分类语言是按学科范畴划分而构成的一 种语言体系,它集中反映学科的系统性、反映它们的相关、 从属、派生等关系,从总体到局部分层、分面展开,形成 分类体系。由类目号码及名称作为检索语言,构成分类类 目表,如前述图书分类表、专利分类表用的都是分类语言 。
13
……
主题语言
包括:关键词语言、单元词语言、标题词语言、叙词语言等,它们有不同 的主题词表。主题词表达概念本身,在主题词表中通过参照系统来指示词 汇之间的关系。如”交通运输”、“国际物流”。主题语言分为规范主题语

信息检索基础知识考点整理

信息检索基础知识考点整理

信息检索基础知识考点整理●2.1 信息检索的概念与原理●2.1.1 信息检索的概念(重要)●2.1.2 信息检索的原理●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出●信息检索的类型●1.文献检索●2.数据检索●3.事实检索●2.1.3 信息检索的意义/作用(重要)●1.信息检索是有效利用信息资源,实现其最大价值的科学方法●2.信息检索是再学习的工具,是获取知识的有效途径●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间●2.1.4 信息检索的历程●1.手工检索●2.计算机检索●2.2 信息检索系统(重要)●2.2.1 信息检索系统的概念●1.信息检索系统的含义●2.信息检索系统的工作原理●2.2.2 信息检索系统的构成●1.信息选择子系统●2.信息索引子系统●3.词表管理子系统●4.用户接口子系统●5.匹配子系统●2.2.3 信息检索系统的分类●1.手工检索系统●1.书本式的手工检索系统●2.卡片式的手工检索系统●2.计算机检索系统●1.硬件●2.软件●3.数据库●1.参考数据库●1.书目数据库●2.指南数据库●2.源数据库●1.数值数据库●2.文本—数值数据库●3.全文数据库●4.术语数据库●5.图像数据库●6.多媒体数据库●2.3 信息检索方法(重要)●1.直接浏览法●直接查找法●2.常用法●顺查●倒查●抽查●3.追溯法●4.综合法(分段查找法、循环法、交替法)●2.4 信息检索效果(重要)●2.4.1 信息检索效果评价●信息检索效果的概念●1.检索结果有效性评价●2.检索系统实用性的评价●3.检索费用—效率评价●信息检索效果评价对于信息检索系统的建设和发展的意义●信息检索效果评价的核心问题是建立一套切实可行的评价指标●1.查全率和查准率●2.误检率和漏检率●3.响应时间●其他与检索效果相关的指标●2.4.2影响信息检索效果的因素●1.标引的质量●2.检索途径的数量●3.检索策略的优劣●4.检索人员的素质。

第二章 信息检索基本知识

第二章 信息检索基本知识

(二)按出版形式划分:
原始文献
图书
特种文献
期刊
会 议 文 献
科 技 报 告
专 利 文 献
学 位 论 文
政 府 出 版 物
其 标 准
食品标准网

7-111-17892-0
《发票报文》GB/T 17303.2-1998 第二部分:国际贸易商业发票报 文
……
(三)按信息的加工程度来分: 1、一次文献信息 (原始文献):
一、检索工具的作用 1、报道作用 2、存储作用 3、检索作用
二、检索工具的特点
1、详细而又完整地记录了文献的外部特征和内部特征。
2、对所著录的文献,标引了可供检索的检索标识。 3、提供必要的检索手段,配备各种体系的索引。
三、检索工具的类型
按著录信息的特征划分:
1、目录 2、题录 3、文摘 4、索引
检索途径-分类途径 分类途径的缺点是新兴学科、边缘学科在 分类时往往难于处理,查找不便。另外, 从分类途径检索必须了解学科体系,否 则在将概念变换为分类号的过程中常易 发生错误,造成漏检或误检。
检索途径-主题途径
• 主题途径是一种按照文献的主题内容查找文献 的途径。使用的语言是主题语言。使用的检索 工具有“主题索引”、“关键词索引”、“叙 词索引”等。 • 主题法打破了传统的学科分类的框框,把分散 于各个学科的有关文献集中于同一主题词之下, 以文字作检索标识,索引按照资料内容的主题 词或关键词的字顺排列,检索时就象查字典一 样,不必考虑学科体系。
更多……
• 按检索方式,可分为印刷型检索工具和机器检 索工具; • 按出版形式,可分为期刊式检索工具、书本式 检索工具、卡片式检索工具、缩微式检索工具、 机读式检索工具等; • 按收录范围,可分为综合性检索工具、专题性 检索工具; • 按语种,可分为中文检索工具和外文检索工具;

第二讲信息检索基础

第二讲信息检索基础

回 顾

本讲主要内容
● ●
信息检索概念 信息检索意义 信息检索原理 信息检索类型 信息检索途径 信息检索方法

信息检索技术 信息检索策略 信息检索步骤

● ●

Hale Waihona Puke 信息检索语言信息检索利用



有一种能力与生俱来
有一种能力终身受用------信息检索
信息检索概念
南航学生事务服务中心:【名家讲坛】4月8 日19:00在一号楼四楼报告厅,延参法师邀 请你一起《快乐看人生》!本次讲座将凭票 入场,但入场券只提供入场资格,现场座位 先到先得!入场券将在本周日(3月31日) 16:00在学生事务服务中心办公室免费领取, 领完为止,同样先到先得哦!邀你的同学一 起聆听大师的教诲吧!
信息检索途径
是由提取信息源的外部与内部特征形成 的,又称为检索点或检索入口
题名 责任者 号码 (专利号、标准号等) 出版信息 丛编 装帧 责任者单位
分类 主题
外部特征 信息(文献)
内部特征
文献外部特征主要检索途径:题名 责任者 号码 文献内部特征主要检索途径:分类 主题
信息检索方法
德国柏林图书馆门前有这样一段话:“这里是知识的宝库, 你若掌握了它的钥匙,这里的全部知识都是属于你的。”
信息检索类型
信息检索类型
按检索对象性质: 文献检索:凡是以文献(包括文献线索、文摘、题录 和 全文)为检索对象的一种检索。检索结果是特定文献线索。 移动通信病毒文献有哪些? 数据检索:凡是以数据(包括计算公式、化学分子式、数 值、图表(参考工具书) )为检索对象的叫数据检索。 检索结果是数值性数据。今日人民币对美元汇率 事实检索:统计资料、百科知识、人物传记、案例等世界 上最长的斜拉桥是哪座,该桥位于什么地方,何时建成? 按检索方式:手工检索 计算机检索

信息检索基本知识

信息检索基本知识

T
TB TG TH TE …… TU TV
TB1
TB2
TB3
TB4
…… TB48 …… TB488
……
TB482
TB489
T—工业技术类中图法举例
以T-工业技术大类下的TP类展开下位类如下: T 工业技术 TP 自动化技术、计算机技术 TP3 计算技术、计算机技术 TP39 计算机应用 TP393 计算机网络 TP393.0 一般性问题 TP393.01 计算机网络理论 TP393.02 计算机网络结构与设计
二、文献信息源类型
文献可按不同的方法分类描述,比较常见 的分类方法有如下三种: 按信息的载体形式划分(印刷、胶片、 电子文献等); 按信息加工的级别划分(四次文献); 按信息的发布形式划分(十大文献信 息源等)
1、按文献的载体形式划分
• 印刷型(Printed form):以纸张为载体 • 缩微型(Microform):以感光材料为载体:胶片 • 声像型(Audio-Visual form):以声像记录材料为 载体:磁带 • 电子型(Machine Readable form):以计算机信息 存储设备为载体 :软磁盘、光盘、硬盘等
叙词
•叙词是主题语言的高级形式。是以较正规和正式的 科学名称为基础组织而成一种主题法检索标识系统。 •由在概念上不可再分的基本概念单元词汇组成,检 索时可以利用这些单元词进行组配,以表达一个复杂 的概念。
•如课题: 太阳能热水器研究 汉语主题词表中正式主题词是太阳能利用、太阳 能加热等代替。
标题词
• 国际十进分类法(UDC: UDC(Universal Decimal Classification)
又称为通用十进制分类法。是世界上规模最大、用户 最多、影响最广泛的一部文献资料分类法。原由比利 时人P.-M.-G.奥特莱和H.-M.拉封丹在《杜威十进分类 法》第6版的基础上编成。近百年来,UDC已被世界 上几十个国家的10多万个图书馆和情报机构采用。 UDC目前已成为名符其实的国际通用文献分类法。

信息检索基础知识

信息检索基础知识

第一章信息检索基础知识一.概述1.信息与文献信息知识的分类:已掌握的知识和需查询的知识。

信息的定义:信息是事物运动的状态与方式,是物质的一种属性,并且借助于一定的物质载体传输和储存。

这里有几个词组需说明:事物:泛指一切可能研究的对象(包括物质的和精神的)。

运动:泛指一切意义上的变化(机械运动、化学运动、思维运动和社会运动)运动方式:在时间上所呈现的过程和规律:运动状态:在空间上所展示的形状和态势。

信息已成为与物质、能量同样重要的三大资源之一。

信息是一种原料,人类接受外界大量信息后,经过实践活动和大脑的思维机制加工提炼后变成有用的知识(知识的认识程度)。

文献:将知识记录并保持在一定的载体上,就形成了文献。

文献信息是文献所表达的内载信息,以文字、符号、声像信息为编码的人类精神信息,也是经过人们筛选、归纳和整理后记录下来的信息。

科技文献是科学技术研究成果的记录,积累了许多有用的事实、数据、理论、方法和科学假设,反映了科学技术研究的进展和水平,是科学信息的主要来源。

2.信息的特点(1)普遍性;信息是无处不在,无时不在的,c从宏观的宇宙天体到微观粒子,从自然界到人类社会,万事万物都是信息的母体;(2)时效性:信息的获得和传送需要时间,信息反映的总是特定时刻事物的运动状态和方式,当人们获得信息后,它反映的是某段时间的事物,是一种历史纪录,如果传递很慢,信息就会失去应有的价值;(3)传递性:指信息的空间和时间效应,信息可以从一个地方传到另一个地方,从一个时期传到另一个时期;信息的传递决定了信息的可扩散性,信息是通过各种渠道、媒介传播和扩散;(4)共享性:信息在传播和使用的过程中,载体本身的信息并不因此而减少,信息资源的共享将极大地推进人类文明的发展;(5)可转换性:信息的物质载体形态是可以相互转移变换的;信息在一定条件下可以转化为物质、能量、时间、金钱、效益、质量等;(6)可伪性:在人们得到信息后,必须进行分析判断和筛选,以便正确享用信息。

信息检索基础

信息检索基础

信息检索基础信息检索是指通过计算机系统从大规模的信息资源中获取有用的、相关的和准确的信息的过程。

在信息爆炸时代,信息检索的重要性越来越突出。

本文旨在介绍信息检索的基础知识,包括检索模型、检索评价以及检索技术。

一、检索模型检索模型是信息检索系统中的基本框架,它描述了用户如何提出查询并获取相关文档。

常见的检索模型有布尔模型、向量空间模型和概率检索模型。

1. 布尔模型布尔模型基于布尔代数,将查询和文档都表示为由逻辑操作符(AND、OR、NOT)连接的词项。

用户通过在查询中使用逻辑操作符来指定信息需求,系统根据查询与文档的逻辑关系进行匹配和检索。

2. 向量空间模型向量空间模型基于向量空间理论,将查询和文档都表示为向量。

每个向量的维度是词项,向量的值表示对应词项的权重。

用户的查询和文档都被映射到向量空间中,并通过计算查询向量与文档向量之间的相似度来进行检索排序。

3. 概率检索模型概率检索模型基于概率论,通过估计查询和文档之间的相关性概率来进行检索。

常见的概率检索模型有BM25模型和语言模型。

BM25模型利用词项频率和文档长度进行计算,语言模型则将检索看作是从语言模型中生成查询和文档的过程。

二、检索评价检索评价是衡量信息检索系统效果的重要方法,常见的评价指标有召回率、准确率、F1值和平均准确率(MAP)。

1. 召回率召回率是衡量检索系统找到相关文档比例的指标,计算公式为:召回率=找到的相关文档数/相关文档总数。

召回率越高,系统找到相关文档的能力越强。

2. 准确率准确率是衡量检索系统返回的文档中真正相关的比例的指标,计算公式为:准确率=真正相关的文档数/返回的文档总数。

准确率越高,系统返回的文档质量越高。

3. F1值F1值综合考虑了召回率和准确率,计算公式为:F1值=2*(召回率*准确率)/(召回率+准确率)。

F1值越高,系统综合检索能力越好。

4. 平均准确率(MAP)MAP是针对多个查询的评价指标,计算公式为:MAP=(查询1的准确率+查询2的准确率+...+查询n的准确率)/查询总数。

信息检索基础知识

信息检索基础知识

信息检索效果的评价
评价指标: 漏检率
漏检相关文献量 漏检率 100% 系统中相关文献总量

误检率
误检文献量 误检率 100% 检出文献总量
影响检索效果的主要原因

信息系统组织结构、检索系统功能
问题

检索策略、检索方法问题
提高检索效果的措施


熟悉各种信息系统特征
认真分析课题需求 灵活掌握检索方法和提高制定检索
信息检索的步骤


分析研究课题
制定检索需求描述 调整检索策略 索取原始文献
分析研究课题

明确以下问题:
分析客体的主要内容以及所涉及的知识点
明确所需要的文献种类、语种、年代以及
文献量。 明确对查新、查准、查全的指标要求以及 侧重点 确定所需要的文献应该具备的内外部特征。
分析研究课题

课题检索的类型:
查全型:开题报告、综述等 查准型:在具体细微的专业问题方面的研究 动态型:新技术、新理论的研究 查新型:同类研究项目比较
信息检索效果的评价
评价指标: 查全率(检全率)
检出相关文献量 检全率 100% 系统中相关文献总量

查准率(检准率)
检出相关文献量 检准率 100% 检出文献总量
策略的能力
第一部分 信息检索基础知识
主讲:戴 锋展


信息检索定义与分类
主要检索系统类型 信息检索效果评价
信息检索的作用

有利于减少课题的重复研究、提高
科研成功率
有助于节约时间、提高科研效率
切忌用来拼凑论文
信息检索的发展


信息检索基础知识

信息检索基础知识

46
计算机信息检索系统工作流程

输入子系统——选择收集特定范围的信息资源、按系统 指定款式输入系统 处理子系统——处理加工经过鉴定、选择好的数据和信 息,使其成为易于存储和检索的形式。 存储子系统——将加工处理后的信息按某种规定有序聚 积在存储载体上以构成可检文档。 传输子系统——通过计算机与通信线路的连接,完成信 息编码的传递、转接、处理与接受。 输出子系统——根据用户需求有效输出各类最终信息产 品。 控制子系统——根据系统内外环境变化,适时调控,保 障系统的有效输入、有效存储、有效输出等环节的协调 运行。
16
三、计算机信息检索系统 2、计算机信息检索系统的类型
计算机单机信息检索系统(20世纪50年代 初——60年代中期) 计算机联机信息检索系统( 20世纪60年 代中——70年代中期) 计算机光盘信息检索系统( 20世纪70年 代中——80年代中期) 计算机网络信息检索系统( 20世纪80年
(期).页码
10
二、手工信息检索系统
5、几种常用的手工信息检索工具 《中国农业文摘》: 81年创刊、85年起分7个分册 刊期、类型:双月刊、文摘型 检索途径:分类、主题、著者 著录格式:分类号 顺序号 题目 /作者
// 刊名, -年,卷(期). -页码 文摘正 文…… 图x 表x 参x (文摘员)
23
一、信息检索语言概述
信息检索语言是人们在加工、存储
及检索信息时所使用的标识符号; 信息检索语言是索引款目所使用的 标识系统; 信息检索语言可以是对自然语言作 规范化处理后的词汇与技术语言, 也可以是某类事物及其某方面特征 的代码。
24
二、信息检索语言的基本类型
1、按构成原理分:

第二章 信息检索基础知识

第二章 信息检索基础知识

全文检索
图像检索 超文本检索
文献检索
使用以二次文献为存储对象的信息系统,如目录
型、题录型、文摘型数据库,是一种相关性检索。特 点:检索结果不直接解答课题用户提出的技术问题, 只提供与之相关的线索。 例如:查找有关“食品安全与人类健康 ”方面的
国内外信息有哪些?
数据检索
以数值信息为检索对象,通过检索,用户可以获 得所需要的确切数据,是一种确定性检索。它一般以
的方式记录在相应的信息载体上,组织成系统
化的检索系统。
1. 数据库及其构成
数据库(database):至少由一种文档组
成,并能满足某一特定目的或某一特定数据处
理系统需要的一种数据集合。 通俗地说,数据
库就是在计算机存储设备上,按一定方式存储的 相互关联的数据集合,是信息检索的基础。
1. 数据库及其构成
一、信息检索的效果评价指标 二、影响检索效率的主要因素
一、信息检索的效果评价指标
以一个检索提问去检索任何一个数据库都会出现 4 个相关量:检出的相关信息量、未被检出的相关信 息量、检出的非相关信息量、未检出的非相关信息量。
一、信息检索的效果评价指标
1. 查全率 a 查全率(R )= —— ×100% a+c 查全率是对所需信息被检出程度的信息量指标。 2. 查准率 a 查准率(P )= ——×100% a+b 查准率是衡量拒绝非相关信息的指标。
中国图书馆分类法的体系结构:
S农业科学类目简表
(2)按事物的性质分类
按事物的性质分类 --- 热门主题 : 各种搜索引擎和网站 按事物的性质分类 --- 功能(使用方向)主题: 国际专
利分类法(IPC)
2.主题描述及信息检索语言

新第二章 信息检索基础知识

新第二章 信息检索基础知识

2.2 信息检索语言
三、主题语言
4.关键词语言
是指从文献标题、文摘、正文中抽离出来的,对表征文献主题 内容具有实质意义的语词,以关键词作为信息标识和检索依据的主 题语言。关键词没有固定的词表,因为对于同一个事物的概念,不 同作者甚至是同一个作者在不同的著作中用词都会不同,它是没有 经过规范化的自然语言词汇。 在检索中文医学文献中使用频率较高的《CMCC》数据库就是 采用关键词索引方法建立的。
2.5 计算机检索技术 四、词组检索
将固定词组或短语 看成单个词进行处理。
常用“ ”作为词组检索的运算符。
2.5 计算机检索技术 五、字段检索
对指定的一个或多个字段进行检索,从而提高查准率或查全率。
标题、作者、摘要、关键词、作者单位、文献来源、学位授予单位、 学位级别、会议信息、会址、会期、书名、出版地、出版年、专利号、报 告号、ISBN、ISSN等。
2.2 信息检索语言
一、信息检索语言的定义、作用和种类
4.分类:
篇名(题目) 著者名称 描述文献外表特征 文献序号 引用文献 等级体系分类语言 分类语言 组配分类语言 主题语言
检索语言
描述文献内容特征
代码语言
标题词语言 关键词语言 单元词语言 叙词语言 分子式索引 结构式索引 专利号索引等
2.2 信息检索语言
2.4 信息检索标识 一、检索标识的定义
检索标识即检索词,是指能表达检索课题主题概念和信息需 求的名词术语、分类号、名称、代码等的总称,包括主题词、 关键词、名称、分类号、分子式、专利号及各种号码。
2.4 信息检索标识 二、信息检索标识的类型
1.描述信息内容特征的检索标识: 分类、主题、代码(符号)。
2.5 计算机检索技术 一、布尔逻辑检索

信息检索基础必备知识点

信息检索基础必备知识点

1、信息检索的定义:是指将信息按一定的方式组织和存储起来,并根据信息用户的需求找出相关的信息的过程和技术。

信息检索的作用:a:节省查找文献的时间。

b:有利于文献专题查找。

c:克服语言障碍。

2、信息:所有事物的存在方式和运动状态以及关于所有事物的存在方式和运动状态的陈述。

信息的特征:普遍性、客观性、抽象性、依附性、可加工性、传递性、共享性。

信息的作用:(1)信息是人类社会生存的条件,信息是人类社会发展的资源(2)信息是主客体的中介,信息是思维的材料(3)信息是组织的保证,信息的管理的基础(4)信息是决策的依据,信息是控制灵魂文献的特点:(1)数量急剧增长(2)内容交叉重复(3)专业文献出版分散(4)文献老化加快(5)文献语种繁多(6)文献载体形态增加文献类型:(一)按照载体的形式不同,文献可分为:1、印刷型2、缩微型3、声像型4、电子型(二)按照内容、性质和加工深度的不同,文献可分为:1、一次文献2、二次文献3、三次文献4、零次文献(三)根据性质、特点和出版形式的不同,文献可分为:1、科技图书2、科技期刊3、科技报告4、政府出版物5、会议文献6、专利文献7、学位论文8、标准文献9、科技档案 10、产品样本a、主题语言主题检索语言是用语词来表达文献主题概念,它不管各语词之间相互关系如何,一律按字顺排列成主题词表,故称主题检索语言。

分为标题词语言、关键词语言和叙词型语言三种。

关键词语言:由于关键词语言能适应使用计算机的需要,因而大大加速了文献标引过程,缩短了检索工具出版的时间,便于用来检索最新文献,大大增加了检索点,使用灵活方便。

查准率和查全率较低。

叙词型语言:用途较广,既适合于手工检索,又适合计算机检索语言。

6、信息检索的途径:书名途径,著者途径,序号途径,分类途径,主题途径。

7、信息检索方法:(一)常用法所谓常用法,顾名思义是检索中最为常用的方法,指利用成套的检索工具检索文献信息的方法,也称之为工具法。

信息检索第1单元信息检索基础知识

信息检索第1单元信息检索基础知识

第一节 信息存储的基本程序与方法
五、信息的存储
分类: 手工信息检索系统和计算机信息检索系统
发展: 手工信息检索系统 计算机信息检索系统
信息检索基础知识 C_Zhangyh
一、信息检索的概念
广义的信息检索,包括: 各类信息检索系统的建设(信息存储) 特定信息的检索(信息检索)
信息检索基础知识 C_Zhangyh
4 2020/5/12
第一节 信息存储的基本程序与方法
一、信息检索的概念
信息存储就是利用检索语言对文献信 息进行标引,形成文献标识并输入检 索系统,为检索者提供有规律的检索 途径。
四、信息的描述(著录与标引)
信息著录与标引的标准格式: 1、传统著录 2、机读目录(MACR) 3、元数据著录(Metadata)
信息检索基础知识 C_Zhangyh
18
2020/5/12
第一节 信息存储的基本程序与方法
五、信息的存储
信息存储:将经过加工处理的信息资源 按照一定的方式记录在相应的信息载体 上,组织成系统化的检索系统。
信息素养 == 信息意识 + 信息检索能力
信息检索基础知识 C_Zhangyh
8 2020/5/12
第一节 信息存储的基本程序与方法
二、信息组织
概念:对大量的信息进行收集,并对其 进行组织和控制,使之有序化。
实质:无序信息流——有序信息流 内容:信息筛选、信息描述、信息存储
信息检索基础知识 C_Zhangyh
存储:原始文献 --- 文献标识.存储 --- 检索工具
信息检索基础知识 C_Zhangyh
19
2020/5/12
第一节 信息存储的基本程序与方法
五、信息的存储
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三、计算机信息检索系统
2.1 计算机单机信息检索系统 计算机信息检索系统的早期形式, 计算机信息检索系统的早期形式, 是将信息检索数据库系统建立在独 立的计算机硬盘上, 立的计算机硬盘上,直接在一台计 算机上进行存储和检索信息。 算机上进行存储和检索信息。 脱机批处理、 脱机批处理、无需终端和通信网 络
注意:期刊论文的文献出处包括: 注意:期刊论文的文献出处包括: 刊名--- ---卷---期---页码 ---年 刊名---年---卷---期---页码
8
二、手工信息检索系统
4、手工信息检索工具的著录对象
目录: 目录:单位出版物 题录: 题录:单位出版物中的单篇文献 文摘: 文摘:单位出版物中的单篇文献 索引: 索引:单位出版物或单篇文献中的知 识单元
分类号和类名来表达信息的主题概念, 分类号和类名来表达信息的主题概念, 并且按照知识门类的逻辑次序将信息系 统地组织和划分的语言。 统地组织和划分的语言。
主题检索语言: 又称主题法 主题法, 主题检索语言 : 又称 主题法 , 是用
主题词或标题词来表达文献主题概念的 语言。 语言。
27
二、信息检索语言的基本类型
三、计算机信息检索系统
2.4 计算机网络信息检索系统
通过现代通讯网络, 通过现代通讯网络,利用网络信息检索 工具来浏览和检索网上信息的系统 。 因特网环境下的信息资源检索工具逐渐 取代传统的联机检索工具,成为检索工 取代传统的联机检索工具, 具的主流。 具的主流。 利用统一TCP/IP TCP/IP协议的计算机和网络都 利用统一TCP/IP协议的计算机和网络都 可以在因特网上传或下载信息。 可以在因特网上传或下载信息。
9
二、手工信息检索系统
5、几种常用的手工信息检索工具 全国报刊索引》 《全国报刊索引》: 月刊、年报道量>40万条、题录型、 >40万条 月刊、年报道量>40万条、题录型、综合 性检索工具 版本: 版本:自然科学技术版和哲学社会科学版 检索途径:分类途径和著者途径(97以后) 检索途径:分类途径和著者途径(97以后) 以后 著录格式: 题目/作者//刊名. //刊名 著录格式:顺序号 题目/作者//刊名.年.卷
代中——70年代中期) 年代中期) 代中 年代中期
计算机联机信息检索系统( 20世纪 年 世纪60年 世纪
世纪70年 计算机光盘信息检索系统( 20世纪 年 世纪 世纪80年 计算机网络信息检索系统( 20世纪 年 世纪
代中——80年代中期) 年代中期) 代中 年代中期
代中期至今) 代中期至今)
17
18
三、计算机信息检索系统
2.2 计算机联机信息检索系统
联机检索是用户利用计算机终端,通过 联机检索是用户利用计算机终端, 通信网络与联机检索中心的中央计算机 服务器)联机, (服务器)联机,向联机信息中心发出 请求,进行检索的一种检索方法。 请求,进行检索的一种检索方法。 构成:用户检索终端、通信网络、 构成:用户检索终端、通信网络、联机 存取中心。 存取中心。
7
二、手工信息检索系统
3、手工信息检பைடு நூலகம்工具的著录格式
目录: 版物名称--编著者--出版项— --编著者--出版项 目录: 版物名称--编著者--出版项 附注项 题录: 题目/著者//出处 题录: 题目/著者//出处 // 文摘: 题目/著者//出处、 //出处 文摘: 题目/著者//出处、文摘 索引: 知识单元---顺序号(或页码) ---顺序号 索引: 知识单元---顺序号(或页码)
o 2、按照组配方式分为—— 按照组配方式分为—— o 先组式语言 : 在文献信息检索之前 , 表达 先组式语言: 在文献信息检索之前,
文献信息内容的标识已经事先组配好了的信 息检索语言。 息检索语言。
o 后组式语言 : 表达文献主题概念的标识 , 后组式语言: 表达文献主题概念的标识,
在编制检索语言词表和标引文献时, 在编制检索语言词表和标引文献时 , 不预先 规定组配关系, 规定组配关系 , 在进行检索时用户根据检索 需要, 需要 , 按照组配规则临时组配起来的信息检 索语言。 索语言。
3
一、信息检索系统概述--功能 信息检索系统概述-输入功能、 输入功能、存贮功能 处理功能、 处理功能、输出功能 传输功能、 传输功能、控制功能
4
一、信息检索系统概述--类型 信息检索系统概述-根据信息存贮和检索所设备和手段 的不同, 的不同,信息检索系统可分为两大 类型, 类型,即:
手工信息检索系统 计算机信息检索系统
11
二、手工信息检索系统
5、几种常用的手工信息检索工具 中文核心期刊要目总览》 《中文核心期刊要目总览》: 北京大学图书馆和北京高校图书馆 期刊工作研究会主持的国社科基金 项目成果 各专业核心期刊
12
二、手工信息检索系统
5、几种常用的手工信息检索工具 全国新书目》 《全国新书目》:
及时报到国内新书出版情况的刊物。 及时报到国内新书出版情况的刊物。 1950年创刊 目前月刊。 年创刊, 1950年创刊,目前月刊。 结构:书情评论、新书导读和书目信息。 结构:书情评论、新书导读和书目信息。 检索: 检索:分类目次表 著录:书名--著者--出版地--出版社---著者--出版地--出版社--出版 著录:书名--著者--出版地--出版社--出版 时间--总页数-- 开本--ISBN号--定价--简 --总页数 --ISBN 定价-时间--总页数-- 开本--ISBN号--定价--简 介
24
二、信息检索语言的基本类型
按构成原理分: 1、按构成原理分:
表述文献外表特征的语言 表述文献内容特征的语言
25
二、信息检索语言的基本类型
表述文献外表特征的语言—— 表述文献外表特征的语言—— 题名语言: 按文献题名字顺逐字排检, 题名语言 : 按文献题名字顺逐字排检 ,
西文起首冠词一律不排。 西文起首冠词一律不排。
20
三、计算机信息检索系统
2.3 计算机光盘信息检索系统 以大容量的光盘为存储介质, 以大容量的光盘为存储介质,利用光 驱和计算机实现对光盘数据库的读取 和检索的系统。 和检索的系统。 由计算机、 由计算机、光驱和光盘数据库构成 分单机光盘信息检索系统和网络光盘 信息检索系统。 信息检索系统。
21
ESA/IRS系统(欧洲) 世界上第3 ESA/IRS系统(欧洲):世界上第3大.欧洲最大的联机 系统 检索系统、100多个数据库 半数与DIALOG 多个数据库、 DIALOG重复 检索系统、100多个数据库、半数与DIALOG重复 STN系统 美日德):国际科技信息网络、200多个数 系统( ):国际科技信息网络 STN系统(美日德):国际科技信息网络、200多个数 据库 OCLC系统 系统( 联机计算机图书馆中心、80多个数 OCLC系统(美): 联机计算机图书馆中心、80多个数 据库、 30多个数据库有原文 据库、有30多个数据库有原文
(期).页码 ).页码
10
二、手工信息检索系统
5、几种常用的手工信息检索工具 中国农业文摘》 《中国农业文摘》:
81年创刊、85年起分7 81年创刊、85年起分7个分册 年创刊 年起分 刊期、类型:双月刊、 刊期、类型:双月刊、文摘型 检索途径:分类、主题、 检索途径:分类、主题、著者 著录格式: 著录格式:分类号 顺序号 题目 /作者 刊名, // 刊名, -年,卷(期). -页码 文摘正 (文摘员 文摘员) 文…… 图x 表x 参x (文摘员)
第二章 信息检索基础知识
第一节 信息检索系统 第二节 信息检索语言 第三节 信息检索原理 第四节 信息检索技术 第五节 信息检索策略
1
第一节 信息检索系统
一、信息检索系统概述 二、手工信息检索系统 三、计算机信息检索系统
2
一、信息检索系统概述--概念 信息检索系统概述-信息检索系统是指由一定的设备和信 信息检索系统是指由一定的设备和信 息集合构成,具有一定存储、 息集合构成,具有一定存储、检索与传 送技术设备, 送技术设备,提供一定的存贮与检索方 法及检索服务功能的工作系统。 法及检索服务功能的工作系统。 广义的信息检索系统包括了信息的存 广义的信息检索系统包括了信息的存 贮和检索的系统。 贮和检索的系统。 狭义的信息检索系统就是信息检索工 狭义的信息检索系统就是信息检索工 具。
15
三、计算机信息检索系统
1、计算机信息检索系统的构成 主机、检索终端、通信设备、 硬件设备 :主机、检索终端、通信设备、 输入输出设备 系统软件、应用软件、 软件设备 :系统软件、应用软件、数据 库
16
三、计算机信息检索系统 2、计算机信息检索系统的类型
年代中期) 初——60年代中期) 年代中期 世纪50年代 计算机单机信息检索系统(20世纪 年代 世纪
28
二、信息检索语言的基本类型
3、按照规范化程度分为—— 按照规范化程度分为—— 规范化语言:又叫受控语言, 规范化语言:又叫受控语言,是一种有
14
二、手工信息检索系统
5、几种常用的手工信息检索工具 中国国家书目》 《中国国家书目》:
系统报道一个国家出版的所有文献。1985年 系统报道一个国家出版的所有文献。1985年按国际标准和国内标准进行著录,标引规范。 按国际标准和国内标准进行著录,标引规范。 除收录中文普通图书外, 除收录中文普通图书外,还包括少数民族语文 图书, 由正文和索引2 图书, 由正文和索引2部分组成
22
第二节 信息检索语言
一、信息检索语言概述 二、信息检索语言的基本类型 三、常用信息检索语言 四、信息检索语言的新发展
23
一、信息检索语言概述
信息检索语言是人们在加工、 信息检索语言是人们在加工、存储 及检索信息时所使用的标识符号; 及检索信息时所使用的标识符号; 信息检索语言是索引款目所使用的 标识系统; 标识系统; 信息检索语言可以是对自然语言作 规范化处理后的词汇与技术语言, 规范化处理后的词汇与技术语言, 也可以是某类事物及其某方面特征 的代码。 的代码。
相关文档
最新文档