信息检索基础知识
信息检索相关的基础知识
查全率和查准率的评价标准
理论 评价 标准
查 全 率 查 准 率
检出相关文献量
-------------------- ×100% 文献库内相关文献总量
系统文献库中相关文献 总量对于用户来讲几乎无从 得知。由此可见,查全率和 漏检率很难成为用户自我评 价检索效率的准绳
检出相关文献量 -------------------检出文献总量
×100%
经验 评价 标准
通过相关领域从业的人员情况 通过手头掌握的信息资料
布尔逻辑得名于 George Boole,他是考克大学(现爱 尔兰国立考克大学)的英国 数学家,他在十九世纪中叶 首次定义了逻辑的代数系统。 现在,布尔逻辑在电子学、 计算机硬件和软件中有很多 应用。在 1937 年,Claude Shannon 展示了布尔逻辑如 何在电子学中使用。
信息检索相关的基础知识
查全率
查全率是指系统在进行某一检索时,检索 出的相关文献量与系统文献库中相关文献总 量的比率,它反映该系统文献库中实有的相 关文献量在多大程度上被检索出来。
查全率=(检出相关文献量/文献库内相关文献总量) ×100%
例如:在查询系统中进行查询时,查到的与检索要求相关 文献有60条,而此系统中总共相关文献有100条,则查全 率为60÷100×100%=60%
查准率
信息检索技术基础知识讲义PPT(97张)
信息检索技术基础
1
主要内容
2.1 信息检索语言 2.2 信息检索技术 2.3 检索效果评价 2.4 检索词的确定 2.5 信息检索策略及策略式 2.6 信息检索步骤 2.7 科技查新
2
2.1 信息检索语言
• 检索语言:在信息的存储和检索过程中, 为使信息在用户和系统间有效传递,各 种检索工具使用专门的语言体系来描述 信息的内部特征和外部特征,同时要求 用户依此构造检索提问式来进行信息检 索,这种专门的语言体系成为检索语言。
(b) 在检索式中只有and或or前后的检索标识可
以交换;
(c) 检索式中有not时前后检索词不能交换。 备注: ( )必须在半角和英文状态下输入
19
布尔逻辑检索表达式的特点
• 布尔检索表达式式目前信息检索系统中 使用最多的一种方法。 • 优点:表现直观清晰,方便扩检和缩检。 易于计算机实现。 • 缺点:没有反映文献内容(或信息需求) 所涉及的多个概念的相对重要性。没有 反应概念之间的内在语义关系。
5
2.1 信息检索语言
• 标题词语言:是表征文献内容特征的、经过规 范化处理的名词术语(包括词和短语)。
例如:飞机:plane、airplane、aeroplane aircraft 用aircraft来表示所有“飞机”概念,以此作为规范词.使 用aircraft一词的检索结果将包括全部有飞机概念的文 献.
信息检索基础知识考点整理
信息检索基础知识考点整理
●2.1 信息检索的概念与原理
●2.1.1 信息检索的概念(重要)
●2.1.2 信息检索的原理
●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同
的比较与匹配,选取两者相符或部分相符的信息予以输出
●信息检索的类型
●1.文献检索
●2.数据检索
●3.事实检索
●2.1.3 信息检索的意义/作用(重要)
●1.信息检索是有效利用信息资源,实现其最大价值的科学方法
●2.信息检索是再学习的工具,是获取知识的有效途径
●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间
●2.1.4 信息检索的历程
●1.手工检索
●2.计算机检索
●2.2 信息检索系统(重要)
●2.2.1 信息检索系统的概念
●1.信息检索系统的含义
●2.信息检索系统的工作原理
●2.2.2 信息检索系统的构成
●1.信息选择子系统
●2.信息索引子系统
●3.词表管理子系统
●4.用户接口子系统
●5.匹配子系统
●2.2.3 信息检索系统的分类
●1.手工检索系统
●1.书本式的手工检索系统
●2.卡片式的手工检索系统
●2.计算机检索系统
●1.硬件
●2.软件
●3.数据库
●1.参考数据库
●1.书目数据库
●2.指南数据库
●2.源数据库
●1.数值数据库
●2.文本—数值数据库
●3.全文数据库
●4.术语数据库
●5.图像数据库
●6.多媒体数据库
●2.3 信息检索方法(重要)
●1.直接浏览法
●直接查找法
●2.常用法
●顺查
●倒查
●抽查
●3.追溯法
●4.综合法(分段查找法、循环法、交替法)
●2.4 信息检索效果(重要)
●2.4.1 信息检索效果评价
信息检索基础知识
第一章信息检索基础知识
一.概述
1.信息与文献信息
知识的分类:已掌握的知识和需查询的知识。
信息的定义:信息是事物运动的状态与方式,是物质的一种属性,并且借助于一定的物质载体传输和储存。
这里有几个词组需说明:
事物:泛指一切可能研究的对象(包括物质的和精神的)。
运动:泛指一切意义上的变化(机械运动、化学运动、思维运动和社会运动)
运动方式:在时间上所呈现的过程和规律:
运动状态:在空间上所展示的形状和态势。
信息已成为与物质、能量同样重要的三大资源之一。
信息是一种原料,人类接受外界大量信息后,经过实践活动和大脑的思维机制加工提炼后变成有用的知识(知识的认识程度)。
文献:将知识记录并保持在一定的载体上,就形成了文献。文献信息是文献所表达的内载信息,以文字、符号、声像信息为编码的人类精神信息,也是经过人们筛选、归纳和整理后记录下来的信息。科技文献是科学技术研究成果的记录,积累了许多有用的事实、数据、理论、方法和科学假设,反映了科学技术研究的进展和水平,是科学信息的主要来源。
2.信息的特点
(1)普遍性;信息是无处不在,无时不在的,c从宏观的宇宙天体到微观粒子,从自然界到人类社会,万事万物都是信息的母体;
(2)时效性:信息的获得和传送需要时间,信息反映的总是特定时刻事物的运动状态和方式,当人们获得信息后,它反映的是某段时间的事物,是一种历史纪录,如果传递很慢,信息就会失去应有的价值;
(3)传递性:指信息的空间和时间效应,信息可以从一个地方传到另一个地方,从一个时期传到另一个时期;信息的传递决定了信息的可扩散性,信息是通过各种渠道、媒介传播和扩散;
信息检索基本知识
• 代码:包括国际标准书号(ISBN)、国际标准刊 号(ISSN)、元素符号、分子式、专利号、标准 号、报告号、合同号等,在相应的专业领域内有 显著的检索价值 • 引文:引用文献和被引用文献的相互查找。
2、分类语言(分类方法)
000 总论 • 杜威十进分类法 (DDC: Dawey Decimal 100 哲学 Classification and Related Index ):200 是世界上比 宗教 较流行,也比较权威的一种图书分类方法。由美 300 社会科学 国图书馆学家麦维尔·杜威于1876年首创,它由 400 语言学 大类、门、纲、目、子目等组成。 500 纯粹科学 600 技术科学 将全部学科的书刊分为九大类,用1 700 美术 到9间的数字表示,不属于这九类中 800 文学 的图书为第0类。每一大类下再分1 900 历史 到9个子类,依此类分下去。
客观事物本身的运动
事 物 运 动
产生
信 息
人脑 有序化
知 识
用于实践
新 的 信 息
记录在 载体上 文献
传递运用
数据:是对客观事物本身运动的记录,是信息 的原材料。
信息:是有组织的数据,是对数据整理提炼出 来的消息,是知识得以形成和传播的中介,而不 是知识本身。 知识:是对信息的理解与认识。知识是经过精 心研究、领会后的有用信息,是人类对信息加工 处理后的产物。获得知识有赖于获得信息。
信息检索基础知识
授人以鱼
不如授人以渔
二、信息资源检索课要学习的内容有哪些?
第一章:信息检索基础知识 第二章:网络信息检索 第三章:图书信息检索 第四章:报刊信息检索 第五章:特种文献检索 第六章:中文数据库检索 第七章:科技论文写作
三、学习这门课对我们有什么用?
有利于减少重复劳动,提高科研成功率。 有利于节省科研时间,提高科研效率。 有利于为决策提供科学依据。 有利于培养复合型、开拓性人才。 有利于人们进行终身教育和终身学习。
四、信息资源共享
1、信息资源共享的概念 信息资源共享(Information Resource Sharing): 是指图书馆在自愿、平等、互惠的基础上,通过建立图书 馆与图书馆之间和图书馆与其他机构之间的各种合作、协 作、相互协调关系,利用各种技术、方法和途径,开展共 同提示、共同建设和共同利用信息资源,以最大限度地满 足用户信息资源需求的全部活动。
电子型:
定义: 采用高技术手段,将信息存储在磁盘、光盘等一
些媒体中,形成的多种类型的电子出版物。是计算 机对电子格式的信息进行的存取和处理。 优点:
信息量大、存储速度快、查找方便、易于编制二 次文献等。 缺点:
设备昂贵、使用费用高。
例如;光盘、U盘、硬盘等。
多媒体型:
定义: 采用超文本(Hypertext)或超媒体(Hypermedia)
文献加工困难,阅读不方便。
信息检索基础
信息检索基础
信息检索是指通过计算机系统从大规模的信息资源中获取有用的、相关的和准确的信息的过程。在信息爆炸时代,信息检索的重要性越来越突出。本文旨在介绍信息检索的基础知识,包括检索模型、检索评价以及检索技术。
一、检索模型
检索模型是信息检索系统中的基本框架,它描述了用户如何提出查询并获取相关文档。常见的检索模型有布尔模型、向量空间模型和概率检索模型。
1. 布尔模型
布尔模型基于布尔代数,将查询和文档都表示为由逻辑操作符(AND、OR、NOT)连接的词项。用户通过在查询中使用逻辑操作符来指定信息需求,系统根据查询与文档的逻辑关系进行匹配和检索。
2. 向量空间模型
向量空间模型基于向量空间理论,将查询和文档都表示为向量。每个向量的维度是词项,向量的值表示对应词项的权重。用户的查询和文档都被映射到向量空间中,并通过计算查询向量与文档向量之间的相似度来进行检索排序。
3. 概率检索模型
概率检索模型基于概率论,通过估计查询和文档之间的相关性概率来进行检索。常见的概率检索模型有BM25模型和语言模型。BM25模型利用词项频率和文档长度进行计算,语言模型则将检索看作是从语言模型中生成查询和文档的过程。
二、检索评价
检索评价是衡量信息检索系统效果的重要方法,常见的评价指标有召回率、准确率、F1值和平均准确率(MAP)。
1. 召回率
召回率是衡量检索系统找到相关文档比例的指标,计算公式为:召回率=找到的相关文档数/相关文档总数。召回率越高,系统找到相关文档的能力越强。
2. 准确率
准确率是衡量检索系统返回的文档中真正相关的比例的指标,计算公式为:准确率=真正相关的文档数/返回的文档总数。准确率越高,系统返回的文档质量越高。
信息检索基础知识
课题检索的类型:
查全型:开题报告、综述等 查准型:在具体细微的专业问题方面的研究 动态型:新技术、新理论的研究 查新型:同类研究项目比较
信息检索效果的评价
评价指标: 查全率(检全率)
检出相关文献量 检全率 100% 系统中相关文献总量
查准率(检准率)
检出相关文献量 检准率 100% 检出文献总量
策略的能力
信息检索的分类
根据检索对象形式的不同,信息检 索分为:
文献检索:课程重点
数据检索
事实检索
主要检索系统类型
联机检索(online search) 脱机检索(offline search) 光盘检索(CD search) 网络检索(Interne/Web search) 全球数字图书馆系统(digital global system)
What’s searching like? “Finding a needle in a haystack”
信息检索的定义
信息检索
广义的信息检索(信息的存储与查询) 狭义的信息检索
一个匹配( Match)过程 即用户使用检索语言对自己的信息需 求予以描述,并在一定的信息资源 系统中进行描述匹配的过程。
信息检索效果的评价
评价指标: 漏检率
漏检相关文献量 漏检率 100% 系统中相关文献总量
信息(文献)检索基本知识
2019/6/5
DR&PW:\ 检索基础 \ 检索基本技术
20
截词检索
常用的截词符有“?”、“!”、“+”、“$”、“*”等
前方一致 Physic?
中间截断 defen?e
中间一致 ?wave?
后方一致 ?polymer
DR&PW:\检索基础 \ 检索基本技术
21
词间位置检索 定序相连 With,(W) 定序间隔 n Words,(nW )
• 特点(同图书相比) :出版周期短;内容新颖及时;信息 量大;品种多等特点
• 作用:据统计大约有68%的科技信息来自期刊论文。科技期 刊的利用率最高,约占科技文献的84%,因而是最重要的科 技信息源。
2019/6/5
DR&PW:\ 检索基础 \ 信息基本知识
4
文献出版类型 期刊
主要著录特征:作者、文章题名、刊名(或缩写)、年、卷、 期、页码
29
检索策略步骤 3.编制检索提问式
使用适当的检索语言,构造检索表达式。 核心关键:检索词、逻辑关系、检索字段的确定
例1: “河豚毒素的液相色谱分析”——实验设计项目 检索式:关键词=河豚毒素 and 液相色谱
例2: “中学生物教学改革现状”——专题报告
检索式:关键词=(中学 or 初中 or 高中) and 生物 and 教学改革
信息检索基础知识
16
三、计算机信息检索系统 2、计算机信息检索系统的类型
计算机单机信息检索系统(20世纪50年代 初——60年代中期) 计算机联机信息检索系统( 20世纪60年 代中——70年代中期) 计算机光盘信息检索系统( 20世纪70年 代中——80年代中期) 计算机网络信息检索系统( 20世纪80年
7
二、手工信息检索系统
3、手工信息检索工具的著录格式 目录: 版物名称--编著者--出版项—
附注项 题录: 题目/著者//出处 文摘: 题目/著者//出处、文摘 索引: 知识单元---顺序号(或页码) 注意:期刊论文的文献出处包括:
刊名---年---卷---期---页码
8
二、手工信息检索系统
36
4.主题检索语言4
单元词语言
单元词语言是在标题词语言的基 础上发展起来的。标题词语言的 语词受标题词表严格限制,单元 词语言采用单元词通过组配来表 达文献的主题概念。
37
5.文献全文语言5
文献全文语言
文献全文语言即完全的自然语言 文献全文语言是在计算机检索的条件下实现的 计算机进行全文自动抽词标引,生成倒排文档。 支持布尔逻辑检索、位置逻辑检索、字符串检
4、手工信息检索工具的著录对象 目录:单位出版物 题录:单位出版物中的单篇文献 文摘:单位出版物中的单篇文献 索引:单位出版物或单篇文献中的知
信息检索-检索基本知识
19.6.22
信息检索(information retrieval) 广义:指将信息按一定的方式组织
和存储起来,并根据信息用户的需要找 出有关的信息的过程和技术。它的全称 叫信息存储与检索(information storage and retrieval)。
信息检索
存储 检索
19.6.22
2.标题词: 是从文献的题目和内容中抽出,经过规范化 处理的主题语言。Ei的《SHE》、CA的《SIG》 3.元词:最小、最基本的词汇,可进行字面组配。(多用 于机械检索)
4.叙词:是以表达文献 主题内容的概念单元为 基础,经过规范化处理, 可进行逻辑组配。
19.6.22
汉语主题词表
19.6.22
分析课题,明确检索要求
选择检索工具,确定检索方法 检
选择检索途径,确定检索标识
索 步
查找文献线索
骤
获取原始文献
19.6.22
提取所需信息
检索类型
1.按存储和检索内容(根据检索对象形式)分: 文献检索:是以文献全文为检索对象的一种检
索。(是最基本、最主要的形式)。
19.6.22
检索类型
TV 水利工程
TH 机械、仪表工业
TJ 武器工业
TK 能源与动力工程
TL 原子能技术
TM 电工技术
信息检索基础知识-主讲:戴 锋
计算机信息检索的发展阶段
脱机检索 (online search) 联机检索(offline search) 联机检索(offline search) 光盘检索(CD search) 光盘检索(CD search) 网络检索(Interne/Web search) 网络检索(Interne/Web search) 全球数字图书馆系统(digital 全球数字图书馆系统(digital global system) system)
信息检索效果的评价
评价指标: 评价指标: 漏检率
漏检相关文献量 漏检率 = × 100% 系统中相关文献总量
Biblioteka Baidu误检率
误检文献量 误检率 = 检出文献总量 × 100 %
影响检索效果的主要原因
信息系统组织结构、检索系统功能 问题 检索策略、检索方法问题
提高检索效果的措施
熟悉各种信息系统特征 认真分析课题需求 灵活掌握检索方法和提高制定检索 策略的能力
信息检索的步骤
分析研究课题 制定检索需求描述 调整检索策略 索取原始文献
信息检索中用户任务
检索
数据库 浏览
信息检索效果的评价
评价指标: 评价指标: 查全率(检全率)
检出相关文献量 检全率 = × 100% 系统中相关文献总量
查准率(检准率)
检出相关文献量 检准率 = 检出文献总量 × 100 %
信息检索基础必备知识点
1、信息检索的定义:是指将信息按一定的方式组织和存储起来,
并根据信息用户的需求找出相关的信息的过程和技术。
信息检索的作用:a:节省查找文献的时间。
b:有利于文献专题查找。
c:克服语言障碍。
2、信息:所有事物的存在方式和运动状态以及关于所有事物的存在方式和运动状态的陈述。
信息的特征:普遍性、客观性、抽象性、依附性、可加工性、传递性、共享性。
信息的作用:(1)信息是人类社会生存的条件,信息是人类社会发展的资源
(2)信息是主客体的中介,信息是思维的材料
(3)信息是组织的保证,信息的管理的基础
(4)信息是决策的依据,信息是控制灵魂
文献的特点:(1)数量急剧增长
(2)内容交叉重复
(3)专业文献出版分散
(4)文献老化加快
(5)文献语种繁多
(6)文献载体形态增加
文献类型:(一)按照载体的形式不同,文献可分为:
1、印刷型
2、缩微型
3、声像型
4、电子型
(二)按照内容、性质和加工深度的不同,文献可分为:
1、一次文献
2、二次文献
3、三次文献
4、零次文献
(三)根据性质、特点和出版形式的不同,文献可分为:
1、科技图书
2、科技期刊
3、科技报告
4、政府出版物
5、会议文献
6、专利文献
7、学位论文
8、标准文献
9、科技档案 10、产品样本
a、主题语言
主题检索语言是用语词来表达文献主题概念,它不管各语词
之间相互关系如何,一律按字顺排列成主题词表,故称主题检索语言。分为标题词语言、关键词语言和叙词型语言三种。
关键词语言:由于关键词语言能适应使用计算机的需要,因而大大加速了文献标引过程,缩短了检索工具出版的时间,便于用来检索最新文献,大大增加了检索点,使用灵活方便。查准率和查全率较低。
信息检索第1单元信息检索基础知识
信息检索基础知识 C_Zhangyh
16
2020/5/12
第一节 信息存储的基本程序与方法
四、信息的描述(著录与标引)
标题词 :主表题述标信引息:主题内容的规范化词(先组式主题法) 元词: 标以引能按信表组息配达主方信题式的息分词主:语题先是的组字式语面主言上题不作法能为和再主后分题组的式标基主识本题词法语
信息描述 = 信息著录与标引
信息检索基础知识 C_Zhangyh
11
2020/5/12
第一节 信息存储的基本程序与方法
四、信息的描述(著录与标引)
信息外表特征是指信息的名称、来源、 加工者、类型及表现形式等内容
期刊论文:题名、作者、出处 图书:书名、作者、出版项
信息检索基础知识 C_Zhangyh
四、信息的描述(著录与标引)
信息著录与标引的标准格式: 1、传统著录 2、机读目录(MACR) 3、元数据著录(Metadata)
信息检索基础知识 C_Zhangyh
18
2020/5/12
第一节 信息存储的基本程序与方法
五、信息的存储
信息存储:将经过加工处理的信息资源 按照一定的方式记录在相应的信息载体 上,组织成系统化的检索系统。
一、信息检索的概念
广义的信息检索,包括: 各类信息检索系统的建设(信息存储) 特定信息的检索(信息检索)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
代中——70年代中期) 年代中期) 代中 年代中期
计算机联机信息检索系统( 20世纪 年 世纪60年 世纪
世纪70年 计算机光盘信息检索系统( 20世纪 年 世纪 世纪80年 计算机网络信息检索系统( 20世纪 年 世纪
代中——80年代中期) 年代中期) 代中 年代中期
代中期至今) 代中期至今)
17
24
二、信息检索语言的基本类型
按构成原理分: 1、按构成原理分:
表述文献外表特征的语言 表述文献内容特征的语言
25
二、信息检索语言的基本类型
表述文献外表特征的语言—— 表述文献外表特征的语言—— 题名语言: 按文献题名字顺逐字排检, 题名语言 : 按文献题名字顺逐字排检 ,
西文起首冠词一律不排。 西文起首冠词一律不排。
28
二、信息检索语言的基本类型
3、按照规范化程度分为—— 按照规范化程度分为—— 规范化语言:又叫受控语言, 规范化语言:又叫受控语言,是一种有
14
二、手工信息检索系统
5、几种常用的手工信息检索工具 中国国家书目》 《中国国家书目》:
系统报道一个国家出版的所有文献。1985年 系统报道一个国家出版的所有文献。1985年按国际标准和国内标准进行著录,标引规范。 按国际标准和国内标准进行著录,标引规范。 除收录中文普通图书外, 除收录中文普通图书外,还包括少数民族语文 图书, 由正文和索引2 图书, 由正文和索引2部分组成
o 2、按照组配方式分为—— 按照组配方式分为—— o 先组式语言 : 在文献信息检索之前 , 表达 先组式语言: 在文献信息检索之前,
文献信息内容的标识已经事先组配好了的信 息检索语言。 息检索语言。
o 后组式语言 : 表达文献主题概念的标识 , 后组式语言: 表达文献主题概念的标识,
在编制检索语言词表和标引文献时, 在编制检索语言词表和标引文献时 , 不预先 规定组配关系, 规定组配关系 , 在进行检索时用户根据检索 需要, 需要 , 按照组配规则临时组配起来的信息检 索语言。 索语言。
(期).页码 ).页码
10
二、手工信息检索系统
5、几种常用的手工信息检索工具 中国农业文摘》 《中国农业文摘》:
81年创刊、85年起分7 81年创刊、85年起分7个分册 年创刊 年起分 刊期、类型:双月刊、 刊期、类型:双月刊、文摘型 检索途径:分类、主题、 检索途径:分类、主题、著者 著录格式: 著录格式:分类号 顺序号 题目 /作者 刊名, // 刊名, -年,卷(期). -页码 文摘正 (文摘员 文摘员) 文…… 图x 表x 参x (文摘员)
5
二、手工信息检索系统
1、手工信息检索系统的类型 期刊式检索工具、 书本式检索工具 :期刊式检索工具、
单卷式检索工具、附录式检索工具 单卷式检索工具、
卡片式检索工具: 卡片式检索工具:
6
二、手工信息检索系统
2、书本式手工信息检索工具的结构
文前部分: 文前部分:目次表 正文部分:目录、题录、文摘 正文部分:目录、题录、 索引部分:分类、主题、 索引部分:分类、主题、著者索引 附录部分: 附录部分:一览表
注意:期刊论文的文献出处包括: 注意:期刊论文的文献出处包括: 刊名--- ---卷---期---页码 ---年 刊名---年---卷---期---页码
8
二、手工信息检索系统
4、手工信息检索工具的著录对象
目录: 目录:单位出版物 题录: 题录:单位出版物中的单篇文献 文摘: 文摘:单位出版物中的单篇文献 索引: 索引:单位出版物或单篇文献中的知 识单元
11
二、手工信息检索系统
5、几种常用的手工信息检索工具 中文核心期刊要目总览》 《中文核心期刊要目总览》: 北京大学图书馆和北京高校图书馆 期刊工作研究会主持的国社科基金 项目成果 各专业核心期刊
Βιβλιοθήκη Baidu12
二、手工信息检索系统
5、几种常用的手工信息检索工具 全国新书目》 《全国新书目》:
及时报到国内新书出版情况的刊物。 及时报到国内新书出版情况的刊物。 1950年创刊 目前月刊。 年创刊, 1950年创刊,目前月刊。 结构:书情评论、新书导读和书目信息。 结构:书情评论、新书导读和书目信息。 检索: 检索:分类目次表 著录:书名--著者--出版地--出版社---著者--出版地--出版社--出版 著录:书名--著者--出版地--出版社--出版 时间--总页数-- 开本--ISBN号--定价--简 --总页数 --ISBN 定价-时间--总页数-- 开本--ISBN号--定价--简 介
19
三、计算机信息检索系统
2.2 计算机联机信息检索系统
全球联机检索系统有200多个,著名的有: 全球联机检索系统有200多个,著名的有: 200多个 DIALOG系统 系统( ):世界上最大的联机检索系统 600多个 世界上最大的联机检索系统、 DIALOG系统(美):世界上最大的联机检索系统、600多个 数据库、3亿多条记录、24小时服务。 数据库、 亿多条记录、24小时服务。 小时服务 ORBIT系统 系统( ):世界上第 大联机检索系统、 100多个数 世界上第2 ORBIT系统(美):世界上第2大联机检索系统、 100多个数 据库、特色为专利数据库。 据库、特色为专利数据库。 BRS系统 系统( 200个左右数据库 侧重医学.药学. 个左右数据库、 BRS系统(美):200个左右数据库、侧重医学.药学.生命科 学等领域
15
三、计算机信息检索系统
1、计算机信息检索系统的构成 主机、检索终端、通信设备、 硬件设备 :主机、检索终端、通信设备、 输入输出设备 系统软件、应用软件、 软件设备 :系统软件、应用软件、数据 库
16
三、计算机信息检索系统 2、计算机信息检索系统的类型
年代中期) 初——60年代中期) 年代中期 世纪50年代 计算机单机信息检索系统(20世纪 年代 世纪
分类号和类名来表达信息的主题概念, 分类号和类名来表达信息的主题概念, 并且按照知识门类的逻辑次序将信息系 统地组织和划分的语言。 统地组织和划分的语言。
主题检索语言: 又称主题法 主题法, 主题检索语言 : 又称 主题法 , 是用
主题词或标题词来表达文献主题概念的 语言。 语言。
27
二、信息检索语言的基本类型
22
第二节 信息检索语言
一、信息检索语言概述 二、信息检索语言的基本类型 三、常用信息检索语言 四、信息检索语言的新发展
23
一、信息检索语言概述
信息检索语言是人们在加工、 信息检索语言是人们在加工、存储 及检索信息时所使用的标识符号; 及检索信息时所使用的标识符号; 信息检索语言是索引款目所使用的 标识系统; 标识系统; 信息检索语言可以是对自然语言作 规范化处理后的词汇与技术语言, 规范化处理后的词汇与技术语言, 也可以是某类事物及其某方面特征 的代码。 的代码。
18
三、计算机信息检索系统
2.2 计算机联机信息检索系统
联机检索是用户利用计算机终端,通过 联机检索是用户利用计算机终端, 通信网络与联机检索中心的中央计算机 服务器)联机, (服务器)联机,向联机信息中心发出 请求,进行检索的一种检索方法。 请求,进行检索的一种检索方法。 构成:用户检索终端、通信网络、 构成:用户检索终端、通信网络、联机 存取中心。 存取中心。
著者语言: 按著者姓名 , 按姓前名后 著者语言 : 按著者姓名,
的字顺逐字排检。 的字顺逐字排检。
号码语言:按文献代码,如专利号、 号码语言:按文献代码,如专利号、
标准号、等的顺序排检。 标准号、等的顺序排检。
26
二、信息检索语言的基本类型
表述文献内容特征的语言—— 表述文献内容特征的语言—— 分类检索语言: 又称分类法 分类法, 分类检索语言 : 又称 分类法 , 是用
9
二、手工信息检索系统
5、几种常用的手工信息检索工具 全国报刊索引》 《全国报刊索引》: 月刊、年报道量>40万条、题录型、 >40万条 月刊、年报道量>40万条、题录型、综合 性检索工具 版本: 版本:自然科学技术版和哲学社会科学版 检索途径:分类途径和著者途径(97以后) 检索途径:分类途径和著者途径(97以后) 以后 著录格式: 题目/作者//刊名. //刊名 著录格式:顺序号 题目/作者//刊名.年.卷
ESA/IRS系统(欧洲) 世界上第3 ESA/IRS系统(欧洲):世界上第3大.欧洲最大的联机 系统 检索系统、100多个数据库 半数与DIALOG 多个数据库、 DIALOG重复 检索系统、100多个数据库、半数与DIALOG重复 STN系统 美日德):国际科技信息网络、200多个数 系统( ):国际科技信息网络 STN系统(美日德):国际科技信息网络、200多个数 据库 OCLC系统 系统( 联机计算机图书馆中心、80多个数 OCLC系统(美): 联机计算机图书馆中心、80多个数 据库、 30多个数据库有原文 据库、有30多个数据库有原文
3
一、信息检索系统概述--功能 信息检索系统概述-输入功能、 输入功能、存贮功能 处理功能、 处理功能、输出功能 传输功能、 传输功能、控制功能
4
一、信息检索系统概述--类型 信息检索系统概述-根据信息存贮和检索所设备和手段 的不同, 的不同,信息检索系统可分为两大 类型, 类型,即:
手工信息检索系统 计算机信息检索系统
13
二、手工信息检索系统
5、几种常用的手工信息检索工具 全国总书目》 《全国总书目》:
收录上一年度我国正式出版的各种出版物 构成:分类目录、专题目录、 构成:分类目录、专题目录、附录 本年度的《全国总书目》 本年度的《全国总书目》相当于上一年度 全国新书目》的总和。 《全国新书目》的总和。 著录: 全国新书目》 著录:比《全国新书目》多分类号和顺序号
7
二、手工信息检索系统
3、手工信息检索工具的著录格式
目录: 版物名称--编著者--出版项— --编著者--出版项 目录: 版物名称--编著者--出版项 附注项 题录: 题目/著者//出处 题录: 题目/著者//出处 // 文摘: 题目/著者//出处、 //出处 文摘: 题目/著者//出处、文摘 索引: 知识单元---顺序号(或页码) ---顺序号 索引: 知识单元---顺序号(或页码)
三、计算机信息检索系统
2.1 计算机单机信息检索系统 计算机信息检索系统的早期形式, 计算机信息检索系统的早期形式, 是将信息检索数据库系统建立在独 立的计算机硬盘上, 立的计算机硬盘上,直接在一台计 算机上进行存储和检索信息。 算机上进行存储和检索信息。 脱机批处理、 脱机批处理、无需终端和通信网 络
三、计算机信息检索系统
2.4 计算机网络信息检索系统
通过现代通讯网络, 通过现代通讯网络,利用网络信息检索 工具来浏览和检索网上信息的系统 。 因特网环境下的信息资源检索工具逐渐 取代传统的联机检索工具,成为检索工 取代传统的联机检索工具, 具的主流。 具的主流。 利用统一TCP/IP TCP/IP协议的计算机和网络都 利用统一TCP/IP协议的计算机和网络都 可以在因特网上传或下载信息。 可以在因特网上传或下载信息。
20
三、计算机信息检索系统
2.3 计算机光盘信息检索系统 以大容量的光盘为存储介质, 以大容量的光盘为存储介质,利用光 驱和计算机实现对光盘数据库的读取 和检索的系统。 和检索的系统。 由计算机、 由计算机、光驱和光盘数据库构成 分单机光盘信息检索系统和网络光盘 信息检索系统。 信息检索系统。
21
第二章 信息检索基础知识
第一节 信息检索系统 第二节 信息检索语言 第三节 信息检索原理 第四节 信息检索技术 第五节 信息检索策略
1
第一节 信息检索系统
一、信息检索系统概述 二、手工信息检索系统 三、计算机信息检索系统
2
一、信息检索系统概述--概念 信息检索系统概述-信息检索系统是指由一定的设备和信 信息检索系统是指由一定的设备和信 息集合构成,具有一定存储、 息集合构成,具有一定存储、检索与传 送技术设备, 送技术设备,提供一定的存贮与检索方 法及检索服务功能的工作系统。 法及检索服务功能的工作系统。 广义的信息检索系统包括了信息的存 广义的信息检索系统包括了信息的存 贮和检索的系统。 贮和检索的系统。 狭义的信息检索系统就是信息检索工 狭义的信息检索系统就是信息检索工 具。