001-信息检索第一章

合集下载

001-信息检索__第一章

001-信息检索__第一章
1.1.3 网络环境下的信息变化
1.1.3.1 因特网对信息的影响 1. 特网引发了信息新的出版形式——网络出版,形成了 新型的网络信息资源 2. 因特网使人类传统的信息交流方式发生了根本性的变 化 3. 特网推动了信息处理技术发展
1.1.3.2 网络环境下信息的新特点 1. 信息类型多样化 2. 信息的数量和内容都得到了极大的丰富 3. 信息在分布上呈现出明显的分散性 4. 信息共享程度提高
11
第1章 信息检索基础
1.2.4 信息检索的历程
信息检索的发展与人们信息需求的增长以及现代信息技 术的进程紧密相关。追溯时间发展的脉络,信息检索的发展 经历了手工检索阶段和计算机检索阶段: 1.2.4.1 手工检索 直接发源于图书馆的参考咨询工作和文摘索引工作。主 要检索工具是纸本工具书。 1.2.4.2 计算机检索 随着计算机技术和网络技术的发展,计算机检索经历了 脱机检索、联机检索、光盘检索和网络检索四个阶段。在当 今网络环境下,计算机检索将发挥更大的作用,更好地满足 人们日益增长的文献信息需求。
8
第1章 信息检索基础
1.2 信息检索 的原理和概念
1.2.1 信息检索的概念
信息检索从广义的角度讲,包含 信息存储和信息获取两个过程。 信息存储指通过对大量无序信息 的选择和收集著录和标引等方法,建 成各种各样的信息检索工具或信息检 索系统,使之成为有序化信息集合的 过程。 信息获取是存储的逆过程,其实 质是根据特定的需求,运用已组织好 的检索系统,将特定的信息查找出来。
22
第1章 信息检索基础
1.5.1.2 漏检率(Omission Factor)和误检率(Noise Factor) 漏检率指漏检相关文献信息量与检索系统中相关文献信 息总量的比率,它与查全率相对应。具体公式如下: 漏检率=[漏检相关文献信息量/检索系统中相关文献信息 总量]×100%=(c/a+c)×100% 误检率指误检(检出不相关)文献信息总量与检出文献 信息总量的比率,是衡量信息检索系统误检程度的尺度,与 查准率相对应。 误检率=[误检文献信息量/检出文献信息总量]×100%= (b/a+b)×100%

信息检索第一讲

信息检索第一讲

相对于老式社会旳信息环境,如今
人类面正确主要问题不是信息知识旳匮 乏和停滞,而是信息总量旳无限膨胀。
人类正在从信息时代向知识时代过
渡。两者旳区别在于,信息时代人们要 不断获取信息,知识时代更要旳是对信 息旳处理,即把信息转化为知识。
在当代社会,编辑出版业属
于知识产业、文化信息产业旳构 成部分。
《中国大百科全书·新闻出版 卷》:“当代出版物是出版工作 旳成果和产品,是积累文化旳主 要工具,又是传播思想、知识、 信息旳主要媒介。”
第一讲 当代出版与信息素养
课程纲领
1、概论2、中文信息检索 3、汉语词语检索4、百科知识、专科知识检索 5、典故、引言检索6、古今图书信息检索 7、报刊资料信息检索8、古今人物信息检索 9、地名和地方文件检索 10、综合资料信息检索
11、古今纪年及编年资料检索
一、当代出版旳信息环境
所谓信息社会,即“信息成为与 物质和能量同等主要甚至愈加主要旳资 源,整个社会旳政治、经济和文化以信 息为关键价值而得到发展旳社会。”
问卷:
1、除了《新华字典》《当代汉语词典》,你 还查阅过哪些辞书?
2、你是否了解《说文解字》旳编排体例? 3、请列举三部中国古代类书。 4、列举几种你懂得旳常用文件信息数据库? 5、你是否使用过网络版古籍检索系统?如有 请列举一二。
早在1984年, 《教育部有关筹备编辑专 业旳报告》中就对编辑人才旳规格问题 做出了明确旳要求:“ 具有熟练查证工 具书旳能力, 要懂得一点考据学,懂得 使用多种工具书, 懂得当代化知识旳储 存和使用。”
进入90年代以来信息检索课程 在编辑出版专业普遍展开
国外诸多学院旳出版方向旳专业 也开设了类似旳课程
从编辑活动旳流程来看, 编辑熟练掌 握信息检索旳措施与技巧, 对于掌握每一 环节旳编辑规律, 自如从事编辑工作, 提 升书刊质量等, 具有十分主要旳意义。

信息检索 ppt 第1章 绪论

信息检索 ppt 第1章 绪论

信息需求集合
当人们为完成某一任务时,经常觉得缺少的某些知识,即信 息需求。
匹配与选择
需要一种匹配机制。 匹配机制的主要功能:能够把信息需求集合与信息资源集合 依据某种相似性标准进行比较与判断,选择出符合用户需要 的信息。
第 1章 概
1.1 1.2 1.3 1.4 1.5 1.6
述Hale Waihona Puke 信息、知识、文献 信息的特征及类型 信息检索概念和原理 信息检索类型 信息检索的主要研究问题 信息检索的发展历史
信息检索类型
按检索内容不同
文献检索
以文摘、题录、全文 为检索对象。
数据检索
以数据为检索对象
事实检索
以事实、概念、思想、 知识等非数值信息为 检索对象
文献检索
以文献(包括文摘、题录或全文)为检索对象的 一类信息查询活动。是一种相关性检索,不直接回答 用户所提的问题本身,只是提供有关的文献供参考。 典型的文献检索
二次文献
(书目文献、索引、文摘)
是以一次文献为依据加工整理而形成的信息,是对一次信息的浓缩 或有序化产物。如:目录、文摘、索引等。 特点:为查找一次文献提供线索,具有系统性、工具性特点。
三次文献
对零次文献、一次文献、二次文献进行分析研究,加工提炼和概括 综合而形成的信息。如:综述、述评、进展报告、学科年度总结等。 特点:信息量大、综合性强、系统性好。
查找某出版社2008年出版图书的信息; 查找某公司在全球哪些地区设立了分公司、分公司地址、员工 数、主要负责人等。
数据检索
是指查找用户所需特定数据的检索。可以利用专门的数据 库进行检索。例如: 我国第五次人口普查中全国汉民族的人数。
狭义的信息检索仅指信息的查找,是指从信息集

文献检索-第一章 概论(100829修改)共41页

文献检索-第一章 概论(100829修改)共41页
从一次文献到二次文献、三次文献是一个从 分散到集中、从无序到有序、从片面到全面的文 献加工过程。
从信息检索的角度看,一次文献是检索对象, 二次文献是检索手段,三次文献是信息研究的成 果。
二、按载体形式划分
文献按载体形式划分,可以分为:
(一)印刷型文献
以纸张为载体,以手写、石印、油印、铅印、 胶印、影印等为手段来记录信息、知识,这是传 统文献的基本形式,包括各种图书资料、连续出 版物(期刊、报纸等)、学位论文、专利、标准、 会议文献、政府出版物及其复印品等。就目前来 说,印刷型文献仍然是知识传播的主要形式。
缩微型文献的优点是:信息存储密度高,体 积小,容易管理,使用方便,它在某种程度上克 服、弥补了印刷型文献的不足。缩微型文献的缺 点是:保管条件要求严格,难以普及;必须借助 于缩微阅读机或其他辅助设备阅读,不便携带。
(三)音(声)像型文献
音像文献是指以磁性材料或感光材料为 载体,直接记录声音和图像,可以闻其声, 见其行,给人以直观的感觉。它在协助进 行科学观察、传播知识方面有独特的作用。 随着计算机多媒体技术的不断发展和提高, 这方面的文献已经越来越多。
信号,息即消息,通过信号带来消息就是信息。
信息具有差异和传递两个要素。信息是物 质存在的反映,不同的物质各自发出不同的信 息。根据发生源的不同,信息一般可以分为自 然信息、生物信息、机器信息和人类信息四大 类。
我们这里讲到的“信息”一词属于“人类 信息”的范畴。信息必须依附于一定的物质形 式,即载体传递,如文字、声波、电磁波等。
• 文献(Document)是记录有用知识的 一种载体。
• 凡是用文字、图形、符号、声频、视频 等记录下来,具有存储和传递知识功能的一 切载体都称为文献。
• 从文献的定义可以看出,文献的范畴是 非常广泛的。从古代的甲骨文、碑刻、竹简、 帛书到近代的图书、报纸、期刊,直到近几 年大量出现的机读资料、缩微制品、电子出 版物等等都是文献,它们都是文献的不同载 体形式。

信息检索课件

信息检索课件

02
信息检索基础
布尔模型
基于逻辑运算符的模型,将查询词与文档进行简单的匹配,常用 符号包括 AND、OR、NOT。
聚类分析
将相似的文档聚集成一类,根据文档之间的相似度 进行分类,有助于缩小检索范围。
决策树模型
基于决策树的分类模型,通过训练样本建立一棵决策树,用 于预测新样本的类别。
03
信息检索相关技术
语义理解能力不足
传统的信息检索技术主要基于关键词匹配,无法很好地理解用户的真 实意图,这在很大程度上影响了检索结果的准确性和相关性。
语义网的发展
语义网的概念和应用
语义网是一种基于XML技术的互联网应用,它可以将互联网 上的文档统一转化为计算机可读的格式,从而使得计算机能 够更好地理解文档内容,提高信息检索的准确性。
F1得分
• F1得分:是查准率和查全率的调和平 2 (查准率 查全率) / (查准率 + 查全率)。
平均倒数排名(MRR)
• MRR:是一种衡量排序效果的指标,将所有相关文档按照 排序位置的倒数平均值进行加权,再求和得到。公式为: MRR = 1 / (1/第一相关文档 + 1/第二相关文档 + ... + 1/ 第N个相关文档)。
文本预处理
01
02
03
文本清洗
去除文本中的标点符号、 停用词、拼写错误等冗余 信息,提高文本的可读性 和信息含量。
分词技术
将文本切分成词汇单元, 便于后续的词频统计和语 义分析。
词性标注
对词汇进行语法标注,有 助于理解词汇在句子中的 角色和语义。
倒排索引
基本原理
倒排索引是一种基于词汇 表的索引结构,每个词汇 对应一个包含该词汇的文 档列表。

文献检索第1章 信息知识概述PPT课件

文献检索第1章 信息知识概述PPT课件

• d. 人力知识(Know-who)——人力资源的知识
我国学者提出“知识=6W+IQ” 隐性知识
e. 时间知识(Know-when)
只可意会,不可言传的经验。
f. 空间知识(Know-where)
g. 数量知识( Know-quantity)
知识经济中三大类重要知识: 科技知识(事实、原理、技能)
21世方纪有—关—情知况识以经及济对发其展判断,经的情济成报按情果是内报”战容、。略和军资性事源质情,分报定,主、义科要为有技“情政获报治取。情他报、
我国情报学界比较一致的定义:情报是那些对于 用户有用的、经过传递,到达用户的知识或信息。
9
些进展。但是,
他在们当都前是,从凡统是计能和计够量用的计角算度机,进从“行信电息子的化功或能数”来字化处 理定的义信,息可,以并在未信正面息回网答络“上信传息本输身的是,什都么可”的称问为题信。息。
2
(2) 信息的总体概念与运动趋势
①信息的总体概念和内容--
可用信息分类系统图概括:
3
②信息的运动趋势 (3)信息的意义
对信息进行重组、提炼和升华,才能形成知识。
对信息进行理性认识即构成知识。
5
(2) 知识的分类
显性知识,可用语言表达的。
世界经济合作与发展组织(OECD)的划分:"4W"
• a. 事实知识( Know-what)——关于是什么的知识
• b. 原理知识( Know-why)——原理规律的科学理论
• c. 技能知识( Know-how)——技能技巧的知识
近代与现代——泛指一切最新的情信息况的报价道值.例不如是:信科息学本技身术,情也报不。在
20 报世是纪在70特年定代的—时—间情、报特重定在于 握的决你信状策是息态知否后下识掌对,的握信传研了息递究这的给。一思特钱信考定学息,对森,依象定而据的义在信有:于息"用情你所掌进

1信息检索初步-第一讲

1信息检索初步-第一讲

实际上,任何一种音信和消息,任何一个系统传 输和处理的对象,都不外乎是关于某一事物或某 些事物的本质属性或非本质属性的反映,因此, 信息的日常用语含义与科学术语含义、狭义含义 与广义含义是相通的。
二、信息的特点 (1)普遍性。信息广泛存在于自然界、人类社会及 思维领域之中,人之间、机器之间、人机之间、 动留心皆信息,欧元、钱包。 (2)客观性。信息虽然看不见、摸不着,但是它对 于人类,确实是可以被人感知、被人处理、被人 利用的,它对于自然界确实是可以被信息接受体 所接受、可以对接受体产生作用的,所以信息是 客观存在的。
我国台湾学者用 “资讯”。
英、美、法等国使用Information一词。
日本用“情报”。 “信息”一词的使用虽然已相当普遍,但到底什 么是“信息”,众说纷纭。目前其定义有几十种 ,这些定义从不同侧面反映了信息的属性和特征 。
日常用语,信息就是人们熟知的“音信、消息” 。亲友书信、朋友电话、报刊新闻、电视报道、 单位通知等,均会给我们带来有关的信息。 科学术语,则有狭义于广义之分。 广义指“事物属性的表征”,包括事物表现出 的各种各样的性质和特点,如状态、外形、构造 、成份、声音、滋味、运动、变化、与其他事物 的联系等。 狭义指“系统传输和处理的对象”,如通信系 统传递的信号、计算机系统输入输出的数据、企 业管理系统使用的资料、大众媒介系统采播的新 闻等。
信息检索
张 怀 涛
2013-11
人一出生就生活在信息的海洋里,人的一生都离 不开信息。在人类生存和发展的过程中,信息是 人们进行沟通、交流的纽带。自从20世纪40年代 人类发明了计算机、创造了信息论之后,就开始 逐步进入了信息社会。信息社会是一个需要不断 学习和创新的社会,因而信息对个人的成长、组 织的发展、社会的进步,更为至关重要了。 1972年5 月,联合国教科文组织国际教育发展委 员会在《学会生存——教育世界的今天和明天》 一书中说:“特别在现代社会中,我们通过变化 日新、数量日多的渠道接受了大量的信息。如果 我们要确切地处理这些信息,我们就要具备系统 的知识、才智和技能。”

信息检索 第一章 基础知识

信息检索 第一章 基础知识
网络资源与信息检索
为什么要学呢?


我们走吧!





了解这个国家(现状、政治、经济、文化、景观) 网络检索 图书检索 期刊检索 出国流程 护照办理(准备材料、网上预约) 签证 (准备材料、签证经验、申请递交) 选择交通工具 制定线路 订酒店



确定所需信息 选择检索策略 找到信息 分析信息 修改检索策略 使用信息

信息、情报、知识和文献的关系
信息是生产知识的原料,知识是被人类系统 化后的信息,文献是存储、传递知识信息的载体。
文 献
情 报
知 识
信 息
信息的传递渠道
●非正式过程
表现为个人的行为特征。对话、通信、演讲、授课
●正式过程 表现为文献流通。借助文献系统进行正式交流
信息检索

信息检索




是指将文献信息按一定的方式组织和储存起来,并能根据用户 的需要取出所需特定信息的整个过程。 数据检索 以文献中的数据为对象的一种检索。如某公式、某化学分子 式等。 事实检索 以文献中的事实为对象,检索某一事物发生的时间、地点或 过程。 文献检索 以文献为对象,查找某个课题的有关文献的一种检索。

确定研究课题:开放获取版权授权模式

调整检索策略:

(开放获取or 开放存取)and (版权or 著作权)and (授权)
培养学生的信息意识,学会在信息 社会中获取信息、分析信息和处理信息 的能力。培养信息意识的一条重要途径 是重视信息素质教育。这是近年来国外 大学教育发展的一个重要趋势。
二、信息的类型及特点

按信息载体的出版编辑特点划分

信息检索课件 第1章 文献基础知识

信息检索课件 第1章 文献基础知识
第一章 文献基础知识
文献信息组织 ——Ⅱ. 基于内容特征
④ 国际专利分类法 (International Patent Classification, IPC )
国际专利分类法是国际上通用的专利文献分类法,通常缩写为IPC号,包括了 与发明创造有关全部技术领域。
包括:部、大类、小类、大组或小组。 部-SECTION(8个) 类号:用大写英文字母A-H表示 类名:概括指出该部范围的内容
版权页
目次页 第一章 文献基础知识
正文页
期 刊 : 实 体 文 献
第一章 文献基础知识
数据库:Science Online
期 刊 : 描 述 数 据
第一章 文献基础知识
Tips:DOI(数字对象标识符)
DOI I. 数字对象标识符 (DOI®) 是一种用于永久标识和交换数字环境中
知识产权的系统。 II. 输入唯一的 DOI 代码可快速查找特定记录
文献信息组织
请思考 如何实现文献有序化?
第一章 文献基础知识
文献信息组织 ——Ⅰ. 基于外部特征
外部特征是文献上标明的、显而易见的特征。一般包括题目、作者、作者单 位、代码(ISBN号、ISSN号、专利号、标准号、DOI)、出版社等。












第一章 文献基础知识
封面
期 刊 : 实 体 文 献
类号:小类类号+“1-3位数字”+“/”+“00”
类名:在小类范围内限定对检索有用的技术主题范围
例如:A41D 3/00 外套 ○ 小组-SUBGROUP
类号:小类类号+“1-3位数字”+“/”+非“00”的两位数字

信息检索第一章

信息检索第一章

信息检索第一章(没有重复标题,直接开始正文)信息检索第一章信息检索(Information Retrieval,简称IR)是指从大规模的、非结构化的信息集合中,快速找到满足用户需求的相关信息的过程。

本章将介绍信息检索的基本概念、原理以及常用技术,并分析其在实际应用中的重要性和挑战。

一、信息检索的概念和原理信息检索是一种通过计算机系统对文本数据进行搜索的技术。

它主要依靠关键词匹配和相似度评估来实现。

用户通过输入查询词(关键词),系统通过对预先建立好的索引进行搜索和匹配,最终返回与用户需求相匹配的文档列表。

信息检索的原理主要包括以下几个方面:1. 文档预处理:对文本数据进行分词、去除停用词、词干提取等操作,以便后续的索引构建和查询过程。

2. 索引构建:将预处理后的文本数据构建成索引,常用的索引结构包括倒排索引、向量空间模型等。

3. 查询处理:对用户输入的查询词进行处理,包括分词、查询扩展、相似度计算等操作。

4. 相似度计算:根据用户查询词和文档的关键词匹配程度、权重等,计算文档与查询的相似度。

5. 结果排序和评价:根据相似度,对返回的文档列表进行排序,并根据评价指标(如查准率、查全率等)评估检索效果。

二、信息检索的技术信息检索涉及多个技术领域,下面介绍其中一些常用的技术。

1. 分词技术:将连续的文本数据切分成单词或短语,是信息检索的基础步骤。

2. 查询扩展技术:根据用户查询词的意图,自动扩展查询词,以提高检索效果。

3. 相似度计算技术:常用的相似度计算方法包括余弦相似度、TF-IDF等。

4. 近似搜索技术:如基于编辑距离的拼写纠错、基于近似匹配的模糊搜索等,提高了检索的鲁棒性。

5. 排名算法:根据文档与查询的相似度,使用不同的排名算法对文档进行排序,以便用户更快地找到相关文档。

三、信息检索的应用和挑战信息检索在各个领域都有着重要的应用,包括互联网搜索引擎、文本分类与聚类、问答系统等。

它为用户提供了便捷、高效的信息查询服务,使得海量的信息得以充分利用。

信息检索第一、二讲

信息检索第一、二讲

1、Sellis T. Performance of DBMS implementation of production systems. Proceedings of the 2nd International IEEE Conference on Tools for Artificial Intelligence. Herndon, VA USA, 6-9 Nov.1990, (Alamitors, CA, USA:IEEE Computer Society Press 1990), 393-9
技术报告
技术报告(Sci-Tech Report):也称科 技报告、研究报告,它是科学研究工作和开 发调查工作成果的记录或正式报告,这是一 种典型的机关团体出版物。 技术报告的特点是内容新颖、详细、专 业性强、出版及时、传递信息快,每份报告 自成一册,有专门的编号(即报告号,通常 由报告单位缩写代码+流水号+年代号构 成),发行范围控制严格,不易获取原文。
识别特征:一般有书名、作者、版次、出 版地、出版社、出版年、总页数(PP)等 项目,有时还有国际标准书号ISBN 。
1、J.K. White,Relaxation techniques for the simulation of VLSI circuits,Kluwer Academic Pulishers,Boston,MA,x+202pp,1987. [ISBN 0-898-38186-X]
4、Electrodynamics of particles and plasmas. Redwood City, CA, USA:Addison-Wesley (1990) ,xx+457 pp. [ISBN 0 201 51500 8]

信息检索课件ppt

信息检索课件ppt
用知识资源。
信息检索的发展历程
传统信息检索阶段
主要依赖于手工检索,如图书 馆目录、卡片等。
计算机信息检索阶段
随着计算机技术的发展,人们 开始利用计算机进行信息检索 。
网络信息检索阶段
互联网的普及使得信息检索技 术得到了广泛应用,搜索引擎 等网络信息检索工具应运而生 。
个性化信息检索阶段
随着大数据和人工智能技术的 发展,个性化信息检索逐渐成 为研究热点,如推荐系统等。
信息检索课件
目录
• 信息检索概述 • 信息检索基础 • 信息检索相关技术 • 信息检索评价 • 信息检索前沿技术 • 信息检索应用案例
01
信息检索概述
定义与概念
定义
信息检索是指通过一定的方法和 手段,从大量的文档、数据中查 找出与用户需求相关的信息,并 将结果呈现给用户的过程。
概念
信息检索主要关注如何有效地从 海量的信息中筛选出与用户需求 相关的信息,它强调的是对大规 模数据的处理和挖掘能力。
用户。
推荐系统
个性化推荐
通过分析用户的浏览历史、购买记录等个人信息 ,推荐系统能够为用户提供个性化的推荐。
实时性
推荐系统能够根据用户的最新行为进行实时推荐 ,以提供更准确的结果。
考虑用户反馈
推荐系统通常会考虑用户的反馈,以调整其推荐 策略和提高用户满意度。
数字图书馆
资源丰富
数字图书馆拥有大量的电子书籍、期刊和论文等资源,能够满足 用户的学术需求。
混合搜索算法
结合基于关键词匹配和基于权重的搜索算法,提高搜索准确率和召 回率。
机器学习在信息检索中的应用
特征提取
利用机器学习算法从文本中提取 特征,如TF-IDF(词频-逆文档频
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
17
第1章 信息检索基础
1.4.2 常用法
指利用检索系统来查找信息的方法,这是目前查找信 息的最常用的方法,故而称常用法。常用法包括顺查法、 倒查法和抽查法。
18
第1章 信息检索基础
1.4.3 追溯法
指从已有的文献信息后所列的参考文献入手,逐一追 查原文,从这些新查到的原文后面所附的参考文献再逐一 追查,不断扩大检索范围的检索方法。其优点是:在没有 检索工具或检索工具不齐全的情况下,借助此种方法,也 可以查到一批有关的文献。其缺点是:原文作者引用的参 考文献是有限的,不可能列出全部有关文献,而且有的引 用文献又与原文关系较小或较远,参考价值不大。单独使 用这种方法,还是存在一定的局限性。
9
第1章 信息检索基础
1.2.2 信息检索的原理
信息检索的分类
文献检索 Document Retrieval
数据检索 Data Retrieval
事实检索 Fact Retrieval
10
第1章 信息检索基础
1.2.3 信息检索的意义
1. 信息检索是有效利用信息资源、实现其最大价值的 科学方法
2. 信息检索是再学习的工具,是获取知识的有效途径 3. 信息检索能有效地提高科研工作的效率,节省人力
物力及时间
11
第1章 信息检索基础
1.2.4 信息检索的历程
信息检索的发展与人们信息需求的增长以及现代信息技 术的进程紧密相关。追溯时间发展的脉络,信息检索的发展 经历了手工检索阶段和计算机检索阶段:
1.2.4.1 手工检索 直接发源于图书馆的参考咨询工作和文摘索引工作。主要 检索工具是纸本工具书。
19
第1章 信息检索基础
1.4.4 综合法
也有人称之为分段查找法、循环法或交替法。先利用 检索工具查出一定时期内的一批有用的文献,然后依据这 些文献后所附的参考文献,利用追溯法查出前一时期的文 献,如此分期分段地交替使用上述两种查找方法,直到满 足要求为止。这种方法兼有上述两种方法的优点,可以查 得全面而准确的信息,适合于查阅那些过去年代内文献量 较少的专业,并可弥补因检索工具不全而造成的漏检,检 索效果较好。
1.1.3 网络环境下的信息变化
1.1.3.1 因特网对信息的影响 1. 特网引发了信息新的出版形式——网络出版,形成了 新型的网络信息资源 2. 因特网使人类传统的信息交流方式发生了根本性的变 化 3. 特网推动了信息处理技术发展
1.1.3.2 网络环境下信息的新特点 1. 信息类型多样化 2. 信息的数量和内容都得到了极大的丰富 3. 信息在分布上呈现出明显的分散性 4. 信息共享程度提高
20
第1章 信息检索基础
1.5 信息检索 效果
1.5.1 信息检索效果评价
信息检索效果是指信息检索系统 检索的有效程度,它衡量了检索结果 对用户需求的满足程度,是检索系统 性能的直接反映。
据美国学者克莱弗登的研究,评 价信息检索效果的指标主要有六个: 收录范围、查全率、查准率、响应时 间、用户负担和输出形式。
直接浏览法也称直接查找法,指检索者不依靠任何检 索工具或检索系统,从本专业最新核心期刊或其他文献中 直接阅读原文或浏览最新目次而获取文献的方法。这是一 种最常见的信息资源的获取方式。因为编制检索工具需要 时间,有的半年,甚至长达一年之久,直接浏览可以及时 获得最新文献。但利用这种方法查找的信息不全面、不系 统、且局限性较大,不能作为查找文献的主要方法。
15
第1章 信息检索基础
1.4 信息检索方法
信息检索的效率与具体的信息检索 方法有很大的关系,运用有效的信息检 索方法能够使用户以最少的时间获得最 满意的检索结果。信息检索方法的运用 离不开各种信息检索系统,总的来说, 检索方法有直接浏览法、常用法、追溯 法和综合法。
16
第1章 信息检索基础
1.4.1 直接浏览法
1
2
3
4
第1章 信息检索基础
1.1.2.2 信息的类型
对信息的分类可以从广义信息和狭义信息两个方面来 进行理解。
A
B
基于广义信息概念 的信息分类
基于狭义信息概念 的信息分类
5
第1章 信息检索基础
基于广义信息概念 的信息分类
依据信息的产生,可以分为社会信息 和自然信息
依据信息的运动状态,可以分为自在 信息、自为信息和再生信息
8
第1章 信息检索基础
1.2 信息检索 的原理和概念
1.2.1 信息检索的概念
信息检索从广义的角度讲,包含 信息存储和信息获取两个过程。
信息存储指通过对大量无序信息 的选择和收集著录和标引等方法,建 成各种各样的信息检索工具或信息检 索系统,使之成为有序化信息集合的 过程。
信息获取是存储的逆过程,其实 质是根据特定的需求,运用已组织好 的检索系统,将特定的信息查找出来。
6
第1章 信息检索基础
基于狭义信息概念的信息分类
按媒体类型分
印刷型信息 缩微型信息 视听型信息 机读型信息
按信息内容分
经济信息、科技信息 政务信息、文化信息 教育信息、军事信息

按信息的加工程度分
零次信息 一次信息 二次信息 三次信息
按信息出版发行特点分
正式出版信息
非正式出版信息
7
第1章 信息检索基础
1.2.4.2 计算机检索 随着计算机技术和网络技术的发展,计算机检索经历了脱 机检索、联机检索、光盘检索和网络检索四个阶段。在当今 网络环境下,计算机检索将发挥更大的作用,更好地满足人 们日益增长的文献信息需求索系统
1.3.1 信息检索 系统的概念
13
第1章 信息检索基础
1.3.2 信息检索系统的构成
1.信息选择子系统 2.信息索引子系统 3.词表管理子系统 4.检索子系统 5.用户同系统之间交互子系统 6.匹配子系统
14
第1章 信息检索基础
1.3.3 信息检索系统的分类
手工检索系统
计算机检索系统
书本式的手工检索系统 卡片式的手工检索系统
光盘检索系统 联机检索系统 网络检索系统
21
第1章 信息检索基础
1.5.1.1 查全率(Recall Ratio)查准率(Precision Ratio) 查 全 率 和 查 准 率 是 由 美 国 佩 里 ( J.W.Pery ) 和 肯 特
(Allen Kent)于50年代中期提出来的,后经不断改进和完 善,至今已成为评价检索效果最常用的两项关键指标。确定 查全率和查准率最常用的方法是有名的2×2表。
相关文档
最新文档