信息检索与实践第1章信息检索基础
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学习信息检索知识,掌握信息检索技能, 有以下几方面的意义。
(1)将大大缩短收集信息的时间,提高信息检 索的准确率。
(2)有助于学生捕捉和把握最新信息,及时 更新知识,提高自身综合素质。
(3)能够促使学生更好地利用图书馆,并在 利用图书馆的过程中不断提高自学能力。
1.3.2 信息检索的类型
信息检索依照不同的标准可划分为不 同的类型。
控制论的创始人维纳(Norbert Wiener )认为:“信息是人们在适应外部世界并且 使这种适应反作用于外部世界的过程中同外 部世界进行交换的内容的名称。”
同时又进一步指出:“信息这个名称 的内容就是我们对外界进行调节,并使我 们的调节为外界所了解时与外界所交换来 的东西。”还说:“信息既不是物质,又 不是能量,信息就是信息。”
常用的信息检索途径有如下5种。
(1)分类途径 (2)主题途径 (3)著者途径 (4)文献名途径 (5)文献原有序号途径
2.信息的属性
信息广泛存在于自然界、人类社会及人类 的思维领域,可以说无处不在,无时不有。
信息具有以下特征。 (1)客观真实性 (2)可存储性 (3)可传输性 (4)可转换性 (5)共享性
1.1.3 知识、情报、文献及其与信息的关系
1.知识
从本质上说,知识属于认识的范畴,有 着丰富的内涵和广阔的外延。
按检索性质或时间跨度不同将信息检索 可分为定题检索和回溯检索两类;按检索信 息形式的不同可将信息检索分为文本检索和 多媒体检索两类;按检索对象的信息组织方 式不同分为全文检索、超文本检索和超媒体 检索;按检索要求不同又可将信息检索分为 强相关检索和弱相关检索两类。
1.3.3 信息检索的方法和途径
1.检索方法
所以说,知识、情报、文献同信息之间 虽有十分密切的联系,但又有明显的区别。
信息、知识、来自百度文库报以及文献之间的逻辑 关系如图1-1所示。
信息
知识
情报
文献 文献
图1-1 信息、知识、情报以及文献之间的逻辑关系
1.2 文献信息基础知识
本节介绍文献信息基础知识,包括信息资 源概念、文献属性与功用、现代文献特征、文 献类型等内容。
(3)循环法
循环法也称分段法或交替法。 它是将常用法和追溯法交替使用的一种 信息检索方法,即先用常用法查找一定时期 内的文献,然后再利用这些文献后所附的参 考与引用文献查找前一时期的文献,分阶段 交替使用两种方法查找文献。
2.检索途径
从浩如烟海的文献中迅速、准确地查找所需 要的文献信息,除了运用科学的检索方法外,还 要选择遵循一定的检索途径。
⑤利用现代化的手段直接通过网络、联机系 统获取的;
⑥通过单位之间、个人之间等渠道相互交换 的。
1.2.4 文献的类型
文献的种类多种多样。
1.按载体和记录手段不同分类
按载体和记录手段不同将文献分为以 下6种类型。
(1)书写型文献 (2)印刷型文献 (3)缩微型文献 (4)机读型文献 (5)多媒体型文献 (6)电子网络文献
1.2.1 信息资源与文献信息
信息的存在与传播有3个基本要素:信 息源、信道、信宿。
信息源即信息的来源,是以信号形式 发出信息的主体。
信息信道是传输信号的通道和媒介。 信宿是信息传送的对象或称信息的接 收者。
1.2.2 文献的属性与功用
如前所述,当代意义上的“文献”包 含如下3个基本要素。
一是包含知识信息。 二是物质载体。 三是记录手段。 文献的产生,是人类进入文明时代的 标志。
我国《辞海(第六版 彩图本)》(2009年 10月出版)中关于信息的解释是:“①音讯; 消息。②通信系统传输和处理的对象,泛指消 息和信号的具体内容和意义。”
信息是指对消息接受者来说预先不知道 的报导”。
《辞海(第六版 彩图本)》(2009年10 月出版)第2556页。
《新华词典(大字本)》(2001年修订 版)对信息的表述是:“①音信;消息。② 信息论中指用符号传送的报道,报道的内容 是接受符号者预先不知道的。③事物的运动 状态和关于事物运动状态的陈述”。
手工检索是以手工操作的方式,利用传 统的书本式或卡片式检索工具进行的信息检 索。
计算机检索时利用计算机及计算机网络 等现代化的设备与手段进行的信息检索,也 就是将大量文献资料或数据进行加工整理, 按一定格式储存在计算机硬盘上,建成机读 数据库,利用计算机对数据库进行分析排检 的检索方式。
3.其他分类
事实检索是以事实为检索对象,即针对 特定的事件或事实进行的检索,包括对事物 的性质、发生的时间、地点、经过等信息进 行检索。
实际上,数据或事实也是信息的一种形 式,而且,用户所需的数据或事实往往也记 录在各类文献中,不可能脱离文献而独立存 在。
2.按检索方式不同分类
按检索方式可将信息检索分为手工信息 检索和计算机检索两类。
知识和情报来自信息,是信息的一部分,是 经过人脑加工后系统化的信息;而信息是知识与 情报的来源,是组成知识与情报的原材料。
信息、知识、情报记录在一定的载体上 就形成文献。
文献承载着知识、情报和信息;知识、 情报、信息通过文献载体得以记录、存储和 传播。
但文献上所记录的知识、信息不全是 情报。
信息、知识、情报也不全是以文献形 式记录。
1.3.1 信息检索的概念及意义
信息检索是信息用户运用一定的方法从 信息载体中查找、获取相关信息的过程。
从信息检索的全过程来看,信息检索具 有广义和狭义两重含义。
广义的信息检索包括两个过程:一是信 息的存储过程,即对有关信息进行选择,对 信息特征进行著录、标引和组织,建立信息 数据库的过程;二是信息的查找过程,即根 据信息检索提问制定检索策略,利用检索工 具和方法从信息数据库中查找所需要信息内 容的过程。
1.2.3 现代文献的特征
1.数量大、增长迅速
由于科学技术的飞速发展,人类所拥有 的知识财富也越来越多,反映在记录知识的 载体方面,则为“文献数量激增”。
2.文种多、形式复杂
世界各国用于记录文献的语言文字符 号是多种多样的。
3.内容广泛、相互渗透、重复交叉
现代文献的内容十分广泛,涉及社会各 个领域。
社会实践是一切知识的基础和检验知识 的标准。
知识(精神性的东西)借助于一定的语 言形式,或物化为某种劳动产品的形式,可 以交流和传递给下一代,成为人类共同的精 神财富。”
2.情报
情报同信息、知识的含义相近。
3.文献
与信息密切相关的另一个概念是文献。 “文献”一词古今含义不同。 在古代,“文献”一词专指有历史价值 的图书资料。
6.文献的来源途径多
由于文献类型的复杂多样,文献的来 源也有多种渠道。
一般有:
①由出版部门正式出版,通过邮局和新华书 店公开发行的;
②利用出版社名义出版,但不通过邮局和新 华书店公开发行的;
③国外原版文献通过正常途径或非正常途径进 入国内的;
④不通过出版部门正式出版,由各学术机构、 研究单位和厂矿企业的组织者自行制作的;
2.按出版形式不同分类
按出版形式不同将文献分为以下4种类 型。 (1)图书 (2)期刊 (3)报纸 (4)特种文献
3.按对信息的加工程度不同分类
按对信息的加工程度不同将文献分为如 下4类。 (1)零次文献 (2)一次文献 (3)二次文献 (4)三次文献
1.3 信息检索概述
本节介绍信息检索概念及定义、信息 检索类型、信息检索的方法及途径。
信息检索与实践
第1章 信息检索基础
本章介绍信息检索基础知识,包括信 息、知识与文献的基本概念与属性,文献 信息基础知识以及信息检索概述,为学习 后续章节的内容奠定基础。
1.1 信息、知识与文献
本节介绍信息、知识与文献的基本概 念以及其相互之间的关系。
1.1.1 信息化与信息素养
在信息化的社会里,人的信息素养的 高低,主要是信息素养教育的结果。
文献内容的广泛分散主要表现在两个方 面。
一是同一专业文献,分散刊登在许多专 业刊物;二是许多学科与专业刊物发表的文 献涉及多个学科领域。
各学科相互渗透体现在以下几个方面。
(1)各学科期刊论文的相互引用。 (2)文献内容重复。 (3)某一专业的科学论文发表在本专业刊物
上的只占一半,另外一半则发表在其他相关 专业的刊物或综合性刊物上。
《辞海(第六版 彩图本)》(2009年10 月出版)对知识的解释是:“人类认识的成 果或结晶。
依反映对象的深刻性,可分为生活常识 和科学知识;依反映层次的系统性,可分为 经验知识和理论知识。
经验知识是知识的初级形态,系统的科 学理论是知识的高级形态。
按具体的来源,知识虽可区分为直接知 识和间接知识,但是从总体上说,人的一切 知识(才能也属于知识范畴)都是后天在社 会实践中形成的,是对现实的能动反映。
4.更新快、时效性强
因为科学的飞速发展,新的学科不断 出现,原有的知识和学科受其影响,不同 程度地在内容上逐渐老化。
随着科学技术的发展,新知识、新理论、 新技术、新产品层出不穷,加速了知识的新陈 代谢,使文献老化加速,文献的半衰期越来越 短。
5.文献的载体形式多样化
在“文献爆炸”的今天,以纸张印刷方 式出版的传统文献虽仍占据主要地位,但因 科技现代化而出现的各种各样的新型载体却 使文献呈现多样化的状态。
其中,快捷的信息获取能力主要是通
过掌握信息检索的知识和技能来实现的, 因此,学习信息检索的知识和技能就成为 信息素养教育的重要内容之一。
1.1.2 信息的定义及其属性
1.信息的定义
“信息”一词,英语为information,有 知识、资料、数据、情报、消息等多种含义。
信息论的创始人香农(C.E.Shannon )在《通信的数学模型》中提出了“狭义 信息论”,将信息定义为“用于减少随机 不确定性的东西”,也是说信宿(信息接 收者)未接到某种消息前不知道信源(信 息发出者)发出什么消息,只有在收到消 息后才能知道消息的内容,用于消除信源 的不确定性的东西就是信息。
为了能迅速、准确地从文献中找到所需要 的信息,必须了解和掌握科学的检索方法,目 前,常用的信息检索方法有如下3类。
(1)常用法
常用法也称工具法或一般查找法,是利 用检索工具查找文献信息的一种最常用的方 法。
常用法在具体操作时又根据查找顺序或 查找范围分为顺查、倒查和抽查3种方法。
(2)追溯法
追溯法是利用已知文献后所附的“参 考文献”或“引用文献”进行追溯查找的 一种信息检索方法。
4.信息、知识、情报、文献之间的关系
将信息、知识、情报、文献之间的关 系描述如下。
信息是事物发出的、体现事物存在和 运动状态的信号和消息。
信息经过人脑的加工使之系统化而成为 知识。
知识与信息之间是一种互动关系,知识 创造需要信息,而相关信息的开发也需要知 识的应用。
反映特定时间对特定对象有利用价值的特定 信息或知识构成情报。
如今,“文献”的外延和内涵都已发 生变化,以现在的应用看来,文献是“记 录知识的一切载体”,即凡是储存了信息 和知识的各种载体都称之为文献。
需要强调的是文献是以文字、图形、符 号、音频、视频等技术手段记录人类知识的 物质载体。
文献有3个基本要素:一是文献含有的知 识信息;二是负载知识信息的物质载体;三 是记录手段。
1.按检索对象不同分类
按检索对象的不同,可将信息检索分 为文献检索、数据检索和事实检索3类。
文献检索,也称文献信息检索,是以文 献为检索对象,从各种文献中查找用户所需 的信息内容。
数据检索则是从各种数值数据库或统计 数据库中个查找用户所需数据信息的检索, 包括数据图表、商品的市场行情、设备的型 号与规格、物资的材料成分、材料的物理与 化学特性等,是一种确定性检索。