《信息检索》知识点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5、《信息检索》若干问题
金燕******************
一、信息检索的基本概念
(一)信息
1、什么是信息
●信息的概念,至今众说纷纭
●信息是不确定性的消除
●信息是负熵
●信息是客观事物自然性状的外露和表现
●信息不是物质,也不是能量,信息就是信息
2、信息的特征:
(1)客观性与普遍性(2)流动性与传递性
(3)多样性与综合性(4)相对性与有效性
(5)积累性与价值性(6)时效性
3、信息与其他相关概念的关系
●数据是信息的载体
●知识是正确的信息
●情报是知识中的一部分,知识+人的背景、思维方式
4、信息的类型
(1)按信息的加工程度:一次信息、二次信息(目录、文献、索引等)、三次信息(评论、年鉴、百科全书、指南等)
(2)按信息的表现形式:文字信息、音频信息、视频信息、实物信息等。(3)按信息的出版类型:图书、期刊、报纸、会议论文等、网络信息、
5、信息的载体类型
(1)印刷型(如纸)
(2)缩微型(如缩微胶片、缩微胶卷)
(3)声像型(如录音带、录像带)
(4)电子型(指采用电子型载体。如光盘、软盘、网络载体等)
(二)信息检索
1、信息检索的概念
信息检索是从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。
广义上,它包括存储与检索两个方面。
侠义上,仅仅指信息检索的过程。
信息的存储主要包括对在一定专业范围内的信息选择基础上进行信息特征描述、加工并使其有序化的过程,目的是建立有序信息集合。
信息的检索是借助一定的设备与工具,采用一系列方法与策略从数据库中查找出所需信息的过程。
信息检索的本质就是信息检索系统对信息集合与信息需求的匹配与选择。
2、信息检索的基本原理
二、信息检索的基本类型
●根据存储和检索的内容:文献信息检索、数据信息检索、事实信息检索
●根据检索的工具:手工检索、缩微品检索、计算机检索、(脱机检索、光盘
检索、联机检索、网络检索)
●根据所检信息的形式特征:文本信息检索(TREC国际著名文件检索会议
Text REtrieval Conference)
△文献信息检索
●文献信息检索是指从文献信息集合中查找所需文献或文献中包含的信息内
容的过程
●通常指的是检索系统存储的是以二次信息为对象(目录、索引、文摘)的
信息,它们是文献信息的外部特征与内容特征的描述集合体。
●检索信息线索而非信息本身
△数据信息检索
●是指检索系统中存储的是数值型数据
●如统计年鉴、人口数据、气象数据等类型
△事实信息检索
●是指检索系统存储的是从原始文献中抽取的关于某一事物(事件、事实)
发生的时间、地点和过程等方面的信息。
●它是数值信息和系统数据信息的混合。
●如MIS数据库中包含大量的人员、工资、销售统计、预测等信息。
文献信息检索的相关问题(6点):检索语言兼容与整合的研究、数据库与文档的研究、有关检索系统的研究、检索策略的研究、网络搜索工具研究、检索服务的研究
(1)文献信息类型演化及其结构形态
●文献信息:以语言、文字、数据、图像、声音、视频等方式记录在特定载
体上的信息。
●零次文献:第一手的不公开发表的灰色文献。
●一次文献:正式出版发表的期刊论文、会议文献、发明专利、科技报告等。
●二次文献:目录、索引、文摘等(是一次文献的序化)
●三次文献:书目之书目、文献指南、综述等。
(2)文献信息的揭示与组织
●文献信息特征揭示与组织是描述文献内、外表特征,使其成为文献线索,
并将这些线索按逻辑结构排列、组织起来。
●内部特征是:表征文献实质意义的特征,如主题词(叙词、单元词、关键
词)、分类号、化学符号等;外部特征是:文献上显而易见的,一般情况下不反映文献实质意义的那些特征,如书名(题名、篇名)、人名、各种符号标识(专利号、标准号、报告号等)、机构名等。
●方法:主题法分类法
△分类法
●分类法是一种以直线性序列组织与揭示文献的方式。
●体系分类法是一种直接体现知识分类的等级制概念标识系统。如杜威十进
分类法、中图法、科图法等
●分类法的优点:a、体现系统性;b、
△主题法
●概念
●包括标题法
●汉语主题词表医学主题词表
(3)文献特征的描述
著录、标引、主题词、关键词、分类号、实质内容、题名、著者、外部特征(4)信息检索系统
●信息检索系统:是根据一定社会需要和为达到特定的信息交流目的而建立
的一种有序化的信息资源集合体。拥有选择、整理、加工、存储、检索信息的设备与方法,并能向用户提供信息服务。
●信息检索系统的发展历程:手工检索系统、联机检索系统、光盘检索系统、
网络检索系统
△文献信息检索系统
●文献信息检索系统的要素构成
IRS=信息资源+设备+方法与策略+人员
●文献信息检索系统的系统构成
IRS=选择子系统+ 词表子系统+标引子系统+查寻子系统+匹配子系统+用户与系统之间的交互子系统
△联机检索系统P290
●联机检索系统:是指用户在计算机检索系统的终端上,通过通信网络,使
用特定的指令和算符,以人机对话方式,查询远程计算机检索系统核心的数据库,从中获取所需信息的计算机检索系统。
●特点:速度快、效率高;信息资源丰富、质量高;可及时提供最新信息;
检索费用高
●比较著名的联机检索系统:Dialog OCLC
△光盘检索系统P37
●借助高密度光盘,进行信息检索的计算机检索系统。
●特点:存储量大、易保存、便携带、可套录,有限花费、无限检索,可存
储几十年甚至上百年。
●缺点: