信息检索复习资料

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息检索第一讲

一、基本概念

1、信息:生物以及具有自动控制系统的机器,通过感觉器官和相应的设备与外界进行交换的一切内容。信息具有五个基本特种:普遍性、依附性、传递性、信息价值的不定、共享性

2、知识:是人们对客观事物的认识和经验总和。

3、文献:是用文字、图形、符号、音频、视频等技术手段记录人类知识的一种载体。

4、情报:是指运用一定的形式,传递给用户,并产生效益的知识或消息。具有:知识性、传递性、效益性

5、信息资源

广义上是指信息活动中各种要素的总称,既包含信息本身,也包括信息相关的人员、设备、技术和资金等因素;

狭义上是指各种载体和形式的信息的集合,包括文字、音像、印刷品、电子信息、数据库等。

文献是最主要的信息资源。

一、信息类型

1、按照加工程度:

零次信息:草稿、笔记、会议记录等

一次信息:期刊论文、专利说明、会议论文、科技报告、学位论文

二次信息:目录、索引、文摘、新书通报等

三次信息:词典、名录、手册、年鉴、书目、评论、专著、教科书、论文丛集、百科全书等

2、按照出版形式以及载体:

图书

连续出版物:期刊、报纸、年度出版物等

特种文献:科技报告、会议文献、政府出版物、专利文献、标准文献、公司产品资料、学位论文、档案资料等

1)图书:

ISBN 国际标准书号

例如:ISBN978-7-302-20062-8

在参考文献列表里,图书著录格式如下

著者.书名[M]. 版本. 出版地:出版者,出版时间.

(多作者用逗号分开,超过3个者用“等”)

叶继元.信息检索导论.北京:高等教育出版社,1995.

2)期刊:

是最重要的信息源。

国际标准刊号( ISSN )

期刊著录格式:

作者. 题名[J].刊物名称,年代,卷数(期数):页数

刘志强.我国农业生态环境可持续发展评价及对策[J].农业系统科学与综合研究,2001,17(3):24~26.

核心期刊:少数刊载某一学科大量高质量专业论文的期刊。

三、我国信息系统体系结构

图书馆系统(高校图书馆、公共图书馆、科学研究系统图书馆)、科技信息服务系统、档案系统、专利系统、标准系统

图书馆系统主要服务方式有:

文献外借服务(如个人外借、预约借书、馆际互借等)、

文献阅览服务、

文献复制服务、

信息咨询与检索服务、

用户教育与辅导、

信息研究服务、

网上信息服务(如网上公共目录查询、网上预约服务、网上咨询服务、利用电子邮件提供信息服务、文献传递服务)

信息检索第二讲

1、信息检索的概念

狭义的信息检索是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献信息的过程。

广义的检索包括信息的存储和检索两个过程

2、信息检索的作用

信息检索是获取知识的捷径

信息检索是科学研究的向导

信息检索是终身教育的基础

3、信息检索的类型:文献检索、全文检索、数据检索、事实检索、多媒体检索、图像检索、超文本检索

4、检索语言的作用

•组织文献信息的著手点

•检索文献信息的入口

检索语言主要由文献特征构成。

1)描述文献的外表特征:题名、责任者、标准编号(ISBN、ISSN、专利号等)、出版社、出版时间、参考文献、分类号

2)描述文献内容特征:学科分类、主题、观点、见解、结论

5、检索方法

常规法和引文法

常规法包括:顺查法、倒查法、时间抽样法

引文法包括:追溯法和检索引文法

6、检索途径:

一般来讲分为:主题途径、分类途径、著者途径和其他途径。

1)主题途径:

是采用反映文献主题概念的检索词作为检索入口的一种检索途径,也是最常用、最重要的检索途径。

主题词就是表达主题概念的词汇。广义主题词包括关键词、主题词、标题词、叙词。

2)分类途径:

分类途径就是人们常说的分类号检索。这种检索是根据信息内容的学科分类来进行的。一般说来,可以提高查全率。

3)著者途径:

著者途径是指根据已知文献著者来查找文献的途径,它根据的是著者索引,包括个人著者索引和机关团体索引,排列规则是“姓+名”次序。

7、信息检索的程序

是指根据课题要求,选择相应的信息检索工具及系统,采用适当的途径及技术,查找所需文献信息的过程。信息检索的程序一般可以分为:

1)分析研究课题

2)选择检索工具或数据库

3)确定检索途径

4)编制检索式

5)实施检索

6)原始文献的获取

8、计算机检索技术

布尔逻辑算符组配检索

逻辑“或”(和)

→→扩大查找范围

用符号“or”或“+”表示,其逻辑表达式为:

A or

B 或 A+B

其意义为检索记录中凡含有检索词A或检索词B,

或同时含有检索词A和B的,均为命中文献。

逻辑“与”

→→缩小查找范围

用符号“and”或“*”表示,其逻辑表达式为:

A *

B 或 A and B

其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。逻辑“非”

用符号“not”或“-”,其逻辑表达式为:

A not

B 或 A-B

其意义为:检索记录中含有检索词A,但不能

含有检索词B的文献,才算命中文献。

注:a检出的相关文献量

b检出的不相关文献量

c未检出的相关文献量

1. 查全率

查全率(R )= ——×100%

查全率是对所需信息被检出程度的信息量指标。

2. 查准率

查准率(P )= ——×100%

查准率是衡量拒绝非相关信息的指标。

9、影响检索效率的因素

数据库质量(客观因素)

1)数据库搜集信息的数量与质量

2)对每条信息揭示的深度与广度,著录标引的质量(字段的数量,主题词的信息标引网罗度)

3)检索途径及检索字段的数量

相关文档
最新文档