计算机信息检索重点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息检索
数据(Data):泛指所有描述事物的形貌、特性、状态或任何其他属性的数字、文字或符号。一般指原始,未处理过的数据。
信息(Information):1. 物质存在的一种方式。一般指数据、消息中所包含的意义。可以使消息中所描述的事件的不定性减少。
2. 是事物运动的状态与方式的反映。
知识(Knowledge):A、是在改造世界的实践中所获得的认识和经验的总和。
B、是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的
有组织的陈述。提供某种经过思考的判断和某种实验的结果。
(信息是知识的原材料,知识是信息加工的抽象化产物。)
情报(Information):钱学森:“情报是活化了的、激活了的知识”。可以理解为是指传递着的有特定效用的知识或信息。
三要素:知识性、传递性、效用性
文献(Literature):记录有知识的一切载体。
三要素:载体(文献的外部形式,它是知识的包装或运载方式,常称之为媒体(media)。)、知识(反映了文献的信息内容。)、记录(信息的一种人工编码,通过人工、机械以及声、光、电、磁等各种技
术手段生成多种包含知识信息内容的符号,以一定的形态出现,形成各种媒体的文献类型。)
文献对人类文明进步具有重大意义:知识的积累、传播与创造研究成果的确认与评价
信息环境及其认识:信息环境的变化,20世纪90年代中期前,书本时期-----手工检索,缩微时期-----缩微检索,
20世纪90年代后期,光盘时期-----单机检索,网络初期-----联机检索
21世纪,网络兴盛-----网络检索
第一章信息检索原理
一、信息检索的含义(掌握)
广义:信息检索包括信息的存储过程和查找过程;狭义:仅指信息的查找。
二、信息检索的类型
(一、)以检索内容划分(重点)
1.文献信息检索
凡是利用目录、文摘或索引等二次信息查找某一课题、某一著者、某一地域、某一机构、某一事物的有关信息以及这些信息的出处和收藏单位等,都属于文献信息检索范畴。其检索的结果是文献信息
2.数据信息检索(Data Retrieval)
凡是利用参考工具书、数据库等检索工具检索包含在文献中的某一数据、参数、公式或化学分子式等,统称为数据信息检索。其检索结果为数据信息。
3.事实信息检索(Fact Retrieval)
凡是利用百科全书等检索工具从存储事实的信息系统中查找出特定事实的过程称为事实信息检索。其检索结果是基本事实。
文献信息检索是一种相关性的检索,检索的结果是文献线索,还必须进一步查找才能检索到有关的一次信息;数据与事实信息检索是一种确定性检索,检索的结果是可供用户直接利用的信息。一般情况下,文献信息检索通过二次信息来实现,而数据与事实信息检索则通过三次信息来完成。
(二、)以信息存储和检索的方式和技术划分(掌握)
1.手工检索(Manual Retrieval)
手工检索简称“手检”,是指人们通过手工的方式来存储和检索信息。其使用的检索工具主要是书本型、卡片式的信息系统,即目录、索引、文摘和各类工具书。检索过程是由人工以手工的方式完成的。
2.计算机检索(Computer-based Retrieval)
计算机检索简称“机检”,是指人们利用数据库、计算机软件技术、计算机网络以及通信系统进行的信息存
储和检索,其检索过程是在人机的协同作用下完成的。
三、信息检索的意义(重点)(会用自己的语言表达)
1. 避免重复研究或走弯路—科学技术的发展具有连续性和继承性,闭门造车只会重复别人的劳动或者走弯路。
2. 节省研究人员的时间
3. 是获取新知识的捷径
一、检索工具的定义(了解)
1.用来揭示、存储和查找信息的工具,主要指手工检索工具。
2.检索系统则是由一定的检索设备(如计算机)和经过加工整理并存储在相应载体(如磁带、磁盘等)上的信息集合及其他设备共同构成的一种具有存储和检索功能的信息服务系统。
二、检索工具的类型(了解)
目录目录款目
索引索引款目
文摘
1、目录
综合性目录:是以各个学科门类的图书或者报刊文献为揭示对象的目录。如《全国总书目》、《中国国家书目》、《中国报纸名录》、《中国期刊名录》等。
(1)专题目录(2)馆藏目录(3)联合目录
2、索引(Index)
(1)索引是指将信息中所包含的主题词、分类号、著者姓名、论文题名等内容摘录出来,并注明它们所在图书、期刊或检索工具中的位置,然后按照一定的规则编排组织起来所形成的检索工具。如《工程索引》(Ei)的“主题索引”、“著者索引”等。
(2)索引条目至少有两个著录项目:标目(标识Heading)和存储地址,有时候可能还会有说明语。主题索引、著者索引是最常用的索引。
3、文摘(Abstract)
(1)文摘就是对一份文献的内容所进行的简略而准确的描述。通俗地讲,文摘就是原始文献的内容摘要。它是将论文或书籍的主要论点、数据和结论等信息简明扼要地摘录出来,注明出处,并按一定方式编排的一种文献检索和阅读工具。它是检索工具的主体,二次信息的核心。美国的《工程索引》(Ei)和英国的《科学文摘》(SA)等均属此类检索工具。
(2)文摘通常以一个内容上独立的文献单元(如期刊中的一篇论文、会议录中的一篇会议论文或一种图书)为基本著录单位(见第五章《工程索引》文摘款目的样页)。它和目录的主要区别在于:目录以单位出版物为著录对象,而文摘的著录对象可以是一个单位出版物,也可以是单位出版物的个别内容;目录反映的是文献的外部特征,而文摘既反映文献的外部特征,又反映文献的内容特征。
三、信息检索的方法(掌握):1、常规法2、追溯法3、交替法
(一)常规法:常规法就是利用检索工具查找信息的方法,因在信息检索中经常使用而得名。它又分为顺查法、倒查法及抽查法三种。
⏹顺查法——顺查法即是利用检索工具、根据课题研究的起始年代由远及近逐年查找信息的方法。顺查法比较费时间,但由于是逐年查找,因而有较高的查全率。
⏹倒查法——倒查法与顺查法相反,它是利用选定的检索工具由近及远、逐年逐卷地进行查找信息的方法。当检索者的要求是获取近期文献时,最好采用倒查法。倒查法的查准率较高,查全率比顺查法低。
⏹抽查法——抽查法是针对课题研究所处的发展高峰阶段进行的信息检索,它往往用来解决要求快速检索的课题。抽查法有较高的检索效率,但使用该方法的前提是必须事先了解该研究课题的历史背景。
(二)追溯法:追溯法又称引文法,主要有以下两类。
1.传统追溯法——它是利用一次信息所附的参考文献进行追溯查找的方法。检索时可以先查找出几篇与课题有关的专著或述评(这类文献往往附有大量的参考文献,多时可达上百篇),以此作为起点进行检索。
2.引文追溯法——它是一种由远及近的检索方法,即找到一篇与课题有关的论文后进一步查找该论文被哪些文献引用过、是否有人对该领域做过进一步研究、实践结果如何、最新的进展怎样等。由远及近地追寻,信息愈来愈新,研究也就越深入。这种方法主要依靠专门的引文索引,如《科学引文索引》(SCI)、《社会科学引文索引》