信息存储与检索课堂笔记
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章信息检索概论
1.信息的定义:
从认识论出发,我国大多数学者认为:
信息具有物质属性,是物质的一种存在形式,它以物质的属性或运动状态为内容,并且总是借助于一定的物质载体传输或存储。
2.信息的特征:
(1)传递性
(2)时效性
(3)共享性
(4)客观性
其他的特性还有开发性、存储性、价值的不定性、变换性、可伪性等。
3. 信息检索(Information Retrieval)
定义:
广义概念——是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,故全称:“信息存储与检索(Information Storage and Retrieval ) 。
狭义概念——仅指上述过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。
4.信息检索的基本步骤
课题分析,明确检索范围
选择检索系统和检索工具
确定检索点和检索途径
构造检索式
选定检索方法
索取原始文献
5.计算机检索的发展历程
计算机检索是在计算机技术和通信技术发展的基础上建立起来的。它产生于20世纪50年代,发展于80年代中期,90年代后随着国际互联网技术的发展而进入了一个崭新的时期。发展历程大致可以概括为:
手工信息检索阶段(1954之前)
脱机信息检索阶段(1954/1964)
联机信息检索阶段(1965/1971)
光盘信息检索阶段(1972/1994)
网络信息检索阶段(1995年至今)
6.知识的定义
人们通过实践对客观事物及其运动过程和规律的认识。在这里,知识作广义的理解,包括消息、情况、事实、数据。
知识可分为理性知识和感性知识。理性知识,是对客观事物的本质和规律性的认识,是经过思维、逻辑加工的知识,构成知识体系;感性知识,是对客观事物的描述和对现象、事实的感知,是未经逻辑加工的知识。
知识的分类
知识按不同标准可作如下分类:
依照反映对象的深刻性和系统性程度,知识分为生活常识和科学知识;
按知识的成熟程度,分为经验知识、理论知识。
按领域:哲学知识、社会科学知识和自然科学知识;
按用途:科学知识、技术知识、文化知识;
按水平:低级知识、中级知识和高级知识;
按性质,普通知识、专业知识;
按载体:隐性知识、显性知识。
7.文献的定义和分类
文献是记录有知识和信息的一切载体,是固化在载体(纸张、光盘)上的知识。文献是物化的精神产品,或者说,文献是知识信息的物化形态。其中,信息内容是文献的知识内核,载体材料是文献的存在形式和外壳,而符号系统和记录方式则是二者联系的桥梁和纽带。这4个要素相互联系就构成了文献的四维框架结构。
文献的分类
根据其内容性质和加工程度的不同,文献可分为以下四个级别:
(1)零次文献:未经出版发行的文献,包括手稿、个人通信、原始记录等。
(2)一次文献:首次出版的各种文献,也称原始文献。如期刊论文、科技报告、会议论文、专利说明书等。一次文献是以科研生产活动的第一手成果为依据而创作的文献,内容丰富,参考价值大,是我们利用的主要对象。
(3)二次文献:报道和查找一次文献的检索书刊,如各种目录、题录和文摘等。二次文献是图书情报工作者在大量收集原始文献的基础上,经过分析、归纳、重组后出版的。二次文献是一次文献的集约化、有序化的再次出版,是贮藏、利用一次文献的主要的、科学的途径。(4)三次文献:利用二次文献提供的线索,选用大量一次文献的内容,经综合、分析和评述再度出版的文献,如各种述评、进展报告、动态综述、手册、年鉴和百科全书等。我们使用的各种教科书也属三次文献。
文献按存储载体可分为:
(1)印刷型:通过铅印、油印和胶印等手段,将知识固化在纸张上的一类文献。例如,图书、期刊以及各种印刷资料。它的主要优点是便于阅读和流传,缺点是体积大,信息密度低。(2)缩微型:以印刷型文献为母本,采用光学摄影技术,把文献的影像固化在感光材料上的一类文献。常见的缩微型文献有缩微平片和缩微胶卷两种。这种文献的优点是体积小,信息密度高,缺点是阅读必须借助阅读机或利用缩微复印机。
(3)声像型:一种非文字形式的文献。常见的有各种视听资料,如唱片、录音带、电影胶片、激光声视盘(CD-ROM)、幻灯片等。这类文献记录声音和图像,通过唱机、录音机、录像机、放影机和投影机等予以重现,可以使人闻其声、观其形。
(4)机读型:由于计算机广泛应用而产生的一种新文献。常见是各种已录有内容的磁带、磁盘和光盘。这种文献的存贮、阅读和查找利用都须通过计算机才能进行,所以既有信息量大、查找迅速的优点,又有设备昂贵、使用费用高的缺点。
按出版方式,文献可分为:
图书Book
期刊Periodical
报纸Newspaper
专利文献Patent Literature
会议文献Conference Literature
科技报告Scientific & Technical Report
学位论文Dissertation for Academic Degree
政府出版物Government Publication
产品样品资料Product Sample Book
ArchivesRecords、Music Score、Map等都是文献家族中的重要成员。
在科技查新工作中利用较多的是美国国家技术信息服务局NTIS(The National Technical Information Service of the U.S Deportment of Commerce)出版的《美国政府研究报告通报与索引》,有数据库和检索刊物以及缩微平片等多种形式可利用。
检索国内学位论文可以利用《中国学位论文数据库》,检索国外学位论文可利用Dialog国际联机系统或国际大学缩微胶卷公司(University Microfilms International)编辑出版的《国际学位论文文摘》、《美国博士学位论文》以及《学位论文综合索引》等检索工具。
8.信息、文献、知识三者的关系:
三者之间的联系:
(1)信息概念不仅包括人与人之间的消息的交换,而且还包括人机之间、机器与机器之间的消息交换,以及动、植物界信号的交换。
(2)知识是人类通过加工吸收信息,对自然界、人类社会以及思维方式与运动规律的认识与掌握,是人的大脑通过思维重新组合的系统化信息的集合。
(3) 文献是记录有知识和信息的一切载体
三者之间转换:
(1)物质运动发出信息;
(2)信息经人脑加工变成知识;
(3)知识被记录形成文献、被传递成为情报;
9.检索工具和检索语言
1. 检索工具概念及作用
检索工具泛指查找信息所使用的一切工具和设备,包括检索工具书、穿孔卡片、电子计算机等。是附有检索标识的某一范围文献条目的集合,是二次文献。
检索工具的作用:
1)报道作用
2)存储作用
3)检索作用。
2 .检索工具基本类型
按照信息加工的手段或设备划分:
(1)手工检索工具;(2)机械检索工具;(3)计算机检索工具。
按照信息载体形态划分:
(1)书本式检索工具,包括期刊式、单卷式和附录式;
(2)卡片式检索工具;
(3)缩微式检索工具;
(4)磁性材料式检索工具。
按收录范围划分:
(1)综合性检索工具;(2)专科性检索工具;
(3)专题性检索工具;(4)全面性检索工具;
(5)单一性检索工具。
按时间范围划分:
(1)预告性检索工具;(2)现期通报性检索工具;