文献信息检索基础知识

合集下载

文献信息检索基础知识

文献信息检索基础知识
索书号
1=Biblioteka 主题语言:用自然语言中的名词、词组、句子描述文 献主题概念的检索语言。 主题词:表达文献主题概念的词叫主题词 。当使用主题词来表达文献内容特征时叫主题标引(标识)。 主题语言的优点: 直观 符合人的辩识习惯 专指性强 主题词标识经过严格的规范化处 理,查准率高。 灵活 词与词的概念组配揭示文献中各种主题。 集中性 将不同学科的同一主题文献集中在一起。 例如有关“鲁迅”的文献资料,分类法将其 分散在文学、艺术、文化、历史各个门类 查找费时,而主题法在“鲁迅”标题下,直接 反映出全部有关“鲁迅”的文献资料。
3种逻辑关系的区别
逻辑算符
AND(与)
OR(或)
NOT(非)
检索式
A AND B A * B
F250 物资经济理论 F251 物资管理 F252 物资流通 F253 物资企业 经营与管理 F259 世界各国 物资经济
F251.1 物资管理 体制 F251.2 物资计划 F251.3 物资统计
分类号
类名
+
类目
F251.3 /1 或F251.3 “1”种次号
信息的基本属性
二、基本概念: 1、信息(information)的概念:信息是事物的存在的形式和运动状态的表征 。
知识性或客观性 记录和传播性
目录
CONTENTS
01
信息存储
Add a title
02
Add a title
一次文献:论文等 二次文献:目录、文摘、索引 三次文献:字词典、百科、年鉴
《汉表》 主表的著录格式(例2) Tian zhu ren 天竺人 Sindus; Sindhus “用”项 Y 古印度人 词族索引(例3) 族首词 法(法律) * 一级下位词 . 国际法 04LA 二级下位词 . .国际公法 三级下位词 . . .海洋法

文献检索基本知识

文献检索基本知识

第二章文献检索基本知识一、文献检索的基本概念信息检索:广义:将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。

狭义:指用户找出有关信息的过程。

信息检索的类型(根据不同的检索对象):数据检索:检索的结果是数据。

如某种材料的电阻;某变压器的参数;化学分子式、数据图表等<手册>事实检索:检索的结果是事实结论。

查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等。

如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的<年鉴>文献检索:检索的结果是文献资料。

查找相关文献的内容、出处、收藏单位等。

如系统地查找水压伺服控制阀原理方面的相关文献<论文>自然语言:自然表达某一概念的语言,没有强制性的规定。

通俗地说,就是对于一个概念你想怎么表达就怎么表达。

在文献检索中,关键词(key words)等用的就是自然语言.人工语言:人为规定的概念表达语言。

通俗地说就是对于一个概念你必须使用规定的语言来表达。

在文献检索中,主题词(subject)通常用的就是人工语言图书分类号1、中国图书馆图书分类法(中图法)为全国公共图书馆和信息研究所等机构所采用,是我国通用的综合性书资料分类法。

1973年试用版,1975年第一版,1980年第二版,1990年第三版,1999年第四版。

共分22个大类例如:A马、列、毛、邓B哲学、宗教S农业科学T工业技术TN无线电电子学电信技术TN.3半导体技术中国图书馆分类法(中图法)2、中国科学院图书馆分类法(科图法)目前中科院系统和部分高等院校采用。

1958年第一版,1980年第二版、1994年第三版。

例如:00 马、毛10 哲学20 社会科学总论21 历史历史学73 电技术、电子技术76 冶金学3、中国人民大学图书馆分类法(人大法)部分图书馆和信息资料机构使用该分类法1953年第一版,1980年第五版,1989年第版增订本,1996年第六版例如:1马、列、毛2哲学11工程技术15历史4、国外主要分类法:杜威十进制分类法(Decimal Classification,简称《杜威法》或DC,DDC)国际十进制法(Universal Decimal Classification,简称或UDC)美国国会图书馆图书分类法(Library of CongressClassification,简称《国会法》或LC)概念匹配:计算机计算机电脑微机PC 机文字匹配:计算机计算机电脑电脑微机微机输入输出使用人工语言通常为概念匹配使用自然语言通常为文字匹配四、检索工具定义:是人们用来存储、报道和查找文献的工具。

文献信息检索基础知识

文献信息检索基础知识
第一章 文献信息检索 基础知识
1
可编辑ppt
第1节 文献信息检索的基本概念
一、文献、信息、信息源 1.定义 文献:用文字、图形、符号、声频、视频等技术手段 记录人类知识的一种载体,或理解为固化在一定物质载体 上的知识。
信息:广义地说,信息就是消息。
指对接收者来说预先不知道的报道。(辞海)
是用来通信的事实,在观察中得到的数据、新闻和知 识。(韦氏字典)
10
可编辑ppt
第1节 文献信息检索的基本概念
专利文献(patent document)
专利文献是一切与专利制度有关的专利文件的统称, 如专利申请书和专利说明书、专利公报。
专利说明书是公开的文献,但只能由各国专利局发行, 它反映了当前最新的技术成果。
学位论文(dissertation, thesis) 是作者为获得某种学位而撰写的科学论文。博士论文 具有较高的参考价值: 一般偏重于理论,附有大量的参考文献,借此可以看 出有关专题的发展过程和方向。 学位论文一般不出版发行,而是保存在授予学位单位 的图书馆里。
6
可编辑ppt
第1节 文献信息检索的基本概念
科技图书(Book):对已有的研究成果或生产经验所 作的概括论述。
特点: 带有总结性、成熟定型;出版周期长,信息传 递慢;传授知识,而不是报道最新情报。
图书一般分为两类:
阅读型:教科书、专著等
工具型:字典、百科全书、年鉴、手册
科技期刊(journal, periodic) 特点:名称固定、有连续的卷、年月顺序号、出版周 期短,报道速度快、数量大,内容丰富。 据估计,从期刊获取的科技情报占整个情报来源的 60%-70%。
5
可编辑ppt
第1节 文献信息检索的基本概念

第二章 文献信息检索基础知识

第二章 文献信息检索基础知识
载体是感光材料,如缩微平片、缩微胶卷。 另外,还有一种计算机输出缩微胶片。
这类文献特点是体积小、信息密度高、 轻便,易于传递,保存容易。但使用时必须 借助于放大设备。

电子型文献(Electronic Document)
原称机读型文献。是指以数字化技术将文献
存储在光、磁载体上,通过计算机或网络进行阅

2、学术期刊 (Periodicals,Journal,Magazine):
指有固定名称和统一的出版形式,按一定规律定
期或不定期连续出版的文献载体,与报纸属于称
连续性出版物。
(1)期刊的特征:
统一的刊名,有连续的年、卷、期及页码;
有国际标准连续出版物刊号ISSN (International Series Standard Number) ISSN由8位数字分两段组成,如1000-0135,前7 位是期刊代号,末位是校验号。
(3)期刊著录格式:
作者(多作者用逗号分开,超过3个者用“等或 et al”). 文章题目[J].刊物名称,年代,卷数(期 数):页数 如: Porter MF, Zhang J. An algorithm for suffix stripping. Program, 1980, 14(3):130~137
P:专利文献类别代码
(2)专利文献著录格式
专利申请者.
专利题名:专利国别(或地区), 专利号[P].出版日期. TACHIBANA R, SHIMIZU S, KOBAYSHI S, et al. Electronic watermaking method and system: US, 6,915,001[P]. 2002-04-25.
(1)图书的特征
图书没有统一的开本

第二章文献信息检索基本知识

第二章文献信息检索基本知识
54-16-089 (化学物质登记号)
运算符
1、布尔逻辑运算符(Boolean Operators) 2、通配符和截词符 3、字段限制符

1、布尔逻辑运算符 Boolean Operators
名 称
逻辑 与
逻辑 或
逻辑 非
运算符
AND * OR +
NOT -
逻辑关 系
举例
作用
限定 A AND B 缩小
需求分析
信息源
检索工具 检索方法
检索途径 检索标识
确定学 科范围、
主题概 念。
确定信 息源类 型、 语
种、时 间和空 间范围。
选择数据 库及其文 档、搜索 引擎及网 站。
选择检索 途径
及其检索 标识
制定检索 策略
调整检索 策略
查找文献 线索
索取原始 文献
检索提 问表达 式
根据检索 结果,扩 大或缩小 检索范围, 提高查全 率和查准 率。
以工程索引EI为例,通配符和截词符的检索 表达式及检索结果如下:
算符 *
$
含义
结果
利用它可以输入检索词的起始部分,而 实现一簇词的检索
自动取词根运算符
Alter*可命中 alter,alternando,altern ant,alternate,alternati ve等
$alter可命中 alter,alternate,alterna tive
用检索 工具查 找到文 献线索
馆藏文献借阅、 复制 全文数据库 网上获取 向作者索取
检索提问表达式=检索词+运算符
检索词
分为两类: 字词类:名词术语(如叙词或关键词),或者是个
人或机构名称。 如:行政管理、王平、西安邮电大学等。

文献信息检索

文献信息检索

1.1 文献信息基本知识
• 声像型文献:也称为视听型文献,又称为声像资料、视听资料 和音像制品。它是以磁性材料或者感光材料为存储载体,借助 特定的机械设备直接记录声音信息和图像信息所形成的文献, 如录音带、录像带等。其特点是形象直观、逼真,但是使用时 需要借助一定的设备。
• 机读型文献:是通过一定的技术将文字、图像以及声音等转换 成二进制数字代码,记录在磁性介质或光记录介质载体上,采 用计算机进行阅读、浏览的文献载体。机读文献包括文摘、题 录及全文等各种类型数据库。其特点是一次加工,多次使用, 存储容量大,节省存放空间,易于实现资源共享,是一种很有 发展前途的文献类型。但是检索机读型文献时,必须借助电子 计算机。
• 产品资料:制造厂商为了宣传推销其产品而编制的以介绍产品 性能为主的资料。如产品目录、产品样本(集)、产品说明书、 产品总览和产品数据手册等。其内容大致为已定型产品的性能 与用途、结构原理、使用方法、操作规程和产品规格等。
1.1 文献信息基本知识
• 2.按文献信息的表现形式划分 8)科技档案是科学技术研究和生产建设部门在研究、生产和建
多样性:《韦氏大词典》(美国)注释信息为:信息是通信的 事实,是在观察中得到的数据、新闻和认识。(说明信息的表 现形式可以是数据、消息和新闻等,具有多样性。)
1.1 文献信息基本知识
文献信息资源的构成 可以从不同的角度或层面予以描述和划分,譬如从记录文献
的物质载体、文献信息的表现形态(文献类型)以及文献信息 被加工的详略程度等。 按文献信息的物质载体划分 • 刻写型文献:是指印刷术尚未发明之前的古代文献和当今尚未 付(交付的意思)印的手写记录,以及正式付印前的草稿。如 古代的甲骨文、金文、棉帛文、竹木文以及现如今的会议录、 手稿等。

2文献检索基础知识

2文献检索基础知识
第二章
文献信息检索基 础知识
1
所谓文献信息检索就是根据课题的需要,利 用检索工具和检索系统,按照一定的检索方法和 程序去查找文献信息的过程。 检索原理: 检索就是将“检索提问标识”与存储在检索系 统中的“文献特征标识”进行比较,两种标识基 本相符的,即完成检索过程。
2
•文献检索的概念
检索途径
汉语拼音音节索引 用拼音著录汉字
12
2.按照检索语言所描述的文献信息特征的内容 可分为描述文献内容特征的语言和描述文献 外部特征的语言: 其中前者又可分为分类语言、代码语言、 主题语言(包括关键词、单元词、标题词、 叙词语言等); 后者又可分为书/刊/篇名、著者/团体 著者、引文、代码/序号。
13
(1)分类语言:是一种直接体现知识分类的 等级制概念标识系统,是按照学科范畴划分 而构成的一种语言体系。它能集中体现学科 的系统性,反映事物的从属、派生关系,并 从上至下、从总体到局部层层划分、展开, 是一种等级分明的语言。 分类检索语言通过分类表来体现,一部完 整的分类表大体可由:编制说明、大纲、简 表、详表、辅助表、索引、附录等组成。
6
• 数据和事实检索是要检索出包含在文 献中的具体情报; • 文献检索则是要检索出包含所需要情 报的文献。 • 文献检索是最典型和最重要也是最常 利用的情报检索
7
• 2、根据检索方式 • 手工检索系统由手工检索设备(如书本式目录、文摘、 索引、卡片柜等)、检索语言、文献库等构成。 • 特点:它使用方便,成本低廉,但检索效率和响应时间 均较差。 • 机器检索系统可以分为机械检索系统和计算机检索系统。 • 机械检索系统主要由穿孔卡片、选卡机、机械探针、编 码规则、文献库等构成。 • 计算机检索系统主要由计算机检索设备(光盘检索设备、 微机(脱机)检索设备、联机检索设备、缩微品机检设 备等)、检索语言、文献库等构成。 • 特点:检索效率高,响应速度快等特点,但是成本和检 索费用较高。

第1讲 文献信息检索基础知识

第1讲 文献信息检索基础知识

14
第二节
文献信息资源的类型、特点
(二)连续出版物
1.期刊(Journal Magazine) 是指采用统一名称定期或不定期的连续性出版物。 具有连续的卷、期号或年、月顺序号。 国际标准连续出版物编号:ISSN 国内统一刊号:CN
15
第二节
文献信息资源的类型、特点
2.报纸( Newspaper)
2.学位论文 (Dissertation) 高等学校和科研单位的学生为获取学位而提交的学术 论文。
17
第二节
文献信息资源的类型、特点
3. 专利文献(Patent Document)
指实行专利制度的国家,在专利申请、审批过程中所产生的专利 申请书、专利说明书以及官方文件或出版物。
4.标准文献 (Standards literature)
Z 综合性图书
36
中图分类号>文化、科学、教育、体育 (简表)
G4 教育
G40 教育学 G41 思想政治教育、德育 G42 教学理论 G43 电化教育 G44 教育心理学 G45 教师与学生 G46 教育行政 G47 学校管理 G48 学校建筑和设备管理 G51 世界各国教育事业 G52 中国教育事业 G53/57各国教育事业 G61 学前教育、幼儿教育 G62 初等教育 G63 中等教育 G64 高等教育 G65 师范教育 G71 职业技术教育 G72 成人教育、业余教育
4
第一节
二、知识的含义
信息、知识、文献与情报
是人类通过信息对自然界、人类社会以及思维方式与运动规律的 认识和掌握。
三、情报的含义 (1)定义:是指被传递的知识或事实,是运用一定的媒体(载 体),越过空间和时间传递给特定用户,解决科研、生产中的具 体问题所需要的特定知识和信息。 情报是为实现主体某种特定目的,有意识地对有关的事实、 数据、信息、知识等要素进行劳动加工的产物。 (2)属性:知识性、传递性、有用性。

信息(文献)检索基本知识

信息(文献)检索基本知识

概念:用分类号(符号+数字)表达文献概念。它是将各种概 念按学科进行分类和排列,以学科分类为基础,运用概念划分
的方法,将各种概念按一系列标准和逻辑规则层层划分,形成
一个严密而有序的直线式知识类目等级体系。
中图法:5个基本部类、22个大类
A 马列主义毛泽东思想 B 哲学 C-K(除L、M)社会科学
N-X(除W、Y)自然科学; Z 综合性图书。
2019/6/5
DR&PW:\检索基础 \ 信息基本知识
2
文献的类型
期 刊
报科 告技
文标 献准
档技 案术
DR&PW:\ 检索基础 \ 信息基本知识
图 书
会 议 论 文
资产 料品
学 位 论 文
专 利
出政

物府
3
文献出版类型 期刊
• 定义:指定期或不定期出版的连续出版物,出版周期最长不 超过一年。它采用固定的名称和统一的版式外形,有卷期号 或年月顺序号,每期内容不重复。有ISSN和CN刊号。
2019/6/5
DR&PW:\ 检索基础 \ 检索基本知识
12
信息检索语言 分类语言
A
马克思主义、列宁主义、毛泽东 思想、邓小平理论
N
自然科学总论
B 哲学、宗教
O 数理科学和化学
C 社会科学总论
P 天文学、地球科学
D 政治、法律
Q 生物科学
E 军事
R 医药、卫生
F 经济
S 农业科学
G 文化、科学、教育、体育
阅读型:教科书、专著等
工具型: 字典、百科全书、年鉴、手册
2019/6/5
DR&PW:\ 检索基础 \ 信息基本知识

文献信息检索基础知识

文献信息检索基础知识

文献信息检索基础知识文献信息检索基础知识第一节概论科学技术的发展,具有连续性和继承性,科学技术的发明创造,需要依靠经验、材料和理论的不断积累,没有科学上的继承和借鉴,就没有提高。

任何一个科技工作者,都有赖于在前人已经取得成就的基础上进行不断的研究和探索。

在科研选题过程中,要首先了解所研究的学科领域发展现状与趋势,对自己挑选的课题进行查新,以免重复别人的劳动。

在课题研究过程中,要借鉴别人已有的成果,比如一些统计、实验数据,可以直接利用,没有必要自己再做一次,节省研究经费与时间;对别人研究没有取得成功的地方,要分析原因,可以避免研究走入歧途。

要完成这一切,都离不开科技文献的检索与利用。

科技文献是科学技术研究成果的记录,积累了许多有用的事实、数据、理论、方法和科学假设,反映了科学技术研究的进展和水平,是科技信息的主要来源。

科技文献数量急剧增长,可以说是“知识爆炸”,在浩如烟海的文献面前,盲目地查找自己所需要的文献很困难,对信息污染难以分辨;专业文献出版分散,如果只注意查找本专业的核心期刊,已看不到专业文献的全貌,仅能了解其中的一小部分而已,因为大量的专业文献分散出版在其它刊物里。

文献老化加快,出版种类繁多,我们如果想了解某一数据、某一事件或事实,更如大海捞针,无从下手。

要快速、全面、准确地获得所需要的文献信息,就必须掌握科学的文献查找方法,因此就必须学习科技文献检索知识。

掌握了科技文献检索的方法,首先可以节省查找文献的时间,据调查统计,一个科技工作者在其科学研究生涯中花在查找文献上的时间占整个科研时间的40~50%,如果掌握正确的文献检索方法,将缩短查找文献时间,从而延长科研寿命。

其次有利于专题文献查全,由于专题文献出版分散特点,使得只从核心期刊上获取专题文献很难查全,掌握文献检索方法,在检索工具或数据库中去检索,就能克服这一不足。

再者可以克服自然语言和学科专业语言障碍,由于当今文献语种很多,而一般科技工作者除母语之外仅掌握1~2门外语,这就为了解世界先进技术带来困难。

第一章 文献信息检索基础知识

第一章 文献信息检索基础知识
定义:以纸张为载体,以印刷为手段的记录方式。 优点:便于阅读和流传 缺点:存贮密度低、收藏占有空间大,加工保存成本高,识别和 提取难以实现机械化和自动化,不便于管理和长期保存。
2. 微缩型
定义:以感光材料为载体,利用光学技术以缩微照相为记录手段,
如缩微胶卷、缩微胶片等。
优点:存贮密度大、体积小,便于保存和远距离传递; 缺点:不能直接阅读,必须借助缩微阅读机才能阅读。
著者
书名
代码
出版地
出版社
出版时间
Horst, R., Pardalos, P. M. 1994, Handbook of global optimization, Kluwer, Dordrecht.
10
(三)文献类型--按文献出版划分:
国际标准书号(International standard book number, ISBN) P7
ultrasound and pulsed-vacuum treatments on the dehydration kinetics, distribution and status of water in osmotically dehydrated strawberry: a combined NMR and DSC study[J],Food and Bioprocess Technology ,2014, 7(10): 2782-2792.
1.图书(Book)
定义:指对某一领域的知识进行系统阐述或对已有研究成果、技术
、经验等进行归纳、概括的出版物。包括专著、汇编、丛书等。
特点:图书的内容比较系统、全面,论点成熟、可靠,但传统印刷 业图书的出版周期较长,传递信息速度慢,电子图书的出版发行可

第一讲文献信息检索基础知识

第一讲文献信息检索基础知识

(三)不同加工层次的文献信息
一次文献
二次文献
三次文献
按文献 的加工 深度分
一次文献
* 作者以自己的研究成果为基础创作或撰写, 并通过某种渠道而公开的文献;
* 对知识的第一次加工;具有创造性; * 大多数期刊论文、科技报告、学位论文、会
议文献、专利文献、技术档案等。
二次文献
* 对一次文献进行浓缩、整序及加工处理而成 的具有报道和检索作用的文献;
报纸
是以报道新闻及评论 为主,出版周期比期刊 更短,多为活页性连续 出版物。其特点是内容 丰富、信息量大、出版 迅速、发行量大、读者 众多。
科技报告
科技报告是科技工作者对科学、技术研究结果或研 究进展的记录。
科技报告的特点
(1)反映新的科研成果迅速; (2)内容多样化; (3)质量参差不齐; (4)保密性强; (5)每份报告独立成册,有连续编号。
第一讲文献信息检索基础 知识
第一节 信息与信息素养 第二节 科技文献的类型 第三节 信息检索与文献检索工具 第四节 信息检索原理 第五节 信息检索的方法和途径 第六节 信息检索常用技术及检索效果评价
第一节 信息与信息素养
一、信息的基本含义
1、图书馆学和情报学领域,信息被定义为事物 或记录。 2、综合学术界对信息的定义,可以认为信息是 以物质介质为载体,传递和反映世界各种事物存 在方式、运动规律及特点的表征。
美国信息产业协会主席保罗 . 泽考斯基(Paul Zurkowaski)1974年在美国全国图书馆与情报学委 员会上,最早提出了信息素养的概念,他把信息素 养概括为:“利用大量的信息工具及主要信息源使 问题得到解答的技术和技能。”
信息素养为什么重要
在科技飞速发展、信息资源激增的当今时代,信息 素养越来越显示其重要性

文献检索基础知识

文献检索基础知识

UDC LC CC
(比)英特勒等
美ห้องสมุดไป่ตู้国会图书馆 编目组
(印)阮冈纳赞
混合 体系 组配
书目分类法
BC
(美)布利斯
混合
9
体系分类法
定义:以学科分类为基础,依据概念的划分与概括原理 ,把概括文献内容与事物的各种类目组成一个层层隶属 、详细列举的等级结构体系的一种分类法。
分类法
编制说明 分类表 复分表
10
《杜威十进分类法》(DDC)
000 总论 100 哲学 200 宗教 300 社会科学 400 语言 500 自然科学 600 应用科学 700 艺术 800 文学 900 历史、地理
510 数学 520 天文学 530 物理学 540 化学 550 地球科学 560 古生物学 570 生命科学 580 植物学 590 动物学
中国图书馆
《中国科学院图书馆图 书分类法》
《中国人民大学图书馆 图书分类法》
科图法 人大法
中国科学院图书馆
中国人民大学图书 馆
体系 体系 体系
《中国档案分类法》 中档法
国家档案局
体系
8
国际常用分类法
分类法名称
简称
主编
体系结构
杜威十进分类法
DDC
(美)杜威
体系
国际十进分类法 美国国会图书馆分类法
冒号分类法
东思想
50 自然科学(总论)72 能源学、动力工程
10 哲学
51 数学
73 电技术、电子技术
20 社会科学(总论)52 力学
74 矿业工程
21 历史、历史学 53 物理学
75 金属学(物理冶金)
27 经济、经济学 54 化学

第三章文献信息检索的基本知识

第三章文献信息检索的基本知识

第三章文献信息检索基本知识随着信息技术的发展,互联网的应用得到广泛普及,信息环境发生了相当大的变化,应用现代化技术手段获取各种信息、知识成为高等院校师生与广大科技工作者的一种必备知识和技能。

为此,首先就必须了解文献信息检索的基本知识。

第一节信息检索的基本原理一、信息检索的概念信息检索(Information Retrieval)全称为“信息存储与检索”(Information Storage and Retrieval),其概念有广义和狭义之分。

广义上认为,信息检索包括文献信息的存储和检索两个方面,即一个完整的信息检索系统由信息存储子系统和信息检索子系统两部分组成。

信息存储子系统:首先对一定数量的信息进行筛选,把能够描述文献信息的外部特征和内部特征进行加工、整理,使之有序化,形成信息特征标识集合,然后将之存储在某种载体上,编制成为检索工具或建立一个数据库。

信息检索子系统:根据信息用户的特定需求,对用户需求进行主题分析,利用一定的检索方法和检索技术,对存储子系统中的特征标识进行比对,把需要的文献线索或知识信息从系统中查找出来的过程,即信息检索。

这就是通常人们所说的信息检索过程,也就是狭义上的信息检索。

信息存储与信息检索是意义不同却又相互联系、相互依存、不可分割的两个过程。

信息存储是为了检索,信息检索又必须先有信息存储。

如果没有存储,检索就无法实现;没有检索,信息存储也就变得没有意义。

所以说存储是检索的前提和基础,检索是存储的目的。

信息检索系统的工作原理如图3-1所示。

图3-1 信息检索系统的工作原理二、 信息检索的类型信息检索可以按不同的划分标准划分为不同的类型。

(一)、 根据检索内容划分根据检索信息内容不同可划分为文献信息检索、事实信息检索和数据信息检索。

1、文献信息检索(document retrieval ):是以文献(包括目录、索引、文摘等二次文献或全文)为检索对象,查找有关文献的出处和收藏处等信息,都属于文献信息检索范畴。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

文献信息检索基础知识第一节概论科学技术的发展,具有连续性和继承性,科学技术的发明创造,需要依靠经验、材料和理论的不断积累,没有科学上的继承和借鉴,就没有提高。

任何一个科技工作者,都有赖于在前人已经取得成就的基础上进行不断的研究和探索。

在科研选题过程中,要首先了解所研究的学科领域发展现状与趋势,对自己挑选的课题进行查新,以免重复别人的劳动。

在课题研究过程中,要借鉴别人已有的成果,比如一些统计、实验数据,可以直接利用,没有必要自己再做一次,节省研究经费与时间;对别人研究没有取得成功的地方,要分析原因,可以避免研究走入歧途。

要完成这一切,都离不开科技文献的检索与利用。

科技文献是科学技术研究成果的记录,积累了许多有用的事实、数据、理论、方法和科学假设,反映了科学技术研究的进展和水平,是科技信息的主要来源。

科技文献数量急剧增长,可以说是“知识爆炸”,在浩如烟海的文献面前,盲目地查找自己所需要的文献很困难,对信息污染难以分辨;专业文献出版分散,如果只注意查找本专业的核心期刊,已看不到专业文献的全貌,仅能了解其中的一小部分而已,因为大量的专业文献分散出版在其它刊物里。

文献老化加快,出版种类繁多,我们如果想了解某一数据、某一事件或事实,更如大海捞针,无从下手。

要快速、全面、准确地获得所需要的文献信息,就必须掌握科学的文献查找方法,因此就必须学习科技文献检索知识。

掌握了科技文献检索的方法,首先可以节省查找文献的时间,据调查统计,一个科技工作者在其科学研究生涯中花在查找文献上的时间占整个科研时间的40~50%,如果掌握正确的文献检索方法,将缩短查找文献时间,从而延长科研寿命。

其次有利于专题文献查全,由于专题文献出版分散特点,使得只从核心期刊上获取专题文献很难查全,掌握文献检索方法,在检索工具或数据库中去检索,就能克服这一不足。

再者可以克服自然语言和学科专业语言障碍,由于当今文献语种很多,而一般科技工作者除母语之外仅掌握1~2门外语,这就为了解世界先进技术带来困难。

而文摘型检索工具选登的文摘覆盖的语种较多,即使是一个不掌握外语的人也可能通过文摘的阅读,就能了解各语种文献的主要论点、研究方法、结论等,能够广泛了解有关领域的发展趋势。

下面主要是通过介绍科技文献检索的基础知识和典型检索工具的使用方法,引导科技人员掌握检索科技文献的方法。

一、关于信息的几个基本概念(一)信息1、信息的定义信息在我们的生活中随处都能见到,信息化社会、信息时代、信息产业、信息技术……我们的生活和信息紧密联系在一起。

那么信息到底是什么呢?作为日常用语,信息就是信息,我们的生活中到处都存在有信息,如手机铃声、上网浏览的网页、电视节目等等。

对人类而言,人的五官就是为了感知信息,他们是信息的接收器,它们所感受到的一切都是信息。

信息普遍存在于自然界、生物界和人类社会中。

根据发生源的不同,信息一般可分为自然信息、生物信息、机器信息和人类信息四大类。

湖光山色、刮风下雨是自然信息;细胞染色体的遗传基因是生物信息;电讯系统中的电流脉冲、计算机中使用的“0”与“1”的二进制代码是机器信息;人类社会活动中的各种语言、文字、图形符号是人类信息。

到目前为止,信息还没有一个统一、确切的定义,各个学科对信息的定义都不相同。

信息的内容是客观的;信息的形式是主观的;信息是一切物质的普遍属性;任何物质都可以成为信息源;任何物质都可以产生信息;任何物质的运动过程都离不开信息的运动过程。

现代信息论创始人申农从研究通信理论出发,把信息定义为“用来减少随机不确定性的东西”。

《中国大百科全书》(1993年)的解释为:按照狭义的理解,信息是用来消除不定性的东西。

按照广义的理解,又有两种认识:从本体论意义上说,信息泛指一切事物运动的状态和运动的方式,包括事物内部结构的状态和方式以及外部联系的状态和方式;从认识论意义上说,信息是关于事物运动状态和运动方式的反映。

而从文献检索的角度来说,通常把经过搜集、记录、处理和存储的可供检索的文献、数据和事实?。

2、信息的特征信息是所有事物的存在方式和运动状态的反映,信息不是物质本身,但它来源于物质,正是因为信息的物质性才决定了它的一般属性。

它的一般属性包括:普遍性、客观性、抽象性、依附性、可加工性、传递性、共享性等。

(1)普遍性。

世界上任何运动着的事物无时无刻不在生成信息,只要有事物存在、事物运动,就存在着信息。

信息无所不在,物质的普遍性以及物质运动的规律性决定了信息的普遍性。

(2)客观性。

信息不是虚无缥缈的东西,是现实中各种事物运动的状态与方式的客观反映。

由于事物及其状态、特征和变化是不以人的意志为转移的客观存在,所以反映这种客观存在的信息也具有客观性。

信息不仅其实质内容具有客观性,经形成且与载体结合,其本身也具有客观性。

(3)抽象性。

信息本身是看不见、摸不着的,我们能够看得见、摸得着的只是信息载体,如:语言、文字、图画、符号、纸张、光盘等,而非信息内容。

对于认识主体而言,获得信息和利用信息要具备抽象能力,正是这种能力决定着人的智力和创造力。

信息的抽象性增加了信息认识和利用的难度,并从而对人类提出了更高的要求。

(4)依附性。

也称寄载性。

依附性是抽象性的延伸,信息的记录、存储以及交流和共享必须依附于或借助于物质载体,以某种载体形式表现出来,没有载体就没有信息。

(5)可加工性。

信息数量庞大,质量高低不一,而人们对信息的需求往往具有一定的选择性。

信息价值的发挥也需要进行不同层次的加工处理,由原始信息可以加工成二次信息,再经过分析、研究与综合,又可加工成三次信息。

每次加工都可改变原有信息的结构,赋予信息新的价值。

(6)传递性。

信息在运动中产生,在传递中发挥价值。

信息传递可跨越时空,信息的获取利用以及反馈必须借助于信息的传递。

信息传递是通过信道进行的。

信息系统就是由信源、信道、信宿组成的有机整体。

(7)共享性。

信息能够通过时空进行传递,因此能够被人类所共享,信息价值的实现需要通过信息的使用。

与实物使用不同,同一信息可以同时被两个以上的多个用户使用,而且并不因为信息的多人多次重复使用而丢失其内容。

正如萧伯纳所举的“苹果与思想”的例子。

苹果交换之后交换双方各有而且仅有一个苹果,但思想交换后交换双方都拥有了两种思想。

信息除了上述特征之外还有时效性、动态性、可转化性、可伪性等。

3、信息的类型从不同角度对信息进行划分,可产生不同的类型。

如从信息性质划分,有语法信息、语义信息和语用信息。

从信息应用部门划分,有工业信息、农业信息、政治信息、科技信息、文化信息、经济信息等。

从信息的记录符号划分,有语声信息、图像信息、文字信息和数据信息等。

依据不同的标准,划分信息的结果不同。

(1)按信息内容划分可分为主观信息和客观信息。

①主观信息:一般是指依据事实和分析说明个人的观点和见解。

主观信息是对一个事件、论题进行评估时能提供很多有价值的信息。

②客观信息:一般是指不加主观如实反映客观的信息,它一般全面客观地描述一个问题的各个方面,使人们对问题有一个全面的概念。

(2)按信息的传播渠道划分可分为口传(口语)信息、体语信息、实物信息、文献信息、电子信息。

4、信息的作用对于由物质构成的整个客观世界而言,信息的基本作用就是增强世界的有序性。

没有物质就没有我们生活的世界;没有能量,世界就将消亡;没有信息,物质和能量只能形成一个混浊、杂乱的空间。

信息资源与物质资源、能量资源一起,共同构成现代社会资源的三大支柱。

物质向人类提供材料,能量向人类提供动力,而信息向人类提供的则是知识和智慧。

有人把这三者比作一个人的体质(材料)、体力(能量)和智力(信息),只有体质、体力和特别是智力都发展的人,才是一个真正健康的人。

信息对于人类社会生存和发展的基本作用是信息增强世界的有序性在特定的人类社会范畴中的具体表现,这种具体表现就是:消除人的认识的不确定性。

关于信息对人类社会生存和发展的作用,人们可以从不同的角度加以阐述。

维纳(N.Wiener)在他的《人当作人来使用》一书中指出“要有效地生活就要有足够的信息。

所以,正像通信和控制属于人的社会生活那样,它们也是人们的内部生活的要素”;申农(C.E.Shannon)则把信息的作用寓于其定义中。

“信息是用以消除随机不确定性的东西”。

我们认为,分析研究信息对人类社会生存和发展的作用,可以以其最为基本的作用——能够消除人们认识的不确定性为出发点,考察信息与人类社会生存和发展关系十分密切的主要方面及其在这方面的作用。

(1)信息是人类社会生存的条件,信息是人类社会发展的资源无机物向有机物跃变以后,有机物经历了复杂的自然选择,在漫长的进化过程中,演化形成了一个重要的动物种类。

其间的每一次质变。

无不与信息的接收能力、信息的处理能力的变化有关;其间每一个阶段性各类的生存、延续和繁衍,其相应的信息能力为基本保证。

没有信息能力的这种保证,人的进化和生存也就无从谈起。

时至今日,乃至将来,人类的生存都离不开信息。

人正是由于自身所具有的信息能力,接收和处理着来自客观世界的各种信息,不断地确定和调整着自己每时每刻所处的生存空间,维系着自己的生命,延续和繁衍着自己的种类。

有史以来,人类并不仅仅满足于生命的延续和繁衍,而是在同客观世界的斗争中,不断地认识世界、发行世界,在提高生产力水平的同时,极大限度地创造和发展物质文明和精神文明。

人类在发行客观世界的同时,也形成和改造了自己的主观世界,积累了大量有关客观事物运动状态和方式的知识,这是人类社会的宝贵财富,也是人类社会进一步发展的基础。

历史已经证明,在人类的发展进程中,开发利用信息资源同开发利用物质资源和能源一起构成了人类创造物质文明和精神文明的主体结构,三者缺一不可。

(2)信息是主客体的中介,信息是思维的材料人类的生存和发展,不是在真空中进行,而是无时无刻不在同客观的事物打资产,其首先要条件就是要对客观事物的运动状态和方式有所认识、有所了解,在一定程度上消除对客观事物的认识上的不确定性。

这种认识和了解无疑是以信息的存在为前提条件的。

因此,没有信息作为人和客观事物的中介,人和客观事物之间的关系只能是物与物的关系,而不是认识和被认识的关系。

从这种意义上讲,信息的存在是人类发挥认识能力的必要条件。

从进化论角度看,信息促进了人的认识能力的改善和提高。

人不同于其他动物种类的根本原因,在于人具有思维能力。

思维能力是人的认识能力的核心所在,它是人脑这种特殊物质构成的一种功能。

其功能的实现是以信息为原材料而进行的,没有信息材料,人的思维能力只具有一种潜在的功能,并不会产生任何东西。

信息是思维不可缺少的原材料,同时,思维的结果——同样是信息。

而新的信息又可以转变为自己的或他人的信息材料,再一次经过思维功能的变换,生出新的信息。

相关文档
最新文档