现代科技文献检索
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《现代科技文献检索》笔记
一、信息概述
定义:信息是指事物存在的方式和运动状态,是对客观世界中各种事物的变化和特征的反映,是客观事物之间相互作用和联系的表征。特征:1.客观性 2.普遍 3.可存储 4.可传递 5.扩散 6.共享 7.时效功能:1.经济功能 2.选择与决策 3.管理与协调 4.研究与开发二、知识
定义:系统化的信息。
类型:1.显性知识与隐性知识
2.实体知识与过程知识
3.核心知识与非核心知识
三、情报
定义:是具有特定传递对象的特定知识或有价值的信息。
特征:1.动态性 2.按特定方式传递 3.为特定的目的服务 4.带有一定的时效性和机密性
根据情报的来源与加工程度,将情报划分为:
零次情报:手稿、私人笔记(时效性强)
一次情报:论文,有实验结果载体为一次文献
二次情报:书目,文摘,简介等检索工具载体为二次文献
三次情报:综述,专题评述,学科年度总结等载体为三次文献
信息资源
定义:指人类社会经济活动中加工处理有序化,并大量积累后的有用
信息的集合
一般特征:1.作为生产要素的需求性 2.稀缺性 3.使用方向的可选择性
特殊特征:共享性时效性
信息资源的类型
根据载体的不同可划分为:体载信息资源文献信息资源实物信息资源网络信息资源
信息检索概述
概念:
狭义定义:相当于信息查询
广义定义:包含信息存储、查询
类型:
根据内容或检索对象:文献检索数据检索事实检索
根据组织方式不同:全文检索超文本检索超媒体检索
根据检索设备不同:手工检索机器检索
计算机检索原理:信息存储,信息检索
计算机检索的发展:1.脱机批处理检索阶段 2.光盘检索阶段 3.网络化检索阶段
计算机信息检索的服务方式:1.回溯检索 2.定题检索 3.随机问答 4.联机订购
检索语言的类型
按检索语言的规范化或受控程度划分:
规范的人工语言非规范的自然语言
比较:1.人工语言查全、查准率高,检索效率高于自然语言
2.自然语言成本低,具有灵活性、新颖性、专指性
先组式语言:在检索实施之前已经先组配好的一种检索语言
后组式语言:在检索实施时来组配的一种语言
人工语言:人工采用规范词与受控词组成的语言
自然语言:从信息内容本身抽取不受人工控制,主要依赖于计算机自动抽词技术来完成但是需要辅以人工标引的语言。
分类语言:按科学范畴和知识之间关系列出类目,并用数字、字母进行标识
主题语言:将自然语言中的名词术语经过规范化以后,直接作为文献标识,按照英文字母排列信息标识,通过参照系揭示专题概念间的关系
电子资源检索技术
布尔逻辑检索
算符:AND(*) OR(+) NOT(-)
优先顺序:NOT>AND>OR
注:括号内优先计算
位置算符:
A(nW)B AB之间最多有n个其他的词插入
A(W)B AB之间不得插入其他的词,到那可以插入空格或标点符号注:A(W)B亦可写作A()B
A(N)B AB之间不可插入其他的词或字母,但AB的词序可以颠倒
A(nN)B AB之间最多可插入n个其他的词,且AB的词序可以颠倒
A(S)B AB必须在同时在同一个句子中或同一个字段中出现,但词序可以任意变化,且两者之间可以加任意个词
A(F)B AB同时出现在记录的同一个字段中,如篇名、文摘、关键字等,但两词的次序以及之间的加词个数不限
A(C)B AB必须同时出现在同一记录中,不限定词序、字段,其作用相当于布尔逻辑算符中的AND.
查全率(R)=检出相关文献信息量/数据库中相关文献信息总量查准率(P)=检出相关文献信息量/检出文献信息总量
数据库:被定义为至少由一种文档组成并满足某一特定的或某一特定数据处理系统需要的一种数据集合
顺排文档:主文档顺排文档是一种重要字段顺序排列而成的数据库中全部记录的集合
倒排文档:抽出顺排文档记录中的可检索字段或其他特征标识,分别将包括该字段或标识的所有记录按照某种顺序排列组织
注:有多少个到排文档就有多个检索方式
基本索引:反映内容特征的字段,如:主题词、关键词、篇名等
辅助索引:反映文献信息的外部特征的字段,如:作者、刊名、出处、文献类型等