科技文献检索教案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

科技文献检索课教案缩编
图书馆王泽琪
第一章绪论及文献检索基础知识
教学目的:
了解科技文献检索的概况和意义,掌握文献检索的基本原理,了解检索的概况和一般特点教学内容分析
教学重点:
十大文献类型、特点及文献识别
检索语言的分类
科技文献检索步骤、文献来源还原、原文索取
教学难点:
十大文献类型西文文献识别
分类语言和主题语言的不同
叙词、关键词语言概念的理解
关键:
学生能掌握十大文献类型的特点,能识别前7个文献类型
学生在检索时能意识到叙词和关键词的不同
尽量使用提供的叙词检索使用关键词检索时应尽量考虑到不同的关键词
教法设计和教学手段:
讲述为主,辅助于电子文稿演示
教学过程:(4课时)
学习文献检索课的意义
知识、信息、情报、文献及文献检索的概念
科技文献的特点及划分
十大文献类型、特点及文献识别(重点、难点)
检索语言(重点为分类、叙词、关键词语言)标引、组配、词间关系
主题词表(重点叙词表)
科技文献检索步骤、文献来源还原、原文索取(重点)
思考题:
1图书、期刊、会议文献、科技报告、学位论文、专利文献的特点有什么不同?如何识别以上六种西文文献?
2叙词和关键词在实际检索时有什么不同?使用时应注意什么?
3检索结果文献来源为非英文的语种如何处理?
教学讲稿
一、为什么要学习文献检索课
1节省查找文献的时间
2促进专业学习和提高
3正确决策,避免重复浪费
如:我国实行科技重新制度
4发挥科技文献的作用,借鉴国外先进科技成果
二、信息、情报、文献与文献检索
三、科技文献
1科技文献的特点
①数量大、增长速度快
②内容交叉重复、各学科文献相互渗透
③失效加快
④载文聚散,分布有序
2。

文献的划分
①按文献的载体形式印刷型、缩微型、电子型、音像型
②按信息加工层次
一次文献( )
二次文献( )
三次文献(
③按出版类型
四、文献出版类型及其识别
1图书():
特点:系统全面成熟定型出版时间较长
识别依据:a有书名著者(编者)
b有出版地、出版社、出版年(此项最重要)
c非第一版的有版次
d有时有号
e常见英语单词, .().
如:. , ,,1981国际标准书号()由10位数字分成4段组成,各段依次是:地区或语种号-出版商代号-书名号-校验号。

其中地区或语种号:英、美、加、南非等英语区为0,其它英语区为1,法语区为2,德语区为3,日本是4,俄语区为5,中国大陆为7,印度等为8,东南亚地区为9。

如7-302-02372-7,表示中国大陆代号为302的(清华大学)出版社,出版的一种图书,其书号为02372、该书的校验码为7。

2期刊(、、):俗称杂志(),
定期或不定期出版的报道新技术和新理论的连续出版物。

期刊按内容和性质划分,主要有学术性期刊、快报性期刊、检索性期刊等。

特点:周期短、内容新、信息量大、反映信息成果及时、利用率高。

识别依据:a作者和篇名
b刊名常缩写,有时斜体
c 必有卷次号,有的有期号
d有时有号由8位数字分两段组成,如1000-0135,前7位是期刊代号,末位是校验号。

我国正式出版的期刊都有国内统一刊号(),它由地区号、报刊登记号和《中图法》分类号组成,如11-22573。

地区号依《中华人民共和国行政区划编码表 2260-82》取前两位,如北京为11、天津12、上海31、辽宁21、吉林22等。

记录中英语单词(J.)(.)
3科技报告( ):
是科研技术成果的总结,或是研究过程每一阶段进展情况的实际记录,反映新兴科学和尖端科学的研究成果。

代表一个国家的研究水平。

各国极为重视。

著名的美国四大科技报告:、、、
识别依据:a有报告词如:,
b有报告号如:—***
c有时有研究机构、完成时间等
例:, 55672
98001479 1802,907
报告是美国国家技术信息服务处( —)出版的报告。

报告是美国国防技术信息中心( —)出版的报告。

报告是美国国家航空宇航局( )出版的报告。

报告的内容侧重于航空和空间科学技术领域,广泛涉及空气动力学、飞行器、生物技术、化工、冶金、气象学、天体物理、通信技术、激光、材料等方面。

报告是美国能源部( )出版的报告,其前身是报告和报告。

4会议文献( ):
是指在各种学术会议上交流的学术论文。

其特点是内容新颖、专业性和针对性强,传递信息迅速,能及时反映科学技术中的新发现、新成果、新成就以及学科发展趋向,是了解有关学科发展动向的重要信息源。

识别会议文献的主要依据有:会议名称、会址、会期、主办单位、会议录的出版单位等。

记录中英语单词, , , , , , , , 等。

5)专利文献( ):
是实行专利制度的国家,在接受申请和审批发明过程中形成的有关出版物的总称。

包括专利说明书、专利公报、专利分类表、专利检索工具以及与相关的法律性文件;狭义上专利文献仅指各国(地区)专利局出版的专利说明书或发明说明书。

专利说明书是指专利申请者为了获得某项发明的专利权,在申请专利时必须向专利局呈交的有关该发明的详细技术说明。

专利说明书有固定的独特格式,其结构通常由以下3部分组成:
(1)标识部分
(2)正文部分:
(3)专利权项:
专利文献的特点是:
(1)内容新颖、出版迅速。

(2)涉及技术领域广泛、实用性强。

(3)具有法律效力。

(4)技术上具有单一性和保守性。

(5)重复量大。

世界每年报道的专利说明书中只有1/3是新发明。

记录中英语单词:
主要专利国:欧洲专利公约组织、世界专利合作条约组织、美、英、法、德、日、俄、瑞士7国
6标准文献( ):
7学位论文(,):
是指高等学校或研究机构的学生为取得某种学位,在导师的指导下撰写并提交的学术论文,它是伴随着学位制度的实施而产生的。

学位论文有博士论文、硕士论文、学士论文之分,其研究水平差异较大,博士论文论述详细、系统、专深,研究水平较高,参考价值大。

特点1、全文往往不公开出
2、一般保存在授于学位的单位
3、学位论文往往对课题探讨比较专深、详尽、系统论述、立论充分
识别:往往有授予的校名及()及字样,有时有导师姓名、学位授予机构等
8政府出版物( ):
9产品资料( ):
10科技档案( ):
六、检索工具
检索工具是用来报导、存储和查找文献或文献线索的工具
卡片式~缩微式~ 书本式~ 机读式
书本式检索工具的结构:
1使用说明引导性
2目次
3正文
4索引
5附表
索引:是按一定顺序排列的检索款目和文献代码组成的集合体,放在检索工具正文的后面,它引导科研人员迅速又准确地查找到所需文件。

中文检索工具举例:311 程序设计、软件工程
《全国报刊索引》020812847 硬件/软件协同设计技术及应用黄更文(江苏大学计算机与通信工程学院);方钰、陈过电气电子教学报2002,3,7
检索语言也称标引语言,是用于描述文献系统中文献内容特征以及外表特征并表达用户对信息提问的一种人工语言,是标引和检索之间的约定语言。

描述文献内容特征的语言:(1)分类语言(2)主题语言:标题词、单元词、叙词、关键词。

描述文献外表特征的语言:著者、代码
先组式语言:文献标识及句法关系在编表时就固定组配的,必须根据词表组配好的主题标识进行标引或检索的语言。

分类语言,标题词,语言。

后组式语言:文献标识在检索时,根据实际需要按组配规则临时进行组配来描述文献的主题概念的语言。

单元词、叙词、关键词
1 分类语言(分类组织法)
1.1 分类法的概念及作用
所谓分类法,就是根据文献内容的学科性质和特点类分文献的方法。

对文献进行分类整序的目的是便于管理和利用它们,例如编制分类目录和索引,组织文献的分类排架,进行文献的分类统计等等。

文献分类在文献检索中具有重要的作用。

比如分类目录可以向用户展示一个科学分类系统,用户能够通过这个系统去选择和阅读自己所需要的文献。

文献的分类排列是编制检索工具的基本方法,而文献的分类查找则是文献检索的一个重要途径。

掌握文献分类的基本原理,不但有利于从分类途径检索文献,而且对于积累资料,分析、研究及处理文献都十分有益。

1.2 分类法的类型
1.3《中图法》的内容结构
1.4 分类文档的组织
2 主题语言(主题字顺组织法)
2.1 主题法的概念及作用
所谓主题法,就是以自然语言中的词语或规范化的词语作为揭示文献主题的标识,并以此标识编排组织和查找文献的排检方法。

主题指文献所具体论述的对象和研究的问题;表达主题概念的词语就叫主题词。

主题词有自然语言中的词语,也有从自然语言中优选出的规范化词语。

优选出的词语必须词义明确,避免其多义性,并受特定的词表控制。

主题法和分类法一样,也是文献信息单位广泛使用的文献信息整序法。

它们揭示和检索的对象都是各种类型的文献资料;它们都是从文献资料的内容途径进行揭示和检索;它们都是文献信息单位用来组织与编排检索工具,向用户揭示、宣传和流通文献资料的一种手段。

2.2 主题法的类型
主题法在发展过程中,依选词的不同,先后出现了标题词法、单元词法、关键词法和叙词法等多种文献组织与检索的方法。

1.标题词法和标题词表
标题词是通过文献内容分析,从中找出实际意义能表达文献内容特征,并经过规范化处理的词,词组或短语。

标题词法是主题法的早期类型。

它是以标题词(规范的事物名称、名词术语)作为文献主题内容的标识和检索标识的先组式主题法。

标题法的主要特征是事先编表,标题词以固定的组合方式组织在词表中,检索按既定组配执行。

主题标词:表示事物本身概念。

副标题是:表示事物各个方面。

优点:质量较好,组配固定,不易混乱,查全率较高。

保证一种事物只用一个标题词表达,缺点:相关的分散在各处,灵活性较差,不能任意组配检索。

2.单元词法
单元词法主张用最基本的、不能再分的词汇——单元词做主题词。

单元词从文献内容中抽出,再经规范,能表达一个独立的概念。

在英语中单元词经常是一个单词。

单元词法的突出特征是:强调词汇的单元化;强调后期组配。

即在检索时将某些与检索课题相关的单元词组配起来使用,比较各自下面的文献或其代用品的地址号,相重合的地址号就是与课题相关的文献线索。

这也是通过比号来实现单元词组配和文献选择的,所以单元词法是一种后组式的主题法。

单元词集合构成词表,如专利工具中的《-规范化主题词表》就是一例。

单元词法虽然提高了主题法的灵活性,但由于它过分强调词汇单元化,词汇处理方法又不甚合理,易发生错误组配,误检率较高,故实用性不是很好。

3.关键词法
关键词法是直接从文献题名、文摘或全文中抽取出来的有实际检索意义的信息单元(关键词)作为主题词。

关键词排序可组成供主题检索的索引系统。

关键词是非规范的,无需查阅标准词表,或者只编制一个“禁用词表”,它收录为数不多的禁用词,如助词、连词、介词、冠词以及一些通用概念的词。

缺点:众多同义词、近义词造成同一主题的文献分散,查全查准率相当低。

优点:不用编制词表,标引速度快,方便,用于编临时性的辅助索引。

4.叙词法
叙词语言:是采用表示概念的规范化词语组配而来对主题进行描述的后组式标引和检索语言。

特点:词较规范,概念组配,标识直观,使用方便,一个叙词与一个概念严格对应,叙词单一性。

八、主题词表主要有叙词表和标题词表。

没有特指的情况下,指叙词表。

结构:主表(字顺表)、词族表、范畴表、轮排表
如:叙词导航图(叙词)(用)()
D领航图(非叙词)(代)非正式叙词
F航空图:(下位词)(分)——下位词
S图(上位词)S(属)——上位叙词
C海图(相关词)(参)——相关词
Z族(下位词指引到最高叙词)
九、科技文献检索(检)步骤1课题分析
a 检索目的:提问的真正含义,检索的目的
b 课题背景:课题历史和现状,掌握的各种线索
2.选择检索工具
a 学科范围
b 需要检索的文献的类型
c 时间范围与语种
3.检索途径与检索策略
检索工具已限制,无法选择,检索要求可选择
①课题内容所属分类清晰,或涉及课题的各方向,所需文献范围广,选用分类途径较好。

②主题明显(关键字明显),涉及课题的某一方面,所需方面文献范围窄,应选用主题途径。

③已知文献的外部特征(著者、报告号、专利号),可利用这些外部特征的索引检索。

④多种途径结合,效果更好,应及时根据具体情况调整检索策略。

注意:
①分类途径,主题途径应尽量采用分类表,主题词表。

②采用关键词与非规范检索语言,应尽量考虑同义词,近义词,多义词,上、下位词。

③作者途径应考虑作者姓名(中国的几种可能写法)(查外文文献)
4.实质性查找
5.索取原始文献
期刊名常以缩写形式出现
非拉丁语系语种的刊名以音译方式出现要还原成原刊名。

(俄日)
如:还原成俄文: 机械制造师
如:三菱重工技报
第二章印刷型检索工具的检索
第三章计算机数据库检索
教学目的:
掌握计算机检索的特点,掌握西文数据库的一般检索技术。

掌握重要中文数据库的检索,能正确使用其查全查准。

掌握常见西文数据库的检索。

教学重点:
检索技术(逻辑算符、位置算符、截词检索)
逻辑检索、位置检索、截词检索、限制检索的综合运用
中文数据库的检索(、维普等)
本馆引进外文数据库的介绍及检索( 、、、等)
教学难点:
检索技术(逻辑算符、位置算符、截词检索)
逻辑检索、位置检索、截词检索、限制检索的综合运用
本馆引进外文数据库的介绍
教法设计:
讲述为主,辅助于电子文稿演示,以系统的《》光盘数据库为例安排学生实习巩固对检索技术和检索技术的综合运用的掌握。

中文数据库的检索及本馆引进外文数据库的介绍及检索,除教师结合电子文稿演示检索介绍外,安排学生课外检索这几个重点数据库,作为课外作业计入平时成绩。

教学过程:
课外作业:
1.用《》光盘数据库检索合成孔径雷达的三维成像新技术研究方面的文献。

2.用《》光盘数据库检索中国民航学院教师发表的文献。

3.任选一题目,用任一中文数据库和一外文网络版数据库检索相关文献,写出检索步骤。

思考题
教学讲稿:
计算机数据库检索
第一节计算机数据库检索基础
一、概论
1 基本概念
2 根据计算机用户界面的不同,计算机检索大至可分为以下几种方式:
命令检索。

是使用一些特定的检索命令来实现检索的,灵活应用各个检索命令可以方便快捷的获得准确的检索结果,一般适用于有经验的检索人员。

菜单检索。

是一种简单易学的操作方式。

光盘检索系统一般都提供菜单检索方式,缺点是操作步骤较多,检索时间较长。

检索精度比命令检索差。

超文本检索。

是目前最新型的信息检索方式,它向用户提供更加友好的人机交互界面。

超文本技术按知识(信息)单元及其关系建立起一种非线性的知识结构网络,知识单元彼此用指针链接。

用户在操作时,只需要用鼠标点击相应的知识单元,检索就可以一步步追踪下去,逐步打开一个个知识单元,直到发现所要的目标。

超文本检索大多用于多媒体光盘及互联网上。

3 计算机检索的发展
二、计算机信息检索的基本原理
信息检索,从广义上讲应包括信息的储存与查找两个方面。

信息储存主要是按照一定规律,对文献进行分析、标引,形成文献的特定标识(例如主题词、关键词、作者等),为文献的查找提供必要的检索工具和途径;信息的查找,则是将用户的需求变成检索提问标识,并按照检索系统提供的检索途径,将此标识与系统中存储的文献特征标识进行比较,从系统中获取两种标识相一致或比较一致的信息,以满足用户的需求。

储存是查找的基础,查找是储存的最终目的。

计算机信息检索和手工检索基本原理是一样的,只不过是计算机信息检索采用计算机和通信技术,借助其对信息和数据的高速处理能力,以数字化资源(数据库)作为检索对象来进行信息检索。

1计算机信息检索系统
1)检索系统类型
按信息访问模式划分
a联机检索系统
b光盘检索
c网络信息检索系统
三、计算机信息检索数据库
目前图书情报界大多从记录类型的角度将数据库分成以下几种类型。

a书目型数据库
b词典型数据库
c数值型数据库
d全文型数据库
e多媒体数据库
2.文献信息数据库的结构
四、计算机信息检索技术
计算机信息检索的实质是“匹配运算”,即由检索者把提问变成机器能识别的检索策略输入计算机中,由计算机自动对数据库中各文档的记录进行扫描、进行匹配。

也就是要把我们的要求变成检索提问输入计算机,与数据库中的文献记录的特征进行类比、组配,把完全匹配的文献记录检索出来的自动化过程。

因此,实现计算机信息检索需要具备三方面的技术:根据检索要求编制检索提问式;制定切实可行的检索策略;使用检索指令实施检索。

所谓检索策略,就是在分析情报需求实质的基础上,确定检索词与检索途径,并明确各词之间的逻辑关系与查找步骤的科学安排。

一般总是从狭义的角度将提问表示式称为检索策略。

编制成准确表达检索主题要求的提问式,就需要合理运用布尔逻辑算符、位置算符截词等方法,同时确定相应合理的检索途径。

下面介绍的几种检索技术是在光盘检索、联机检索和网络检索等各类机检系统中常用的,但由于不同的机检系统使用不同的检索软件,所支持的检索技术不同、采用的检索算符也不同,因此实际检索时,应注意查看所用检索系统的说明。

1 布尔逻辑检索
所谓布尔逻辑检索( )是用布尔逻辑算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献。

它是机检系统中最常用的一种检索方法。

逻辑算符主要有:与、或、非,分述如下:
逻辑“与”:运算符为或 * 。

检索词A和检索词B用“与”组配,检索式为:A B 或者 A * B 它表示检出同时含有A、B两个检索词的记录。

逻辑与检索能增强检索的专指性,使检索范围缩小,此算符适于连接有限定关系或交叉关系的词。

逻辑“或”:运算符为或 + 。

检索词A和检索词B用“或”组配,检索式为:A B 或者A+B 它表示检出所有含有A词或者B词的记录。

逻辑或检索扩大了检索范围,此算符适于连接有同义关系或相关关系的词。

逻辑“非”:运算符为或 - 。

检索词A和检索词B用“非”组配,检索式为:A B 或者 A - B 它表示检出含有A词,但同时不含B词的记录。

逻辑非和逻辑与运算的作用类似,可以缩小检索范围,增强检索的准确性。

此运算适于排除那些含有某个指定检索词的记录。

但如果使用不当,将会排除有用文献,从而导致漏检。

对于一个复杂的逻辑检索式,检索系统的处理是从左向右进行的。

在有括号的情况
下,先执行括号内的运算;有多层括号时,先执行最内层括号中的运算,逐层向外进行。

在没有括号的情况下,、、的运算次序,在不同的系统中有不同的规定,例如系统中依次为→→;系统和系统中依次为和按自然顺序执行,然后执行运算。

检索时应注意了解各机检系统的规定。

2 截词检索
截词检索()是指用给定的词干做检索词,查找含有该词干的全部检索词的记录,也称词干检索或字符屏蔽检索。

它可以起到扩大检索范围,提高查全率,减少检索词的输入量,节省检索时间,降低检索费用等作用。

检索时,若遇到名词的单复数形式,词的不同拼写法,词的前缀或后缀变化时,均可采用此方法。

截词的方式有多种,按截断部位可分为右截断、左截断、中间截断、复合截断等;按截断长度可以分为有限截断和无限截断。

右截断:截去某个词的尾部,是词的前方一致比较,也称前方一致检索。

例如:输入?(?为截断符号),将会把含有、、、、等词的记录检索出来。

若输入199?,会把90年代的记录全部查出来。

左截断:截去某个词的前部,是词的后方一致比较,也称后方一致检索。

例如:输入能够检出含有、、、等词的记录。

中间截断:截去某个词的中间部分,是词的两边一致比较,也称两边一致检索。

例如:输入可以检出、;输入可查出、。

有限截断:是指允许截去有限个字符。

例如“? ?”表示截去一个字符,它可检出、,但不能检出、、等词。

又如??? ?可检出、、、等词,不能检出、、等词。

注意:词干后面连续的数个问号是截断符,表示允许截去字符的个数,最后一个问号是终止符,它与截断符之间要有一个空格,输入时一定要注意。

无限截断:是指允许截去的字符数量不限,也称开放式截断。

上面右截断、左截断所举的例子均属此类型。

由上述可见:任何一种截词检索,都隐含着布尔逻辑检索的“或”运算。

采用截词检索时,既要灵活、又要谨慎,截词的部位要适当,如果截得太短(输入的字符不得少于3个),将增加检索噪声,影响查准率。

另外,不同的机检系统使用的截词符不同、各数据库所支持的截断类型也不同,例如系统和系统用?、系统用:、系统用$、系统用+等。

3 位置检索
位置检索()是在检索词之间使用位置算符(也称邻近算符 ),来规定算符两边的检索词出现在记录中的位置,从而获得不仅包含有指定检索词而且这些词在记录中的位置也符合特定要求的记录。

这种方法能够提高检索的准确性,当检索的概念要用词组表达,或者要求两个词在记录中位置相邻/相连时,可使用位置算符。

机检系统中常用的位置算符(按限制强度递增顺序排列)如下(以检索系统为例):
1.(w)算符:(w)要求检索词必须按指定顺序紧密相连,词序不可变,词之间除允许有空格、标点、连字符外,不得夹单词或字母;()表示连接的两个词之间最多可夹入N 个词(N为自然数),词序不得颠倒。

例如 (w)可检出而(1w)可检出、
2.(n)算符:(n)要求被连接的检索词必须紧密相连,词之间除允许有空格、标点、连字符外,不得夹单词或字母,词序不限;()表示两个检索词之间最多可以夹N个词(N 为自然数1、2、3…),且词序任意。

例如 (n) 可以检出和,又如 ?? ?(2n) 可以检出、、
3.(f)算符:要求被连接的检索词出现在同一字段中,字段类型和词序均不限。

例如
(f) 又如 (f)。

相关文档
最新文档