文献检索作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《文献检索》课程作业
第1章至第2章
一、名词解释
1. 信息检索
信息检索最普通的理解就是信息查找。
它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。
2.信息素质
(信息素养):从各种信息源中检索、评价和使用信息的能力,是信息社会劳动者必须掌握的终身技能。
具有信息素养的日呢,也就具备了终身学习的能力。
3.信息意识
简单的说就是人们利用信息系统获取信息的内在动因,具体表现为信息的敏感性、选择能力和消化吸收能力。
4. 信息能力
指理解、获取、利用信息能力及利用信息技术的能力。
5.信息道德
是指在信息领域中用以规范人们相互关系的思想观念与行为准则。
6.《SCI》
美国《科学引文索引》(Science Citation Index, 简称SCI )于1957 年由美国科学信息研究所在美国费城创办,是由美国科学信息研究所(ISI)1961年创办出版的引文数据库。
7.期刊
由依法设立的期刊出版单位出版。
8.影响因子
是美国ISI(科学信息研究所)的JCR(期刊引证报告)中的一项数据。
9.分类语言
是用分类号和相应的分类款目名称来表达信息内容的主题概念,并按学科体系的逻辑次序将信息资源系统地加以划分和组织的语言.
10.中图法
《中国图书馆分类法》(原名《中国图书馆图书分类法》,是我国图书馆和情报单位普遍
使用的一部综合性的分类法。
11.检索语言
是根据信息检索的需要创造出来的一种人工语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。
12.主题语言
所谓主题语言,是以自然语言的语词为字符,以规范化或未经规范化的名词术语为基本词汇,以概念之间的形式逻辑作为语法和构词法,用语词字顺排列,主题概念以参照系统显示概念之间关系的一类检索语言。
13.关键词
特指单个媒体在制作使用索引时,所用到的词汇。
14.一次文献
指以作者本人的研究成果为依据而撰写并公开发表或出版的信息。
15.二次文献
是对一定范围、时间或类型的大量一次文献按其特征收集整理、压缩、加工,并按一定顺序组织编排、用于检索查找利用这些文献而编制的文献。
如书目、索引、文摘、题录、简介等。
16.三次文献
三次文献是在充分利用二次文献的基础上对一次文献做出的系统整理和概括的论述,并加以分析综合编写而成的概括性文献。
17.零次文献
记录在非正规物理载体上的未经任何加工处理的源信息叫做零次信息.
18.学位论文
是指为了获得所修学位,按要求被授予学位的人所撰写的论文。
19.信息
信息指物质存在或运动方式与状态的表现形式或反映,是现实世界事物的反应,它提供了客观世界的消息、知识,是事物的一种普遍属性。
20.知识
是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的结果。
21.情报
情报是人们以各种方式传递与交流的具有一定目的与时效的信息,是人们为一定目的搜集的有使用价值的知识或信息。
22.文献
文献是记录有知识的一切载体。
二、简答题
1.简述信息检索的重要作用。
(1)能够全面地掌握有关的必要信息,增强决策的科学性
(2)提高信息利用的效率,缩短获取信息的时间
(3)有利于信息用户获取所需的全部信息
(4)提高信息素质和科研工作的成功率
(5)促进社会的进步和经济的发展
2. 核心期刊的定义及其特点。
所谓核心期刊,是指刊载与某一学科或专业有关的信息较多,且水平较高,能够反映该学科最新成果和前沿动态,受到该专业读者特别关注的那些期刊。
核心期刊是按一定的科学方法筛选出来的,旨在揭示一定时期中文期刊的发展概况,为图书情报界以及学术界提供的一种参考工具。
3. 简述信息检索的原理。
信息检索的实质是一个匹配过程,也就是信息用户需求的主题概念或检索表达式同一定信息系统的系统语言相匹配的过程,如果两者匹配,则所需信息被检中,否则检索失败。
4 简述文献信息的类型。
要有以下几种类型:1.印刷型文献2.微缩型文献3.机读型文献4.视听型文献
5. 什么是信息组织?
信息组织即信息的有序化与优质化,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和排序,实现无序信息流向有序信息流的转换,从而使信息集合达到科学组合实现有效流通,促进用户对信息的有效获取和利用。
信息组织具有:类聚性,系统性,动态性,多重性,综合性。
6. 简述主题词和关键词的异同。
主题词是规范化的检索语言,它对文献中出现的同义词、近义词、多义词以及同一概念的不同书写形式等进行严格的控制和规范,使每个主题词都含义明确,以便准确检索,防止误检、漏检。
主题词表是对主题词进行规范化处理的依据,也是文献处理者和检索者共同参照的依据。
而关键词是属于自然语言的范畴,未经规范化处理,也不受主题词表的控制。
7. 什么是文献?构成文献的四个要素是?
通过一定的方法和手段、运用一定的意义表达和记录体系记录在一定载体的有历史价值和研究价值的知识。
所谓文献,文,是文本记载,献,就是口头相传的。
文献的基本要素是:1.有历史价值和研究价值的知识;2.一定的载体;3.一定的方法和手段;4.一定的意义表达和记录体系。
人们通常所理解文献是指图书、期刊、典章所记录知识的总和。
文献是记录、积累、传播和继承知识的最有效手段,是人类社会活动中获
取情报的最基本、最主要的来源,也是交流传播情报的最基本手段。
8. 副主题词的作用是什么?
副主题词副主题诩对主题词进行限制,是为了提高检索的专指性。
MESH表中每个副主题词都有特定的含义和使用范围,分别与不同主题词组配。
检索中使用多少个副主题词为宜,取决于主题词的不同而不同。
副主题词是对主题词概念的进一步限制和划分,使主题词/副主题词的组配成为一个更专指的概念。
检索时,可选择一个或一个以上甚至全部的副主题词以防漏检,也可不选择副主题词检索(检索该主题词的一般性、总论性的文献)。
9. 专利文献的概念及特点是什么?
专利文献是包含已经申请或被确认为发现、发明、实用新型和工业品外观设计的研究、设计、开发和试验成果的有关资料,以及保护发明人、专利所有人及工业品外观设计和实用新型注册证书持有人权利的有关资料的已出版或未出版的文件(或其摘要)的总称。
⒈内容新颖,出版迅速;2.涉及技术领域广泛,实用性强;3.具有法律效力;4.技术工作具有单一性和保守性;5.重复量大
10. 文献按载体形式不同分为哪几种类型,并举例说明。
根据载体不同
最主要的是根据载体把其分为印刷型、缩微型、机读型和声像型。
(1)印刷型:是文献的最基本方式,包括铅印、油印、胶印、石印等各种资料。
优点查可直接、方便地阅读。
(2)缩微型:是以感光材料为载体的文献,又可分为缩微胶卷和缩微平片,优点是体积小、便于保存、转移和传递。
但阅读时须用阅读器。
(3)计算机阅读型:是一种最新形式的载体。
它主要通过编码和程序设计,把文献变成符号和机器语言,输入计算机,存储在磁带或磁盘上,阅读时,再由计算机输出,它能存储大量情报,可按任何形式组织这些情报,并能以极快的速度从中取出所需的情报。
出现的电子图书即属于这种类型。
(4)声像型:又称直感型或视听型,是以声音和图像形式记录在载体上的文献,如唱片、录音带、录像带、科技电影、幻灯片等。
11. 简述二次文献的类型。
二次文献种类很多,有文摘
指示性文摘
又称“简介”、“概述性文摘”,它只对原始文献作简用叙述,通过简要的文字,指示读者了解原始文献论述什么内容,以帮助读者确定是否需要阅读原始文献,起到检索作用;
报道性文摘
又称“全貌式文摘”、“信息性文摘”,它是它是原始文献的完整浓缩,概述了原始文献基本论点对原始文献的主要内容进行浓缩,起到报道作用;
指示—报道性文摘
将原始文献中信息价值高的部分写成报道性文摘,其余部分则写成指示性文摘,起到检索、报道作用。
索引
将文献中具有检索意义的事项(可以是人名、地名、词语、概念、或其他事项)按照一定方式有序编排起来,以供检索的工具书
目录
目录是记录图书的书名、著者、出版与收藏等情况,按照一定的次序编排而成,为反映馆范、指导阅读、检索图书的工具书。
12. 什么是文献的内容特征和外表特征?这两者有何区别?
与文献信息主题内容没有关系或关系不大的信息称为文献信息的外表特征,例如,著者、著者单位、期刊名称、专利说明书的专利号、政府报告的报告号等。
与文献信息主题内容密切相关的信息称为文献信息的内容特征。
文献信息内容特征主要有各种形式的主题词和分类号。
文献的标题因常常能够反映文献的主题,常被归入内容特征的范畴。
内容特征和外表特征的区别是:与文献信息内容特征的关系密切的是内容特征,反之是外表特征。
13. 什么是检索语言?它在信息检索中起到什么作用?
是根据信息检索的需要创造出来的一种人工语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。
检索语言是一种受控语言,它依据一定的规则对自然语言进行规范,将其编制成表,供信息标引以及检索时使用。
①特征标引文献信息内容及其外表特征,保证不同标引人员表征文献的一致性;②相关性对内容相同及相关的文献信息加以集中或揭示其相关性;③有序化检索使文献信息的存储集中化、系统化、组织化,便于检索者按照一定的排列次序进行有序化检索;④一致性便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性;⑤最高全准率保证检索者按不同需要检索文献时,都能获得最高查全率和查准率。
14. 检索语言的种类?
(1)自然语言(关键词、题名即标题、全文、引文、作者和摘要等)
(2)人工语言(分类检索语言、主题检索语言、代码检索语言)
15. 什么是分类语言?
分类语言是一种族性检索,是按学科、专业集中文献信息,并从知识分类角度揭示各类文献信息在内容上的区别和联系,提供从学科分类检索文献信息的途径。
三、论述题
1.试述信息、知识、情报和文献的概念及其相互关系。
信息:任何对未知数据的获得都是信息,这里当然有好有坏,有有用,有没用。
知识:为将来某种技能而提供的信息。
是通过人的大脑加工过的信息.只要你认为听了学了为你将来增加了技能就可称为知识。
文献:供查阅的资料总和称为文献。
你一般来说为了获得某种知识,会到文献中查你关心的知识,而不要求把整个文献都掌握了。
情报:有价值的信息。
信息是情报和知识的载体,情报是特指的专业信息,知识是信息的内核,知识依存于信息,信息经过提炼和加工可成为知识,知识是信息中的精华部分;信息的价值取决于其精华部分的价值,如果说信息是食物,那么知识则是食物中的营养成分。
知识组织最终要通过信息组织方式来实现。
2. 试述文献的级别及其相互关系。
(什么是零次文献、一次文献、二次文献和三次文献,它们之间的关系如何?)
根据对文献内容的加工程度,可将文献分为多个等级。
(1).一次(级)文献
即原始文献。
它是以生产或科研成果为依据而创造的原始文献。
专著、期刊论文、研究报告、专利文献、学位论文、会议文献以及译文,数字文献资源中的事实数据库、电子期刊、电子图书、发布一次文献的学术网站等,均属于一次文献。
(2).二次(级)文献
对一次文献加工整序后的文献,包括目录、索引、文摘、参考数据库、网络学术资源学科导航、搜索引擎/分类指南等。
二次文献是文献检索工具的主体。
(3).三次(级)文献
指为了一定的目的,通过二次文献利用一次文献进行再加工后编辑而成的文献。
综述、年鉴、进展、指南、百科全书、科技动态、决策参考、情报调研报告等属三次文献。
还有专门用于检索搜索引擎的搜索工具,比较典型的是被称之为“搜索引擎之搜索引擎”,即“元搜索引擎”,当用户进行检索时,反映出来的结果是各搜索引擎的检索结果。
(4).零次(级)文献这是二十世纪七十年代提出的一个概念,经过长时间讨论得不到普遍认同,故不做具体介绍。
3. 信息检索的基本方法与途径。
信息检索的主要途径包括主题词检索、分类检索、关键词(或自由词)检索及其它途径检索。
(一)主题词检索
主题词检索是根据标引人员按照规范词表标引出的主题词进行检索。
其优点是能满足特性检索要求,专指性强;能适应新兴学科及多学科文献检索,只要根据新学科的出现、发展及多学科的需要,随时增加主题词,就能快速检出所需文献。
其缺点是主题词选择必须准确,否则无法进行查找;由于主题词的规范性,因此输入的主题词必须完全正确,因此每次使用需要查找主题词表较费时间。
目前国内外采用主题词检索的数据库其使用的主题词表均具主题词检索和分类检索的特点,因而也可适应检索范围大、内容广的课题。
(二)分类检索
分类号检索是根据按一定规则编排的分类表进行检索。
其优点是能满足族性检索的要求,便于查全某一学科或某一专业的文献;易于扩大或缩小检索范围,扩大时可取上位
类,缩小时可取下位类。
(三)关键词(或自由词)检索
关键词(或自由词)检索的最大优点是词语不必规范化,用户可根据自己的需要,选择熟悉的词语进行检索,不用特意记忆或事先查找词汇,比较方便。
其缺点是容易漏检,因而使用这种途径进行检索时,必须同时考虑多个同义词、近义词,以减少漏检。
(四)其它途径检索
许多医学的分支学科根据自身的不同需求编制了一些特殊的索引,为用户提供独特的检索途径。
如化学数据库的分子式索引,生物学数据库的属种索引等。
其优点是方便了专业用户的检索。
其缺点是掌握起来比较困难。
二、检索方法(一)计算机检索的主要方法
1、截词检索法
截词检索法,是为了在检索中避免西文单、复数的区别,以及名词、形容词的区别,保证检索的查全率,保持词的部分一致所采用的方法。
有前方一致、后方一致、中间一致、中间不一致等形式。
如后方一致,是保持检索词的后面一部分的一致性。
2、组配检索法
所谓组配即两个以上概念的组合。
组配检索法即将表示提问的检索词用布尔逻辑连接成一个检索提问式进行计算机检索的一种方法。
一般用and表示和的关系,用or表示或的关系,用not(and not)表示否的关系。
3、加权检索法
即检索者(用户)根据检索词的重要关系,分别给每一个检索词赋予一个值,经过特定的加权运算后,输入一个规定值,以此值的大小决定收取文献。
4、扩展检索法
扩展检索法,是为节省时间并保证查全率所采用的应用上位概念扩展查找有关文献的方法。
(二)手工检索的主要方法
1、常用法
(1)顺查法:自课题研究的起始年代,由远而近查找。
只要知道某一专题是从何年何时开始研究,某一药品、方法或技术是在某年被发现或发明,就可从该年度开始查找线索。
缺点是费时、费力、工作量大。
(2)倒查法:与顺查法相反,由近而远、逆时间顺序的检索方法。
一般由当年开始,倒查1-2年或5年、10年。
查到的文献虽不如顺查法系统、但灵活、节省时间、效率高。
(3)抽查法:是针对学科或课题的研究特点,根据文献资料发表集中的年代或时期,抽出其中一段时间进行文献检索的方法。
一般适合在熟悉该学科、课题发展特点的情况下使用。
2、追溯法
追溯法是利用现有文献资料后面所附的参考文献进行追溯查找的方法。
一般多利用述评、综述或专著进行追踪查找。
查到这些文献有助于对论文的背景和立论依据的深入理解,但缺点是漏检、误检的可能性较大。
3、分段法
也叫循环法、交替法。
是交替使用“常用法”和“追溯法”进行查找的综合性文献检索方法。
这种检索方法多在医学科研人员选定了课题、制定了科研计划后才使用,或检索工具不全时使用。
4. 信息素质有哪些评价标准?
5. 举例说明什么是信息描述。
信息描述是对信息资源进行著录、标引、评价的过程。
既是按照要求傻瓜式的“填空”,也是一个需要一定知识和技能的创造性智力劳动。
一个好的描述,不仅仅方便用户了解信息资源对象,减少用户利用信息资源的时间,而且能方便用户检索和信息整合。
四、填空题
简称ISBN)。
9. 共同使用的约定语言。
10. 文献获取与利用的过程中存在三重语言障碍,分别为:文献获取与利用的过程
中存在三重语言障碍。
11.
12. 二八定律在期刊文献检索中的体现是:20%的期刊登载了80%的重要文献,体
现这种特性的期刊是核心期刊。
13.专利__是用法律来保护科学技术发明创造所有权不受侵犯的一种制度。
专利
文献_主要是指专利说明书即发明人向政府专利主管机构申请专利的发明创造说明文件。
15. 在医学文献领域,最具代表性的主题词法是美国国立医学图书馆的医学主题词
表
16. ISSN是标准国际连续出版物号 (International Standard Serial Number,简
称ISSN)。
17.
书,需要在S类目下查找。
18.
19. 期刊论文属于
20. 目录属于二次文献。
21. 综述属于三次文献。
22. 《中国图书分类法》(简称《中图法》)将图书分成26 大类。
23. 纸质信息源的载体是纸张。
26. 广义的文献检索包括文献的储存和文献的检索两个过程。
27. 信息种类分、、
和。
其中分类法常用的。
29.
和书次号组成。
literature
34. 我国专利法保护的专利分为发明专利、实用新型专利和外观设计专利三种类型;它们的保护年限分别是
35.
36.
37.
38.
业会议成为科技人员了解世界科技发展水平与动向、结识新老朋友、展示自己科技成果的重要阵地。
40. 按照联合国科教文组织1961年规定:5-4950页以上印刷品为图书。
41. 学位论文包括学士论文、硕士论文和博士论文。
42. 文献是指记录有知识_的一切载体。
文献定义包含的四个基本要素是:知识内容,信息符号,载体材料,记录方式。
43.
属三次文献;目录、索引属二次文献;期刊论文和科技报告属文献。
45. 情报的基本属性:、、。
第3章至第4章
一、名词解释
1. 查全率:
查全率是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标,即检出的相关文献与全部相关文献的百分比。
2.查准率:
查准率(Precision)(精度)是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。
3.目录:
是指书籍正文前所载的目次,是揭示和报道图书的工具目录是记录图书的书名、著者、出版与收藏等情况,按照一定的次序编排而成,为反映馆藏、指导阅读、检索图书的工具。
在计算机应用中,目录的发展成了“文件夹”。
4.索引:
使用索引可快速访问数据库表中的特定信息。
索引是对数据库表中一列或多列的值进行排序的一种结构。
5.文摘:
检索刊物中描述文献内容特征( 文献提要 )的条目(也包括题录部分),是一种文献著录的结果。
6.检索途径
7.是一种按照文献资料所属学科属性进行检索的途径。
8.元搜索引擎
元搜索引擎就是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适
的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。
9.全文检索:
全文检索是一种将文件中所有文本与检索项匹配的文字资料检索方法。
10.文献检索
是指根据学习和工作的需要获取文献的过程。
11.数值检索
:将经过选择、整理、鉴定的数值数据存入数据手册、数据汇编或数据库中,然后根据需要查出可回答某一问题的数据的过程。
亦称数值数据检索或数据检索。
12.事实检索
事实检索是情报检索的一种类型。
广义的事实检索既包括数值数据的检索、算术运算、比较和数学推导,也包括非数值数据 (如事实、概念、思想、知识等) 的检索、比较、
演绎和逻辑推理。
13.顺查法
顺查法是指按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。
14.倒查法
倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。
14.抽查法抽查法是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。
15. 追溯法
是指不利用一般的检索系统,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献信息范围,一环扣一环地追查下去的方法。
它可以像滚雪球一样,依据文献间的引用关系,获得更好的检索结果
16. 循环法
又称分段法或综合法。
它是分期分交替使用直接法和追溯法,以期取长补短,相互配合,获得更好的检索结果。
17. 布尔检索
布尔检索是数据库检索最基本的方法,是用逻辑“或”(+、OR)、逻辑"与"(×、AND)、逻辑"非"(-、NOT)等算符在数据库中对相关文献的定性选择的方法。
18. 截词检索截词检索是预防漏检提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。
截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。
19. 位置检索
位置检索也叫临近检索。
文献记录中词语的相对次序或位置不同,所表达的意思可能不同,而同样一个检索表达式中词语的相对次序不同,其表达的检索意图也不一样。
20. 字段检索
21. 词组检索
23.百度快照
是指每个被百度收录的网页,百度的服务器都会将这个页面的纯文本部分备份收藏起来。
要
24.全文搜索引擎
全文搜索引擎是目前广泛应用的主流搜索引擎。
24. 检索策略
检索策略,就是在分析检索提问的基础上,确定检索的数据库、检索的用词,并明确检索词之间的逻辑关系和查找步骤的科学安排。
25. 搜索引擎搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
二、简答题
1. 信息检索的基本步骤。