复习题(有答案)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
复习题(有答案)
复习题
一、名词解释及简答
信息的概念及特征
文献及分类
情报、信息、知识、文献的关系
目录
追溯法
文献信息资源
ISBN和ISSN的组成及组成部分的含义
《全国报刊索引》
信息检索的含义及分类(广义的信息检索)
信息检索语言
信息检索的基本原理
布尔逻辑运算中的各种符号的含意
图书馆各种数据库的检索途径
计算机检索系统的构成
计算机信息检索常用的检索技术
四大权威检索数据库是哪些?
专利及分类
试比较分类语言与主题词语言
按信息加工形式分,信息源分为一次文献、二次文献和三次文献,请简述它们及其之间的关系
什么是查全率和查准率?影响查全率和查准率的因素有哪些?
常用的布尔逻辑算符有几种?并简述各自的作用
文献综述
学位论文的含义及分类
参考文献的著录格式
1. 知识:
知识是人们通过实践对客观事物及其运动过程和规律的认识。
主观知识、客观知识。
2. 检索工具:检索工具是指用以报导、存贮和查找文献线索的工具。
它是附有检索标识的某一围文献条目的集合,是二次文献。
3. 信息检索:广义的,包括信息的存储和检索两个过程,信息存储——指工作人员将大量无序的信息集中起来,根据信息源的外表特征和容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。
信息检索——指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。
狭义信息检索:仅指信息的检索过程。
从某一信息集合中找出所需的信息的过程,即信息查询。
4. 信息:信息是人们通过感觉器官与外界进行交换的一切容。
1. 知识:知识是人们通过实践对客观事物及其运动过程和规律的认识。
主观知识、客观知识
2. 信息:信息是人们通过感觉器官与外界进行交换的一切容。
3. 信息检索:广义的,包括信息的存储和检索两个过程,信息存储——指工作人员将大量无序的信息集中起来,根据信息源的外表特征和容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。
4. 检索工具:检索工具是指用以报导、存贮和查找文献线索的工具。
它是附有检索标识的某一围文献条目的集合,是二次文献。
5. 查全率:查全率=[检出相关文献量/文献库相关文献总量]×100%
查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。
5.信息存储:是指通过多种形式记录和排序信息的过程。
它包含三层含义:一是将所采集的信息按照一定规则记录在相应的信息载体上;二是将这些载体按照一定的特征和容性质组织成系统有序的、可
供自己或者他人检索的集合体;三是应用计算机等先进的技术和手段,提高信息存储的效率和信息利用水平。
6信息检索:是指从以任何方式组成的信息集合中,查找特定用户在特定时间和条件下所需信息的方法与过程。
7.数据仓库:Data Warehouse,是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。
(4)语义编码:语义编码就是用一组数字或字符描述客观实体或实体的属性。
(5)语义网:是互联网研究者对下一代互联网的称谓,通过扩展现有互联网,在信息中加入表示其含义的容,使计算机可以自动与人协同工作。
也就是说,语义网中的各种资源不再只是各种相连的信息,还包括其信息的真正含义,从而提高计算机处理信息的自动化和智能化。
(6)Ontology:本体,是共享概念模型的形式化规说明。
本体的概念包括四个主要方面:概念化:客观世界的抽象模型;明确:概念及它们之间的联系都被精确定义;形式化:精确的数学描述;共享:本体中反映的知识是其使用者共同认可的。
二. 判断题(对的打“√”,错的打“×”)(10分)
1.国大多数图书馆都把《中国图书馆分类法》作为图书排架的依据。
(√)
2.区分图书和期刊的主要标准是看厚薄情况。
(×)
3.搜索引擎建立的索引与目录服务相同,都是搜集网页上的单词。
(×)
4.使用我馆“万方数据资源系统”可以查找相关标准全文。
(×)
5.要检索全面的学术期刊,用Google、百度搜索引擎就可以检索到。
(×)
6.在维普数据库检索系统中能查到企业名录。
(×)
7.利用图书馆的书刊目录查询系统,可以了解该图书馆收藏有哪些印刷型图书和期刊。
(√)
8.截词检索相当于用逻辑“与”缩小检索的围,可以提高检索的查全率。
(×)
9.判定一个检索系统的优劣,主要从质量、费用和时间三方面来衡量。
(√)
10.综述论文因附有大量参考文献,所以是二次文献。
(×)三次
11.通过“万方数据资源系统”可以查找法律法规文献的全文。
(√)
12.SD数据库是世界最权威的全文数据库,要检索英文全文只要检索我馆订购的SD数据库
就可以。
(×)
13.判定一个检索系统的优劣,主要从质量、费用和时间三方面来衡量。
(√)
14.通过“万方数据资源系统”可以查找法律法规文献的全文。
(√)
15.要检索全面的学术期刊,用Google、百度搜索引擎就可以检索到。
(×)
16.在维普数据库检索系统中能查到企业名录。
(×)
17.利用图书馆的书刊目录查询系统,可以了解该图书馆收藏有哪些印刷型图书和期刊。
(√)
18.截词检索相当于用逻辑“或”,扩展检索的围,可以提高检索的查全率。
(√)
19.搜索引擎建立的索引与目录服务相同,都是搜集网页上的单词。
(×)
20.综述论文因附有大量参考文献,所以是二次文献。
(×)
21.在网吧无法查找期刊原文是因为网速太慢。
(×)
22.信息时代的专业界限越来越模糊。
(√)
23.图书的容较期刊更系统更成熟,所以情报价值也更大。
(×)
24.网上翻译工具可以帮助人们进行多语种互译。
(√)
25.专利文献可以从网上免费浏览和下载。
(√)
26.掌握了网上的搜索引擎就可以获得需要的文献。
(×)
27.布尔逻辑运算中的“与”,英文用“AND”表示,中文含意是“和”。
(×)
28.《中国学术期刊数据库》提供核心期刊论文检索途径。
(×)
29.各种数据库的主要检索途径一般是分类方式。
(×)
30.浏览器的汉字识别功能能够识别数学公式。
(×)
31.情报检索语言是勾通情报存贮与检索二个过程的。
(√)
32.检索语言是用来描述文献、外部特征和表达检索提问的一种人工语言。
(√)
33.二次文献是检索一次文献的工具。
(√)
34.用逻辑运算符“AND”来处理检索词,可以扩大检索围,提高查全率。
(×)
35.搜索引擎也是一种检索工具,可以检索INTERNET上巨大的信息资源。
(√)
36.搜索引擎是一种网络信息资源检索工具是以各种网络信息资源为检索对象的查询系统.。
(√)
37.INTERNET上使用的基本网络协议是HTTP。
(×)
38.著者索引是属于描述文献容特征的索引。
(×)
39.文献检索过程中,查全率和查准率是正相关关系。
(×)
四、选择题(每个3分共18分)
1.情报、信息、知识、文献的概念关系为( B )。
A 情报> 信息> 知识> 文献
B 情报< 文献< 知识< 信息
C 信息> 情报> 文献> 知识
D 文献< 情报< 信息< 知识
2. 文献的基本要素有( B )。
A知识容和载体材料B知识容、信息符号和载体材料
C信息符号和载体材料D知识容和载体材料
3. 下面哪一个属于二次文献?( D )
A.演讲稿B.期刊论文
C.CNKI期刊数据库D.学位论文
4.常说的四大权威数据库是指( B )。
A SCI、CSSCI、EI、ISTP
B SCI、SSCI、EI、ISTP
C CNKI、SSCI、EI、ISTP
D CSCD、SSCI、EI、ISTP
5. 《万方学位论文数据库》有以下检索途径(ABCD )。
A 作者
B 题目
C 导师
D 单位
6. 检索工具的类型有(B )。
A 目录型检索工具、题录型检索工具和索引型检索工具
B 目录型检索工具、题录型检索工具、文摘型检索工具和索引型检索工具
C 目录型检索工具、文摘型检索工具和索引型检索工具
D 目录型检索工具、题录型检索工具和索引型检索工具
7、信息检索的类型有( C )
A .文献检索、数据检索 B.光盘检索、数据检索、事实检索
C.文献检索、数据检索、事实检索
D.文献检索、数据检索、网络检索
8、布尔逻辑检索包括( D )。
A 逻辑“与”和逻辑“异或”
B 逻辑“与”和逻辑“或”
C 逻辑“+”和逻辑“-”
D 逻辑“与”、逻辑“或”和逻辑“非”
答:D。
逻辑检索是三种,and or not
9、哪一部分不是ISBN的组成部分(C )?
A 语种代号
B 出版社代号
C 作者代号
D 计算机校验码
10、浏览器的功能包括(ABD )。
A 浏览原文
B 识别文本
C 识别图表
D 剪切图片
11、常说的四大权威数据库是指(B)。
A SCI、CSSCI、EI、ISTP
B SCI、SSCI、EI、ISTP
C CNKI、SSCI、EI、ISTP
D CSCD、SSCI、EI、ISTP
12、搜索引擎的分类有(C)。
A 目录式搜索引擎,检索型搜索引擎
B 混合型搜索引擎,多元搜索引擎
C 目录式搜索引擎,检索型搜索引擎,混合型搜索引擎,多元搜索引擎
D 简单搜索引擎,混合型搜索引擎,多元搜索引擎
15、以下四种数据库,哪一个不属于国外权威引文数据库?(D )
A SCI
B EI
C ISTP
D CNKI
16.工程索引的缩写为(C)。
A.SCI B.CSSCI C.EI D.ISTP
17.ISSN是哪种文献特有的标识(D)
A 会议文献B标准文献C学位论文D期刊
18.ISBN是哪种文献特有的标识(A)
A图书B期刊C 科技报告D专利文献
19.下列哪个不是一次文献。
(c)
a、期刊论文
b、专利文献
c、综述
d、专题著述
20.下列文献类型中不属于三次文献的是:(c)
a、百科全书
b、年鉴
c、会议文献
d、词典
21.二次文献是:(c)
a、百科全书
b、综述
c、检索工具
d、词典
22.目录、索引、文摘都属于:(b)
a、一次文献
b、二次文献
c、三次文献
d、零次文献
23.检索工具按著录方式划分,主要有:(c)
a、主题、著者、书名目录
b、综合性、专业性、专题性检索工具
c、目录、索引、文摘、书目之书目
d、手工检索工具、计算机检索工具
24.从物理构成角度来看,计算机检索系统一般由下列哪些部分组成。
(abc)
a、应用软件
b、应用硬件
c、数据库
d、信息系统
25.通过参考文献获取原绐文献是属于下列哪种检索方法。
(a)
a、追溯法
b、顺查法
c、倒查法
d、分段法
26.常用数据库中的“基本检索”属于下面哪一种检索类型?(c)
a、索引词检索
b、概念检索
c、字面检索
d、扩展检索
27.关于检索,如按检索对象不同,可分为以下哪三种:(abc)
a、数据检索
b、事实检索
c、文献检索
d、查新检索
28.在机检中,缩小检索围的检索方式是:(ab)
a、用AND连接检索词
b、用NOT连接检索词
c、用OR连接检索词
d、使用截词符
29.以下检索式中,哪个能检出"儿童"和"佝偻病"在同一字段中的文献。
(c)
a、儿童or 佝偻病
b、儿童and 佝偻病
c、儿童with 佝偻病
d、儿童not 佝偻病
30.下列检索方法中,查全率较高的是:(c)
a、追溯法
b、倒查法
c、顺查法
d、分段法
31.评价检索系统检索效果的标准有:(abcd)
a、查全率
b、查准率
c、收录围
d、响应时间
32.文献检索效果的主要指标是:(bd)
a、收录围
b、查全率
c、用户负担
d、查准率
33.cajviewer是下面哪种数据库全文的阅读软件:( C )
A 超星数字图书馆B中国学位论文库
C 中国期刊全文库
D 中国科技期刊库
34.目前我校引进中国知网CNKI平台收录围( F )
A 中国期刊全文库
B 中国优秀博硕士论文全文库
C 中国重要会议论文全文库
D 中国专利全文库
E 中国重要报纸全文库
F 以上所有CNKI数据库均在我校引进之列
35.PQDD是( B )
A.会议文献数据库
B.学位论文数据库
C.标准文献数据库
D.科技报告数据库
36.AD,PB,NASA,DOE 是四大美国政府报告,其中NASA是指( D )
A.行政报告B,能源报告C,军事报告D,宇航报告
37.SCI历来被公认为世界围最权威的文献的索引工具.( A )
A.科学技术
B.生物技术
C.人文社会科学
D.哲学
38.下面不是布尔逻辑算符的是:( D )
A NOT
B 0R
C AN
D D NEAR
39.下列不是特种文献的有(D)
A 专利文献B学位论文C政府出版物D电子图书
三. 填空题(20分)
1. 计算机检索系统主要由计算机、检索终端、数据库、通讯网络构成。
2. 文献具有知识性、记录性、物质性等属性特征。
3. 专利号为ZL99122528.7的专利是发明专利(类型的)专利。
4. IPC 是国际专利分类号,其作用是提供从分类途径查找专利。
5. 在计算机信息检索系统中,按不同检索系统对检索词的匹配能力划分为简单检索和高级检索,其中高级检索主要检索技术为:逻辑算符组配法、位置逻辑算符组配法和_截词检索法
6. 信息检索根据其检索对象的不同可分为_文献_检索、事实检索、数据检索。
7. 按文献载体类型划分,文献可分为纸介型、缩微型、声像型、电子数字型。
8.据对文献容的不同加工深度可区分为一次文献、二次文献、三次文献。
9.著者地址的获取方法有两种:(利用检索工具本身的文献款目),(利用查找著者地址的工具书)。
10.正式出版的中文期刊在检索工具和数据库中一般著录有国际标准刊号(ISSN)和国统一刊号(CN)。
11.参考数据库(reference database)指(包含各种数据,信息或知识的原始来源和属性的)数据库。
12.参考数据库的类型主要包括(书目数据库,文摘数据库,索引数据库)。
13.完整的信息检索系统是由( 检索)和( 存贮)两部分构成。
14.文献容特征的检索途径主要有( 主题)和( 分类)。
15.文献检索方法分为( 常用法),(追溯法)和(循环法)。
16.我国把专利分为(发明专利),(实用新型专利),(外观设计专利)三大类.。
17.专利的三个特点为(专有性)(时间性)(地域性)。
18.专利的三条性质(新颖性),(创造性),(实用性)。
19.专利说明书的容主要包括(扉页)(说明书正文)(附图)。
20.(报告号)是识别科技报告的显著标志.。
21.专利文献著录中,除了和专利有关的(专利名称),(发明人)和(专利权人)等之外,还著录有(专利公布号),(国际专利分类号),(优先权号),有的还有申请号和申请日期,公布日期等。
/doc/1d537135.html,KI平台中知网节包括(文献)知网节,(作者)知网节,(机构)知网节。
.
/doc/1d537135.html,KI平台的检索方式有(单库检索),(跨库检索),(数据库导航),在单库和跨库检索中有(初级),(高级),(专业)。
24.电子期刊,指以(数字或称电子)形式出版发行的期刊,英文为(electronic Journal),简称e-journal。
25._知识__、_载体___、_记录__是构成文献的三个基本要素。
26.按检索方法划分,检索工具可分为_手工检索_工具、_计算机和网络检索工具。
27.广义的信息检索实际上包括文献的_存储__和文献的_检索_两个相互依存的过程。
28.在计算机信息检索系统中,常用的检索技术主要有布尔逻辑检索、截词检索、位置检索、限制检索和加权检索_等。
29.在许多数据库中,都有“二次检索”功能,“二次检索”指:在前一次检索基础上再检索。
四、简答
1. 简述信息组织、存储与检索的关系。
答:信息组织、存储与检索三者是不可分割的。
信息检索是通过信息存取系统(即检索工具)来实现的,任何一种信息存取系统都包括信息存储子系统和信息检索子系统,它们是同一事物中既相互对立又相互联系、互为依存的两个方面,而信息存取系统的建设,需要信息组织。
信息组织在信息资源开发中具有重要的地位,在信息管理中具有承上启下的作用,它是建立信息系统的重要条件,是信息存储与检索的基础。
所以,三者是不可分割的。
2. 简述信息存储的含义及作用。
答:信息存储是指通过多种形式记录和排序信息的过程。
它包含三层含义:一是将所采集的信息按照一定规则记录在相应的信息载体上;二是将这些载体按照一定的特征和容性质组织成系统有序的、可供自己或者他人检索的集合体;三是应用计算机等先进的技术和手段,提高信息存储的效率和信息利用水平。
存储子系统的建设,要求根据一定的原则记录和描述信息或知识载体的容与形式特征,然后按特征序化成各类信息集合并组织成系统。
信息存储部分是揭示信息特征、整序信息、建设系统的过程。
只有经过记录、描述与组织序化的知识集合,才能提供有效的信息检索。
因此,信息存储是基础,信息检索是目的。
3. 信息存储体系的容是什么(计算机信息存储体系)?
答:本书描述的信息存储体系是指计算机信息存储体系。
计算机信息存储体系是利用计算机对一定围的信息集合进行选择、记录、存储,以便用户采用科学手段和技术获取必要和充分信息资源的计算机信息系统。
从整体上看,计算机信息存储系统包括硬件、软件和数据库。
4. 简述数据仓库的特点及数据库与数据仓库的区别。
答:数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。
数据仓库的特点及数据库与数据仓库的区别如下:
①面向主题,数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织;
②集成的,数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。
而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库的信息是关于整个企业的一致的全局信息;
③相对稳定,数据库中的数据通常实时更新,数据根据需要及时发生变化。
数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新;
④反映历史变化,数据库主要关心当前某一个时间段的数据,而数据仓库中的数据通
常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息。
5. 语义网由哪几层构成?每一层的含义是什么?
答:理论界一致认同的语义网模型由以下几层构成:
第一层:Unicode与URI,是整个体系结构的基础。
其中Unicode负责处理资源的编码,URI负责资源的标识;第二层:XML+NS(Namespace)+ XML Schema。
负责从语法上表示数据的容和结构,通过使用标准的格式语言将网络信息的表现形式、数据结构和容分离。
第三层:RDF+ RDF Schema,它提供的语义模型用于描述网上的信息和类型。
第四层:本体词汇层(Ontology Vocabulary)。
负责定义共享的知识,描述各种信息之间的语义关系,揭示信息本身和信息之间的语义。
第五层:逻辑层(Logic)。
负责提
供公理和推理原则,为智能服务提供基础。
第六层证据层(Proof)和第七层的信任层(Trust)负责提供认证和信任机制。
6. 简述Ontology与传统数据库的区别。
答:本体可以用于描述比普通数据库更复杂的对象的语义结构,因此它很适合于描述异种的、分布的、半结构的信息资源,如网上的信息。
本体模型与传统数据库的不同之处在于:(1)定义本体模型的语言比通常数据库所使用的语言在语义、语法上更加丰富;
(2)本体模型所描述的信息是半结构化的自然语言文本而非列表式的信息;
(3)一个本体模型必须使用用于信息共享和交换的公用的术语;
(4)一个本体模型提供的是一个特定领域的知识模型而非数据容器的结构。
7. 分析信息检索的分类以及信息检索系统的分类。
答:信息检索根据检索的目的和对象不同,可以分为书目信息检索、全文信息检索、数据信息检索和事实信息检索。
信息检索系统是拥有一定的存储、检索技术装备,存储经过加工的各类信息,并能为信息用户检索所需信息的服务系统。
信息检索系统按使用的技术手段可分为手工检索系统、机械检索系统和计算机检索系统。
8. 分析搜索引擎的原理及相关技术。
答:搜索引擎(Search Engines)是指对WWW站点资源和其它网络资源进行标引和检索的一类检索系统机制。
从广义上讲,搜索引擎应包括两部分:一是对信息的采集、存储和组织。
二是信息检索。
从狭义上讲,搜索引擎是针对用户而言的,即进行信息检索。
其基本检索构成主要是从这一层面来进行描述的。
主要由关键词检索和分类浏览两部分构成。
一个搜索引擎由搜索器、索引器、检索器和用户接口四个部分组成。
(1)搜索器,搜索器的功能是在互联网中漫游、发现和收集信息。
(2)索引器,索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。
(3)检索器,检索
器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。
⑷用户接口,用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。
9.文献的概念及分类
文献是记录知识的一切载体。
文献具有三个基本属性,即文献的知识性、记录性和物质性。
它具有存贮知识、传递和交流信息的功能。
依据文献传递知识、信息的质和量的不同以及加工层次的不同,人们将文献分为四个等级,分别称为零次文献、一次文献、二次文献和三次文献。
(1)零次文献
这是一种特殊形式的情报信息源,主要包括两个方面的容:一是形成一次文献以前的知识信息,即未经记录,未形成文字材料,是人们的口头交谈,是直接作用于人的感觉器官的非文献型的情报信息;二是未公开于社会即未经正式发表的原始的文献,或没正式出版的各种书刊资料,如书信、手稿、记录、笔记,也包括一些部使用、通过公开正式的订购途径所不能获得的书刊资料。
零次文献一般是通过口头交谈、参观展览、参加报告会等途径获取,不仅在容上有一定的价值,而且能弥补一般公开文献从信息的客观形成到公开传播之间费时甚多的弊病。
(2)一次文献
这是人们直接以自己的生产、科研、社会活动等实践经验为依据生产出来的文献,也常被称为原始文献(或称一级文献),其所记载的知识信息比较新颖、具体、详尽。
一次文献在整个文献系统中是数量最大、种类最多、使用最广、影响最大的文献,如期刊论文、专利文献、科技报告、会议录、学位论文等等。
这些文献具有创新性、实用性和学术性等明显特征,是科技查新工作中进行文献对比分析的主要依据。
(3)二次文献
二次文献也称二级文献,它是将大量分散、零乱、无序的一次文。