信息存储与检索 考试必看
信息存储与检索重点
内容的揭示深度和检索入口,并直接影响
到用户查询的检索方式和检索途径。其功
能是用系统规定的规范化词语描述用户的
检索询问,包括对用户询问进行概念分析
和概念转换两个过程,也包括按照系统的
既定规则制定检索策略和构建检索式。该
子系统完成对数据库的查找过程,并与交
互子系统共同完成信息检索系统的检索功
能。
19
《信息存储与检索》
22
2.2.1 布尔模型
❖定义 对于布尔模型而言,标引词权值变量都是二 值的,即wi,j∈{0, 1},查询q是一个常规的布尔表达 式。用qdnf表示查询q的析取范式,qcc表示qdnf的任意 合取分量。文档dj和查询q的相似度可以定义为:
sim(d
j
,
q)
1
0
如果qcc (qcc qdnf ) (ki , gi (d j ) gi (qcc )) 其它
现 实 的
(2)表示机理
信 息
需 求
(3)比较机理
输出检索结果 图1-2 信息检索的一致性匹配作用机理
(4)判断机理 (5)选择机理
5
《信息存储与检索》
1.1.2 信息检索的原理
1、提取机理:从现实的信息和现实的需求 中提取出能够揭示特定信息和特定需求的语 法特征和语义特征。可以归纳为内容特征和 形式特征。
交 互 子 系 统 用户群
词语子系统 查 询 子 系 统
数据库
匹配子系统
图1-9 信息检索系统逻辑结构
标
采
引
选
子
子
系
系
统
统
信息源
16
《信息存储与检索》
1.2.4 信息检索系统的逻辑结构
信息检索原理期末重点背诵知识点
信息检索1、信息检索概念:P12、信息检索的原理一整节内容要自己理解:P3-P4图1-1要掌握文献替代和文献整序的概念要掌握3、信息检索在历史上的不同表现:联机检索、光盘检索、网络检索的区别和特征:P6-P94、信息检索的模型概念:P95、布尔模型、向量空间模型、经典概率模型要理解并掌握各自的优缺点:P11-P126、信息检索系统的概念:P127、检索效果的评价指标:P15-P164个指标:查全率、查准率、漏检率、误检率掌握它们的含义并懂得计算8、网络检索的表达式:布尔逻辑检索、邻近检索、短语检索、截词检索的特点、区别和联系:P17-P219、信息检索的技巧要理解尤其是要掌握及时调整检索策略:P33-P3610、搜索引擎的概念:P3711、数据库知识,实验内容,特点12、引文的概念13、搜索引擎的分类:P40-41搜索引擎划分的类别以及元搜索引擎的概念要掌握12、CBR概念P11312、多媒体信息检索的原理和方法:P110-P114其中要重点理解基于内容的多媒体信息检索的检索形式(可以结合课件)13、专利的概念:P12514、专利的类型:P126(理解一下各类型的区别)15、专利文献的概念:P12716、专利文献的类型:P127(理解一下各类型的区别)17、灰色文献的概念:P14718、会议文献的概念:P15819、科技报告的概念:P16320、查新的概念:P20021、科技查新的作用:P201(每一个小标题后面要自己展开一段)关于上课讲的那几个数据库大家自己看一下PPT,掌握一下。
以上纯属个人观点题型:名词解释:5*4=20简答题:4*10=40论述题:2*20=40考试时间:1月8日上午:9:00—11:001.信息检索的概念(P1)信息检索有广义和狭义两重含义。
广义上说,信息检索是指将信息按照一定的方式组织和存储起来,并根据信息用户的需求查找相关信息的过程。
它包含信息存储和信息查找两个过程。
信息存储与检索考试必看
信息存储与检索考试必看一、填空1、信息资源的特征:共享性、时效性、智能性、无限性和有线性并存、增值性及物质、资源的一般特征。
2、纸质文件按文献加工深度划分:一次文献、二次文献、三次文献、零次文献。
3、索引款目的构成:索引标题、说明语、地址参考项。
4、多媒体存取技术的核心是:媒体数据库技术。
5、网络信息检索工具有:字典型查询工具、索引型查询工具、交互式检索工具。
6、按系统存取的信息特征划分:文献存取系统、事实存取系统、数值存取系统、图像存取系统。
7、按检索工具划分:关键词检索工具、分类目录、混合型检索工具。
8、纸质文献资源的四个基本要素:信息内容、载体材料、记录符号和记录方式。
9、按检索系统的工作方式划分:脱机存取、联机存取、光盘存取、因特网存取。
10、文献存取系统包括:书目、全本和超文本。
11、存取系统的检索效果指标:检全率、检准率、检新率。
12、多元性检索工具:13、中文搜索引擎:谷歌、百度、雅虎、中国搜索、搜狗搜索等。
(三个可)14、多媒体信息存取系统的特征:信息载体的多样性、交互性、实时性、集成性。
二、名称解释:1、电子信息资源是以数字化形式把文字、图像、声音、动画等多种形式的信息存储在光、磁盘等非印刷型介质上,并以光信号、电信号的形式传输,通过相应的计算机和其他外部设备再现出来的信息资源。
2、索引是存取信息资源“地址”或“出处”的表示系统,是信息存储与检索的基本形式。
其基本功能是指示知识点在正文或文献款目中得位置。
3、标准文献狭义指按规定程序制订,经公认权威机构(主管机关)批准的一整套在特定范围(领域)内必须执行的规格、规则、技术要求等规范性文献,简称标准。
广义指与标准化工作有关的一切文献。
4、网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。
具体的说是指所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。
信息检索考试重点
名词解释4*4’1.信息素质:个体在现实需求的驱动下,能有效地发现、获取、评价和利用信息。
2.信息检索广义的信息检索全称是“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
狭义的信息检索“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。
3.登记性目录(概念)也叫国家书目,它是出版物国家登记制度的产物,反映国家出版的全部图书,实际上也反映了一个国家的文化、科学和出版业的水平。
4.联合目录(概念)汇总若干个单位馆藏而形成的目录,是馆藏目录的放大。
5.年鉴(概念)年鉴是汇辑一年内的重要时事文献、学科进展,汇辑各种统计资料和重要信息,并按年度出版的连续性出版物。
6.OPAC(公共联机书目查询系统)利用计算机终端来查询基于图书馆局域网内的馆藏数据资源的一种现代化检索方式,通过联机查找为读者提供馆藏文献的线索。
7.引文索引(概念)根据美国科学信息研究所(Institute for Scientific Information,简称ISI)的定义:对于文献A和B:若文献B提到或引用了文献A,则A是B的引文。
这里,文献A被文献B 提到或引用,A是被引用文献或参考文献。
同时由于B引用了A,故B又称为引用文献。
8.垂直搜索引擎(概念)也被称为专业搜索引擎,或主题搜索引擎。
它专门收录某一方面、某一行业或某一主题内的信息,专为查询某一个学科或某一主题的信息提供检索服务,在解决某些实际查询问题的时候比综合搜索引擎更有效。
简答4*9’信息素质包含四个层面的含义:第一,用户有一定的信息需求,即在某个时候需要了解某方面信息。
第二,掌握了主要的信息源和信息工具的知识及技能。
第三,能够分析评价选择相关信息。
第四,利用信息的目的是为了有效地解决具体问题。
信息素质主要表现为信息理论素养和信息的实践能力,包括信息意识、信息知识、信息能力和信息道德等内容。
信息存储与检索复习资料答案
一、单项选择题1. 以下哪个数据库提供同名作者检索功能:(D )A.万方数据库 B.中国期刊全文数据库C.复印报刊资料全文数据库 D.中文科技期刊全文数据库2. _______提供一次文献的线索。
( B ) A.文摘、索引等 B.图书 C.百科全书 D.手册3. 以下属于特种文献的是( B )。
A.图书B.科技报告C.报纸 D.期刊4. 用主题词检索只可以检索出对应的()5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权~6. 利用分类途径进行检索,其检索标识为( C ) A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献( C )A. Journal B. Report C. Conference D. Patent8. 下列选项中,不属于信息能力的有( B ) A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指(专利注明书)10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这个按钮的作用是什么( D )A.测试你当天的手气 B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的链接D.直接跳转到系统认为是最相关的页面…11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况( D )A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程( C )A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为( C )。
A.主题词 B.关键词 C.分类号 D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找( C. )A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统…15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好( C )A.关键词摘要 intitle: 知识管理B.论文知识管理 PDFC.学术论文知识管理D.学术论文 intitle:知识管理16. 在中国知网提供的检索服务中,(检索词扩展)起到扩展检索的作用。
信息检索考试大一下知识点
信息检索考试大一下知识点信息检索是指从大量的信息中快速找到满足特定需求的信息过程。
在大一下学期的信息检索考试中,通常会涉及以下几个知识点:一、信息检索基础概念1. 信息检索的定义和目的信息检索是指通过使用计算机技术,在海量信息中寻找到与用户需求相匹配的信息。
其目的是快速、准确地获取到用户所需的信息。
2. 检索模型和流程信息检索基于检索模型,常见的模型包括布尔模型、向量空间模型和概率模型。
检索流程一般包括问题建模、索引构建、查询处理和结果排序等步骤。
二、关键词检索1. 关键词的选择与组合在进行信息检索时,关键词的选择和组合非常重要。
关键词应该准确描述用户需求,并且能够尽可能覆盖相关领域的信息。
2. 布尔查询与逻辑运算符布尔查询是一种基础的检索方式,通过使用逻辑运算符(AND、OR、NOT)对关键词进行组合,从而获得符合用户需求的信息。
三、索引构建与检索技术1. 逆向索引逆向索引是一种常用的索引结构,它通过将文档中的每个单词与包含该单词的文档进行关联,实现了关键词到文档的快速定位。
2. 向量空间模型向量空间模型将文档和查询都表示为向量,在向量空间中进行计算,通过计算文档与查询之间的相似度来判断文档的相关性。
3. 布尔模型的实现与优化布尔模型的实现与优化涉及到倒排索引的构建与压缩、布尔运算的优化算法等方面的技术。
四、评价与改进1. 检索结果的评价对于检索系统的性能评价,一般使用准确率、召回率、F值等指标来衡量检索的有效性和完整性。
2. 改进方法与技术为了提升检索系统的性能,可以采用词干提取、查询扩展、排名算法优化等方式进行改进。
五、实际应用与发展趋势1. 商业搜索引擎与个性化推荐商业搜索引擎通过不断改进和优化信息检索技术,提供高效准确的搜索服务。
个性化推荐则基于用户的兴趣和行为,向用户推荐符合其需求的信息。
2. 大数据与信息检索随着大数据时代的到来,信息检索面临着处理海量数据的挑战。
如何有效地利用大数据技术来进行信息检索是当前的研究热点之一。
信息存储与检索
信息存储与检索一. 填空题:1.信息存储与检索的对象是:(P1)(信息资源)。
2. 信息资源基本特征:(P4)( 1.共享性,2.时效性,3.智能型,4.无限性与有限性并存,5. 增值性)。
3. 信息资源按信息资源产生的先后和加工深度可划分为:一次信息资源,二次信息资源,三次信息资源。
4. 纸质文献资源的存储与组织的4个基本要素( P18):( 信息内容,载体材料,记录符号和记录方式)。
5. 信息存储与检索类型,按检索系统的工作方式划分(P45):脱机存取、联机存取、光盘存取、因特网存取。
6. 按文献的加工深度划分:(P23) ((1)一次文献,(2)二次文献,(3)三次文献,(4)零次文献)。
7. 索引款目的组成(P50):(索引标题词,说明语,和地址参照项)。
8. 多媒体存取技术的核心是:媒体数据库技术。
9. 从网络存取技术查询内容和功能来看,网络信息检索工具可分为3种类型(P73)(按查询内容和功能划分):( 字典型查询工具,索引型查询工具,交互式检索工具 )。
10. 计算机信息存取系统类型按系统存取的信息特征划分。
(P117)(文献存取系统,事实存取系统,数值存取系统,图像存取系统)。
11.存取系统的检索效果指标(P131):检全率、检准率、检新率。
12. 按检索机制划分检索工具(P196):( 关键词检索工具,分类目录,混合型检索工具)。
13. 文献存取系统包括(P117):书目(目录,题录,文摘)、全文和超文本。
14. 中文搜索引擎(P211):谷歌、百度、雅虎、中国搜索、搜狗搜索,爱问搜索引擎等。
(三个可)15. 多元性检索工具分类(P217):并行处理引擎,串行处理引擎和ALL_IN_ONE方式。
16.多媒体信息存取系统的特征(P304):信息载体的多样性、交互性、实时性、集成性。
17. 信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字,声音,图像,数据。
二. 名称解释:1. 电子信息资源(P7):是以数字化形式(即二进制代码0,1)把文字、图像、声音、动画等多种形式的信息存储在光、磁等非印刷型介质上,并以光信号、电信号的形式传输,通过相应的计算机和其他外部设备再现出来的信息资源。
信息存储与检索复习资料PPT课件
❖ 人工采选:信息资源的采集和录入均由人工完成。
❖ 人机结合采选:人机合理分工——大量的采集任务可以通 过计算机的扫描、复制、链接、合并、格式转换等处理来完 成
❖ 自动采选:即在无人工干预的情况下由计算机自动完成。
22
可编辑
1.2.4 信息检索系统的逻辑结构
2.词语子系统 功能:对采用规范化词语的系统在标引和查询时所使
(1)目标 (2)功能 (3)资源 (4)设备 (5)方法 (6)人员 概括地说,信息检索系统就是专门进行信息的收集、处理、存
储、检索并满足用户信息需求的系统。
16
可编辑
1.2.2 信息检索系统的类型
见P9 (1)书本式检索系统。 (2)卡片式检索系统。 (3)机械式检索系统。 (4)缩微式检索系统。 (5)计算机检索系统。 (6)网络检索系统。
9
可编辑
1.1.2 信息检索的原理
5、课程内容安排 第一章 信息检索概述(教材第一章) 第二章 信息检索模型(教材第二章) 第三章 文本信息处理技术(涉及到本教材第三章) 第四章 文本信息存储技术(涉及到本教材第三章) 第五章 文本信息检索技术(涉及到本教材第三章) 第六章 Web信息存储与检索(教材第五章)
❖ 搜索器(Spider或Robot); ❖ 索引器(Indexer); ❖ 检索器(Searcher)。
从检索效率上讲,联机检索与光盘检索的检索效率比较高,与网络检 索(搜索引擎检索相比),它们的检索指令完备、检索功能强大、支持 多种检索技术,提供跨库检索手段,查全率和查准率都比较高。但搜索 引擎胜在用户界面友好、使用方便简单。
23
可编辑
1.2.4 信息检索系统的逻辑结构
3、信息标引子系统 功能:按照一定的词表,对信息赋予标引词,以表征信息的特征,形成信
(完整版)信息检索考试重点
信息检索考试内容(一)1、计算机信息检索系统构成要素是什么?答:服务器、通信网络、检索终端、软件、数据资源。
2、服务器的功能是什么?答:服务器是检索系统的核心部分,在检索中处理大量的指令和数据。
服务器有较高的运算和处理能力,并且具有相当大的信息储存容量。
服务器决定了心痛的检索速度和存储容量。
3、URL的构成是什么?答:URL由两个主要的部分构成:协议(Protoco1)和目的地(Destination)。
4、什么是微信息?答:微信息即快速信息传播。
微信息是最细分最全面的综合信息社交网,集信息,电子商务,社交于一体,提供信息免费发布,共享,搜索,查找,还可以创建和加入信息群组,建立信息社交圈子,随时关注动态。
(二)1、什么是检索工具?它的主要作用是什么?答:检索工具是用来存储、报道和检索一次文献的工具,属于二次文献。
主要作用:报导作用、累计作用、查询作用、选择作用。
2、目录、题录、索引、文摘、文献指南各有那种类型?答:目录可以分为国家目录、馆藏目录、联合目录、出版社与书商目录和专题目录。
题录的类型一般都是用代号表示。
索引类型可分为篇目索引和内容索引文摘按其内容的详简程度可以分为指示性文摘和报道性文摘;按其适用对象可以分为一般性文摘和倾向性文摘;按内容性质可以分为综合性文摘和专业性文摘。
文献指南主要介绍该科学和专题的主要文献类型。
3、什么是参考工具书?它有哪些主要作用?答:参考工具书是根据一定的社会需要,广泛汇集某一范围的知识材料,按一定方式加以编排,专供人们解释疑惑的特定类型的出版物。
作用:查字词、查事项、查人物、查机构、查产品、查物名、查地名、查年代、查数据。
4、字典和词典、百科全书、年鉴、名录、图录有哪些主要类型?答:字典类型一般分为两种:○1详解词典○2专门词典。
词典从语种文别角度分为:○1单语言辞典○2多语言辞典。
从词量规模角度:○1大型词典○2中型词典○3小型词典。
从收录内容角度:○1百科全书○2语文词典○3专门词典。
信息存储与检索复习资料
信息存储与检索复习资料一、名词解释1. 主题标引:是在主题分析的基础上,依据一定的主题词表或主题标引规则,赋予信息资源语词标识的过程。
2. INTERNET(因特网):泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。
3. 顺查法:就是以课题研究的起始年限为出发点,利用选定的检索工具如书目、索引、文摘又远及近的逐年查找。
4. 三次文献: 是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为“情报研究”的成果5. 文献信息资源:文献是记录有知识的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源。
6. 倒查法:一种逆时间顺序由近而远地查找信息的方法.7. 一次文献:即原始文献。
它是作者以生产或科研为依据而创作的原始文献。
如专著、期刊论文、学位论文等。
8. 检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。
它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。
9. 手工检索:是由检索者通过卡片式或书本式的目录、题录、文摘、索引等检索工具查找文献线索的过程。
10. 信息检索语言:信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言。
11. 特种文献:特种文献是指出版发行和获取途径都比较特殊的科技文献。
特种文献一般包括会议文献、科技报告、专利文献、学位论文、标准文献等。
12. 间接检索法:利用一定检索工具进行文献检索13. 专利:有三层含义:一指受专利法保护的发明,二是指专利权,三指专利说明书等专利文献。
这三层含义的核心是受专利法保护的发明,而专利权和专利文献是专利的具体体现。
14. 搜索引擎:是一种Web 上应用的软件系统,它以一定的策略在Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。
信息检索期末考试重点
1,、十大信息源:图书、连续出版物、学位论文、科技报告、会议文献、政府出版物、专利信息、标准信息、产品样本、档案文献2、二次信息:是对一次信息进行加工、提炼、压缩和整理后所得到的信息,如目录、题录、文摘、索引和名录等检索工具。
二次信息主要功能是检索通报控制一次信息帮助人们在较少时间内获取较多信息,故又称为检索信息或通报性信息,其具有汇集性工具性综合性系统性等特点。
3信息素质;作为具有信息素质的人必须具有一种能够充分认识到何时需要信息并有能力有效地发现检索评价和利用所需要的信息解决当前存在的问题的能力4信息素质的内容:信息意识、信息能力、信息道德1、信息检索是指依据一定的方法从已经组织好的大量有关信息组合中直接查找并获取特定的相关信息的过程。
2、信息检索的基本原理可以从信息的替代、整序、标识的匹配三方面来讲述。
3、信息检索的类型文献检索、数据检索、多媒体检索4、信息检索的发展趋势表现在智能化、可视化、个性化、专业化5、信息检索的意义:有利于培养人才提高学生自学能力和独立的科研能力;帮助科研人员继承和借鉴前人的成果避免重复研究减少重复劳动;帮助科研人员迅速准确的获取所需的全部资料提高科研效率缩短科研周期;促进信息资源的开发利用推动社会进步和经济发展。
6、检索语言是根据信息检索的需要而创制的人工语言适应文献信息的加工存储和检索的共同需要而编制的语言是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标志系统。
7、检索语言的主要作用标识文献信息内容及其外表特征保证不同标引人员标引文献的一致性;对内容相关的文献信息加以集中或揭示其相关性;使文献信息的存储集中化系统化组织化便于检索着按照一定的排列次序进行有序化检索;便于将标引用语和检索用语进行相符性比较保证不同检索人员表述相同文献内容的一致性;保证检索者按不同需要检索文献时都能获得最高查全率和查准率。
8、信息检索技术布尔逻辑检索、截词检索、位置检索、限制检索9、信息检索的评价指标体系主要包括对信息检索数据库的评价对检索结果的评价对检索功能的评价和对用户负担的评价。
信息存储与信息检索考试重点
一:单项选择题(共20小题,每小题2 分,共40分)二:填空题(共12个空,每空1分,共12分)三:简答题。
(共4小题,每小题6分,共24分。
)四:应用题。
(共3小题,4选3,每小题8分,共24分。
)(应用)例1 检索课题:查找中国2003年国内人口出生率和自然增长率。
1.手工检索检索工具:《中国统计年鉴—2004》通过分类途径在类目“人口”下进行查找。
2.计算机检索(1)CNKI中国统计年鉴全文数据库(2)国家统计局网站进入国家统计局网站主页——点击“数据库查询”——进入“国家统计数据库”——输入检索关键字:人口,点击“搜索”,在结果页面单击“(整表/年度资料)--1978-2006年历年人口出生率、死亡率和自然增长率”链接,得到的检索结果如下:指标名称人口出生率人口死亡率人口自然增长率(单位:‰)2003年12.41 6.40 6.01(3)搜索引擎检索式:“2003年中国人口出生率自然增长率”例2.检索课题:查找2004年上海市国民经济生产总值GDP及其增长率。
1.手工检索检索工具:《上海市统计年鉴—2005》通过分类途径在类目“国民经济核算”下进行查找。
2.计算机检索(1)国研网”主页,进入“国研网”主页,。
点击“区域经济”栏目,在“区域列表”中点击“上海”。
在检索框里输入关键词“2004年上海”,检索条件限制在“标题”,并经关键词“GDP”二次检索,得到上海市2004年的GDP相关数据。
结果如下:2004年上海市按经济普查口径核算的GDP为8072.8亿元,比年快报核算的总量增多了622.5亿元,增加8.4%。
(2)中国经济信息网地区数据>> 年度数据(3)国家统计局网站统计数据>> 年度数据_>> 国民经济核算(4)CNKI中国统计年鉴全文数据库(5)上海统计网上海统计信息网——统计数据——上海统计年鉴——国民经济核算(6)搜索引擎检索式:“2004年上海市GDP”一、纸质文献资源的存储与组织的4个基本要素信息内容、载体材料、记录符号和记录方式二、按文献加工深度划分:零次文献、一次文献、二次文献、三次文献的区分零次文献——尚未经过系统整理形成正式文献的零散资料,包括草稿、记录和谈话等。
信息检索考试要点讲解
信息检索考试要点(Word版)考试题型:考试分试卷一,试卷二两部分,试卷一:(客观题80分)(一)单选(20题,20分)(二)多选(20题,40分)(三)判断(20题,20分)试卷二:(20分)(四)填空题(20空,10分)(五)实务题1、写检索式(三题,6分)2、调整检索策略(4分)第一章绪论信息素质:在信息化时代,人们认识、利用和创造信息的品质与素养,它是创新人才应具备的素质。
信息素质由信息意识、信息知识、信息能力和信息道德素质四部分构成。
信息:是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。
信息具有客观性、时效性、共享性、价值性、传递性、开发性知识:是人们在改造世界的实践中所获得的认识和经验的总和,是人的大脑通过思维重新组合的系统化的信息集合。
知识具有意识性、信息性、实践性、规律性、继承性、渗透性情报:是为了解决一个特定的问题所需要的激活了、活化了的特殊知识或信息。
情报具有知识性、传递性和效用性三个基本属性。
文献:凡是记录有信息或知识的一切载体均为文献。
文献具有三个基本功能:存贮知识、传递信息和交流信息;四个基本要素:知识内容、记录符号、物质载体和记录手段。
文献信息资源类型划分标准:一、按物质载体和记录形式划分类型1)印刷型载体纸张等记录手段手写、印刷、打印、复印种类图书、报刊、特种资料等优点便于阅读及广泛流传,成本低缺点存储密度低,所占空间大,保管耗较多人力物力,难于实现自动化类型2)缩微型载体感光材料记录手段缩微拍摄种类缩微平片、缩微胶卷、全息胶片优点体积小,存储密度高,成本低,传递较为方便缺点不能直接阅读,需要借助于缩微阅读机,存储要求较高类型3)声像型载体磁性、感光材料记录手段机械装置输入种类唱片、录音带、录像带、光盘等优点高密度存储,直观、真切,图文并茂,制作快缺点不能直接阅读,需要先进的技术设备,制作成本稍高类型4)机读型载体磁性、感光材料记录手段键盘、扫描等方式输入种类磁盘、磁带、光盘等优点存储密度高,存取速度快,变更记录,易于实现自动化,便于实现信息共享缺点需要先进的技术设备才能“读出”、制作成本较高二、按加工深度划分一次文献:以作者本人的科研、生产和工作成果为依据创作而成的文献。
信息存储与检索复习资料答案
一、单项选择题1. 以下哪个数据库提供同名作者检索功能:(D )A.万方数据库 B.中国期刊全文数据库C.复印报刊资料全文数据库 D.中文科技期刊全文数据库2. _______提供一次文献的线索。
(B)A.文摘、索引等B.图书C.百科全书D.手册3. 以下属于特种文献的是( B)。
A.图书 B.科技报告 C.报纸D.期刊4. 用主题词检索只可以检索出对应的()5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权6. 利用分类途径进行检索,其检索标识为( C )A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献(C )A.Journal B.Report C.Conference D.Patent8. 下列选项中,不属于信息能力的有( B ) A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指(专利注明书)10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这个按钮的作用是什么?(D)A.测试你当天的手气B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的链接 D.直接跳转到系统认为是最相关的页面11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况(D)A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程(C )A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为( C )。
A.主题词 B.关键词 C.分类号 D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找?( C. )A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好?(C)A.关键词摘要intitle:知识管理B.论文知识管理PDFC.学术论文知识管理D.学术论文intitle:知识管理16.在中国知网提供的检索服务中,(检索词扩展)起到扩展检索的作用。
《信息检索》考试重点
《信息检索》考试重点信息是指事物的存在方式和运动状态,是对客观世界中各种事物的变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。
这里强调信息是事物属性的表征,即信息不是事物本身,而是用来表现事物特征的一种普遍的形式。
信息的特征7个:客观性、普遍性、可存储性、可传递性、扩散性、共享性、时效性。
信息的功能4个:经济型功能,选择与决策、管理与协调、研究与开发。
知识是人类通过信息对自然界。
生物界、人类社会运动规律的认识和概括,是人的大脑通过思维重新集成整合的系统化信息,是信息中最有价值的部分。
也就是说信息是产生知识的原材料,知识是信息的加工的抽象化产物。
知识是一种特定的人类信息,它四对信息进行提炼和深化的结果。
知识的类型:显性知识和隐性知识、实体知识和过程知识、核心知识和非核心知识。
情报是具有特定传递对象的特定知识或有价值的信息。
情报的特征:动态性、按特定方式传递、为特定目的服务的、常常带有一定的时效性和机密性情报的类型。
情报的分类:根据情报的来源与加工程度划分,情报可以分为:零次情报、一次情报、二次情报、三次情报。
零次情报是指为公开于社会、没有经过记录整理、非正式传递的、直接作用于人的、非文献情报的总称。
如私人笔记、手稿、设计草图、会议记录、口头言论等。
一次情报:是指为经过加工或者加工程度等于零的原生情报。
这种情报直接反映实际情况和科研成果,有如生产过程中的原料。
固定原生情报的文献称为原生文献,也称一次文献。
如调查报告、研究报告、科学论文、专利说明书、会议文献、专著等。
二次情报是一种派生情报,是针对一次情报加工的产品。
一二次情报的作用不仅在于报导,更重要的是为查找一次文献提供线索。
刊载二次情报的文献称为二次文献,二次文献按照加工的方式和深度又分为书目、索引、文摘等形式。
其中文摘是一份文献的内容缩短的精确的表达,它是二次情报的重要形式。
三次情报是在一次二次情报的基础上,经过分析研究和综合概括而编撰的情报。
信息检索考试重点
信息检索的概念广义的信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术;狭义的信息检索是指从信息集合中找到所需信息的过程。
第一章计算机信息检索的1.1 学科基础-信息学概述信息概述信息需要和检索1.2 技术基础-信息技术概述信息技术概述信息检索的关键技术-P14★具有广泛影响的定义:信息:是指应用文字、数据或信号等形式通过一定的传输和处理,来表达各种相互联系的客观事物在运动总所具有的特征性内容的总称。
知识(Knowledge)词典解释:知识是人类在改造世界的社会实践中获得的对事物本质认识的成果和结晶。
知识是人类对自然界、人类社会中各种现象、规律进行思维分析、加工提炼形成的系统化、理论化结果。
也就是通过大脑思维重新组合的系统化的信息集合。
因此,系统化、理论化的正确信息就是知识(1)按信息的表达形式划分•文献信息•声像信息•电子信息文献(document)是指记录有知识(或信息)的一切载体。
也就是说用文字、图形、符号、声频、视频等手段记录下来的人类知识都可以称之为文献。
三个要素:ϕ内容-被记录的知识(信息)κ载体λ记录知识信息的手段一个特点:记录(2)按信息加工的层次划分-P5零次信息指尚未以公开形式进入社会流通使用的信息。
如:实验记录、会议记录、内部档案、论文草稿、设计草稿等。
一次信息指以信息编制者的研究成果为依据而创作(撰写)的并公开发表或出版的信息。
如:图书、学术论文、专利说明书、科技报告等,是信息检索的主要对象和最终目标。
二次信息指对一次信息进行加工整理,使之简化(如著录信息特征,摘录信息内容要点等),或分类编辑之后所得的产物,或为了便于检索和利用一次信息而编辑出版的产物。
如目录、索引、文摘、书目型数据库等。
二次文献是对一次文献的浓缩和有序化,主要作用:是存贮和报道一次文献线索、提供查找的途径,是检索的主要学习对象。
三次信息指根据某种需要和目的,利用二次信息作为手段,将某方面的大量一次信息加以全面系统的再度选择、分析和综合,编写成具有专指性内容和使用目的更为明确、效果更为直接的三次信息。
信息安全、信息存储与检索重点
《信息存储与检索》部分复习资料1、信息检索是关于信息的结构、分析、组织、存储、搜索和检索的领域。
3、搜索引擎即基本构件:搜索引擎的组件主要提供两种功能,也就是我们所说的索引处理和查询处理。
索引处理建立可查找的数据结构,查询处理使用这些数据结构和用户的查询生成一个排好序的文档列表。
索引处理主要组件包括文本采集、文本转换和索引创建。
查询处理的主要组件包括用户交互、排序和评价。
索引处理文本采集识别和存储文档文本转换将文档转换成索引项或特性索引创建利用索引词创建数据结构(索引),以支持快速搜索查询处理用户交互优化查询、显示结果排序使用查询和索引生成文档排序列表;高效、高质量评价评测和监测系统的效果和效率4、网络爬虫的工作原理检索网页(1)网络爬虫客户端程序连接到一个域名系统(DNS)服务器上(2)DNS服务器将主机域名转换成IP地址(3)网络爬虫用特定的端口连接服务器(4)一旦建立连接,爬虫程序发送一个HTTP请求给Web服务器,请求一个页面○1通常是GET请求网络爬虫(1)网络爬虫有2个任务:(访问网页)下载页面和发现URL(2)网络爬虫的工作由种子(seed)集合开始。
(3)网络爬虫从请求队列中读取URL,开始抓取任务(4)一旦下载了一个页面,就对该页面进行解析,找到链接标签,发现其中的URL。
(5)新的URL地址将被加入请求队列或frontier(6)以上过程重复进行,直到符合某种特定条件(7)网络爬虫花费大量的时间用在等待请求响应(8)为了提升效率,网络爬虫使用多个线程,一次抓取几百个网页(9)网络爬虫可能大量访问同一站点。
(10)网络爬虫使用礼貌策略。
不会在特定的服务器上一次抓取多个页面2次请求之间,至少等待几秒5、搜索引擎是如何工作的:搜索引擎有三个主要的基本部分。
索引数据库检索模块爬虫程序(1)搜索引擎蜘蛛搜索引擎首先利用的是一种俗称蜘蛛(Spider)或爬虫(Crawler)的软件。
搜索引擎蜘蛛访问到一个页面,读取它,然后跟随这个页面链接到这个站点的其他页面,这就是人们所说的站点被套住了或者被爬过了。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、填空
1、信息资源的特征:共享性、时效性、智能性、无限性和有线性并存、增值性及物质、
资源的一般特征。
2、纸质文件按文献加工深度划分:一次文献、二次文献、三次文献、零次文献。
3、索引款目的构成:索引标题、说明语、地址参考项。
4、多媒体存取技术的核心是:媒体数据库技术。
5、网络信息检索工具有:字典型查询工具、索引型查询工具、交互式检索工具。
6、按系统存取的信息特征划分:文献存取系统、事实存取系统、数值存取系统、图像
存取系统。
7、按检索工具划分:关键词检索工具、分类目录、混合型检索工具。
8、纸质文献资源的四个基本要素:信息内容、载体材料、记录符号和记录方式。
9、按检索系统的工作方式划分:脱机存取、联机存取、光盘存取、因特网存取。
10、文献存取系统包括:书目、全本和超文本。
11、存取系统的检索效果指标:检全率、检准率、检新率。
12、多元性检索工具:
13、中文搜索引擎:谷歌、百度、雅虎、中国搜索、搜狗搜索等。
(三个可)
14、多媒体信息存取系统的特征:信息载体的多样性、交互性、实时性、集成性。
二、名称解释:
1、电子信息资源是以数字化形式把文字、图像、声音、动画等多种形式的信息存储在
光、磁盘等非印刷型介质上,并以光信号、电信号的形式传输,通过相应的计算机和其他外部设备再现出来的信息资源。
2、索引是存取信息资源“地址”或“出处”的表示系统,是信息存储与检索的基本形
式。
其基本功能是指示知识点在正文或文献款目中得位置。
3、标准文献狭义指按规定程序制订,经公认权威机构(主管机关)批准的一整套在特定
范围(领域)内必须执行的规格、规则、技术要求等规范性文献,简称标准。
广义指与标准化工作有关的一切文献。
4、网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。
具体的说是指
所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。
5、智能检索以文献和检索词的相关度为基础,综合考查文献的重要性等指标,对检索
结果进行排序,以提供更高的检索效率。
它是由智能计算机技术与全文检索技术综合发展起来的一种新型检索技术。
6、视频存取技术是近几年来在数字通信、电视和电子计算机技术三者相结合的基础上
发展起来的一种新型的信息存取技术,分为广播式和交互式两种。
7、题名索引是将信息资源的题名特征(书名、刊名、篇名)作为索引标题词所编制的
索引系统。
8、目录是书籍正文前所载的目次,是揭示和报道图书的工具目录是记录图书的书名、
著者、出版与收藏等情况,按照一定的次序编排而成,为反映馆范、指导阅读、检索图书的工具。
9、检索语言是根据信息检索的需要而创制的,能够唯一地表达各种概括文献信息内容
的概念,能够显示概念之间的相互关系,并便于进行系统排列,便于将标引语言和检索用语进行相符性比较的人工语言。
10、信息检索全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
一般是通过信息存取系统实现的,通常包括四种
类型:关于文献的检索、关于某事实或事项的知识检索、关于数值或数据的情报检索、关于图像信息的信息检索。
11、顺排文档指将文档中的全部记录按照存取号从小到大依次存取信息,顺序号越小,记录存入数据库的时间越早,反之,存入的时间越晚。
也称为线性文档。
12、科技查新是文献检索和情报调研相结合的情报研究工作,它以文献为基础,以文献检索和情报调研为手段,以检出结果为依据,通过综合分析,对查新项目的新颖性进行情报学审查,写出有依据、有分析、有对比、有结论的查新报告。
也就是说查新是以通过检出文献的客观事实来对项目的新颖性做出结论。
三、简答
1、电子图书的特点:电子图书除了具备传统图书的外,还有以下几个特点:存储形式多样化、资源数字化、可交流程度高、方便利用、内容丰富、载体容量大。
2、网络信息选择标准即在进行信息检索时,网络信息选择的标准。
主要有以下几种:1)文献检索是以文献为检索对象的检索。
可分为全文检索和书目检索两种;2)数据检索是以数值或数据(包括数据、图表、公式等)为对象的检索;3)事实检索是以某一客观事实为检索对象,查找某一事物发生的时间、地点及过程的检索。
3、搜索引擎的选择与比较:(选择和比较一种搜索引擎应考虑什么)1、速度(信息查询的速度、信息的更新速度即数据更新的频率)2 返回的信息量(这是衡量一个搜索引擎数据库内容大小的重要指标,如果它返回的有效信息量多,就说明这个站点收录的信息范围广,数据容量大,就能给用户提供更多的信息资源。
)3、信息相关度即检准率;
4、易用性(查询是否方便)
5、稳定性:好的搜索引擎站点,它的服务器和数据库应非常稳定,这样才能保证为用户提供安全可靠的查询服务。
4、任意6种网络技术名称:
5、信息检索基本步骤:(1)分析检索课题,明确检索需求;(2)制定检索策略;(3)选择检索系统与数据库;(4)确定检索词和检索途径,编制逻辑检索式;
(5)检索策略的调整。
6、文献信息资源类型:按加工情况分,可有一次文献、二次文献和三次文献;按载体
形式分,可有书写文献、印刷文献、缩微文献、音像文献、机读文献等;按内容的学科范围分,则有社科文献、科技文献等。
按文献表现形式特征有11类:图书、报刊、学位论文、会议资料、专利文献、科技报告、产品资料、科技档案、标准资料、政府出版物和网络文本。
7、网络信息资源特点:1、数量庞大、增长迅速;2、内容丰富、覆盖面广;3、表现
形式多样;4、分布的非均衡性;5、传输速度快; 6、共享程度高;7、交互性强;
8、使用成本低; 9、变化频繁、难测;10、质量良莠不齐。
8、计算机存取系统子系统有哪些?
答:主要有:输入子系统、处理子系统、存储子系统、传输子系统、输出子系统、控制子系统。
四、论述:独立型搜索引擎的工作机制.
信息搜集系统从一个或一组已知的URL 开始访问互联网,下载相关的网页信息及新的链接, 以一定的策略遍历新链接, 并读取新链接的信息内容, 将它们加入到本地数据库。
然后, 由分析索引模块对这些数据进行处理组织后, 形成索引数据库。
用户通过检索模块提交查询服务, 在搜索框中输入检索式, 系统就会自动
完成, 并按一定的排列方式返回检索结果
五、谈谈你对学习信息存储与检索课程理论知识的认识
答案可能不是很准确谅解!!!。