计算机信息检索复习资料
信息检索_复习资料
信息检索_复习资料第1章文献信息概论 (1)1.1 信息时代与信息文化课 (1)1.2 文献信息的基本概念 (2)1.2.1.1信息的定义 (2)1.2.2 文献的级别和载体类型 (2)1.2.3 印刷型文献的出版类型 (3)1.4、国内文献信息系统包括: (6)1.4.4 文献信息的学科分布规律 (6)第2章信息检索原理 (6)2.1.1信息检索的定义和类型 (6)1.信息检索的定义 (6)1.2.3文献的内部特征和外部特征 (6)2.2.1信息检索的一般原理 (6)2.2.3 检索语言 (7)2.2. 信息检索系统 (8)2.2.1 书目检索系统的内容组成 (8) 2.2.2印刷型信息检索系统的类型 (8) 2.3文献信息检索的方法 (9)2.3.1文献信息检索方法的类型 (10) 2.5 信息检索语言 (10)2.5.2分类检索语言 (11)2.6 著者检索原理 (12)2.6.1 著者索引的排序方式 (12)第三章事实数据检索与参考工具概述 (13) 3.2事实与数据检索概述 (13)3.2参考工具书概述 (13)3.3综合性参考工具举要 (16)第四章图书报刊文献检索原理 (19)第一节书目及其作用和类型 (19)第二节查近现代图书和报刊的出版 (20)4.1 计算机情报检索概述 (25)4.1.2 计算机情报检索的必备条件 (25)4.1.3计算机情报检索与手工检索的比较 (25)4.2 文献信息数据库原理 (25)4.2.1 数据库的定义和类型 (26)4.2.2 数据库构成: (26)4.3.5 检索策略构成和调整方法 (27)第4章(国内外网络全文数据库) (29)4、2电子图书和书目数据库 (29)第1章文献信息概论1.1 信息时代与信息文化课文献课是知识时代培养学生终身所需的信息意识与获取文献信息能力的重要课程,是一门科学方法课。
在社会信息化的进程中,文献信息检索的意义日益变得重要:1、文献信息数量激增。
计算机复习信息检索
计算机复习信息检索信息检索是指通过计算机技术,根据用户的需求,在大规模的信息资源中准确、快速地找到相关的信息。
在当今信息爆炸的时代,信息检索的重要性不言而喻。
本文将介绍信息检索的基本概念、技术和应用,并附带答案和解析。
一、信息检索概述信息检索是指通过计算机对大规模信息资源进行全文检索、关键词检索等方式,根据用户需求提供相关信息的过程。
其目标是提高检索准确性和检索效率,帮助用户快速获取所需信息。
信息检索系统由信息资源、检索模型、检索方法和用户界面等组成。
其中,信息资源包括数据库、文档集合等;检索模型包括向量空间模型、布尔模型等;检索方法包括倒排索引、词频统计等;用户界面提供检索接口供用户输入查询词,并显示检索结果。
信息检索的基本流程包括:用户输入查询词->检索系统进行查询处理->检索系统返回相关文档。
二、信息检索技术1. 关键词检索关键词检索是最常见的信息检索方式,用户通过输入关键词,检索系统根据关键词在信息资源中进行匹配,并返回相关文档。
关键词检索常用的算法有向量空间模型、TF-IDF算法等。
全文检索是指对文档集合中的全部文本进行检索,而不仅仅是关键词。
全文检索主要通过分词、建立倒排索引等技术来实现。
用户输入的查询词可以是一个短语或一句话。
3. 自然语言查询自然语言查询是指用户使用自然语言进行查询,而不是像关键词查询那样只输入几个词。
自然语言查询需要将用户的自然语言转化为计算机可处理的查询语言,如SQL语句。
4. 语义检索语义检索是一种基于语义理解的检索方法,通过对查询词的语义进行分析,实现更精准、准确的检索。
语义检索常用的技术有词义消歧、词向量模型等。
三、信息检索应用1. 搜索引擎搜索引擎是信息检索的最常见应用之一,在互联网上广泛使用。
搜索引擎通过爬虫程序对互联网进行爬取,建立庞大的索引库,并通过用户输入的查询词返回相关页面。
2. 文献检索在学术界和科研领域,文献检索是非常重要的工作。
信息检索复习资料
信息检索公选课复习资料1.信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。
2.知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。
3.情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。
4.文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。
5.会议文献是指在国内外学术或非学术会议上发表的论文或报告。
6.学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。
7.著录是对文献内容和形式特征进行选择和记录的过程。
8.数据检索是指特定的数值型数据为对象的检索。
9.按信息的加工层次分类:(含义)一次文献:原始文献,图书、报纸、期刊、会议纪录、专利报告等二次文献:目录、题录、索引、文摘三次文献:论文丛集、综述、年鉴百科全书一次信息资源 (原始文献):以作者本人在生产和科研中所取得的成果为依据而创作的原始文献所传递的信息资源。
二次信息资源(检索工具):将分散的、无组织的一次信息资源,按一定的原则加工、整理、简化、组织成为系统的、便于查找利用的信息资源。
三次信息资源(参考性文献):在合理利用二次信息资源的基础上,选用一次信息资源的内容,根据一定的需要、目的进行分析、综合或浓缩重组而得到的信息。
二次信息资源与三次信息资源的区别:对象不同:二次信息资源以“篇”或“本”为单位进行加工;三次信息资源则归纳了较多的一次信息内容用途不同:二次信息资源为检索一次信息的工具;三次信息资源能直接提供检索答案.10. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。
11. 文献检索方法:指文献信息资源的一般检索方法,也是利用各种检索工具检索文献信息资料的最常用的方法。
信息检索重点复习资料
信息检索重点复习资料第一章信息检索概述信息检索(IR):将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
信息素养:人们在解答问题时利用信息的技术和技能。
信息检索与文献检索的主要区别:文献检索是以获取文献信息为目的的检索,信息检索是收集,组织,存储一定范畴的信息,并根据用户需求查询文献中的信息或知识单元,比文献检索更深入。
信息检索的分类:1、根据检索手段不同可分为1)手工检索2)光盘检索3)联机检索4)网络检索2根据检索对象形式不同可分为文本检索、数值检索、音频与视频检索。
信息检索的原理:通过对大量的分散无序的文献信息进行收集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储和检索这两个过程所采用的特征标识达到一致,以便有效的获得和利用信息源。
存储是检索的基础,检索是存储的目的。
信息检索语言是人们在加工、存储和检索信息时用来描述信息内容喝信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。
信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。
其物理结构:是信息检索所用的硬件资源、系统软件以及信息资源集合(数据库)的总和。
信息检索语言的主要目的:把存储和检索联系起来,把标引人员和用户联系起来,以便取得共同理解,实现交流。
信息检索的历史:最早的信息检索主要依靠信息分类。
1手工检索2机械信息检索。
3脱机批处理检索是计算机初期使用的一种检索系统 4联机检索 5光盘检索 6 网络信息检索后四者统称为计算机信息检索信息检索的三个经典模型:1布尔模型 2向量空间模型 3概率模型 1浏览型模型:扁平式模型、结构导向模型、超文本模型2检索型模型:结构化模型、基于内容的检索型模型。
信息检索模型是信息检索的核心。
信息检索系统:是具有信息存储和信息查询功能的一类服务设施。
信息检索系统按功能划分5种类型:文献检索系统DRS、数据库管理系统DBMS、自动问答系统QAS、管理信息系统MIS、决策支持系统DSS. 信息检索物理结构1计算机硬件2软件3数据库信息检索的逻辑结构是指系统所包括的功能模块或子系统及其相互关系。
信息检索复习资料
信息检索复习资料A卷⼀、名词解释:1.信息资源 2.信息检索3.著录法4.关键词标引5.知识发现⼆、填空1.按组织⽅式分,信息检索有()、()、超媒体检索。
2.信息检索策略有两种⽅式即()和()。
3.表⽰主体的检索词有标题词、()、()关键词。
4.常⽤的逻辑运算符有:()、OR或+、()。
5.信息检索⼯具常⽤的排检⽅法有字序法、()。
6.中国特有的⼯具书是()、()。
三、问答1. 信息检索的研究内容有哪些?2. 数据库有哪些类型?3. 搜索引擎的类型有哪些?四、论述1、试例说明传统检索型⼯具书和参考型⼯具书的使⽤。
2、如何利⽤检索⼯具查找历史类⽂献?参考答案:⼀、名词解释(30%)1.信息资源。
是⼈类存储在载体(包括⼤脑)上的已知或未知的可利⽤的资源。
信息中的载体信息和主题信息资源的最基本的组成部分。
2.信息检索。
是从⼤量相关信息中利⽤⼈—机系统等各种⽅法加以有序识别与组织以便及时找出⽤户所需部分信息的过程。
3.著录法。
是对信息与⽂献的形式特征和内容特征进⾏分析、选择和记录的⽅法。
4.关键词标引。
使⽤⾮规范化的⾃然语⾔——关键词来表达⽂献或信息资源主题内容的过程。
5.知识发现。
是从数据中发现有⽤知识的整个过程,使多个步骤相互连接,反复进⾏⼈机交互的过程。
⼆、填空(20%)1.按组织⽅式分,信息检索有全⽂检索、超⽂本检索、超媒体检索。
2.信息检索策略有两种⽅式即⼿⼯检索策略和计算机检索策略。
3.表⽰主体的检索词有标题词、单元词、叙次、关键词。
4.常⽤的逻辑运算符有:AND或*, OR或+, NOT或-。
5.信息检索⼯具常⽤的排检⽅法有字序法、类序法。
6.中国特有的⼯具书是类书,政书。
三、问答(24%)1.信息检索的研究内容有哪些?检索理论研究、检索语⾔研究、数据库研究、著录法研究、检索系统研究、检索策略研究、检索服务研究。
2.数据库有哪些类型?传统数据库(情报数据库、图形数据库等);专门应⽤领域的数据库(统计数据库、⼯程数据库、空间数据库;新⼀代数据库(分布式数据库、多媒体数据库、⾯象对象数据库、实时数据库等)。
信息检索基础知识考点整理
信息检索基础知识考点整理●2.1 信息检索的概念与原理●2.1.1 信息检索的概念(重要)●2.1.2 信息检索的原理●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出●信息检索的类型●1.文献检索●2.数据检索●3.事实检索●2.1.3 信息检索的意义/作用(重要)●1.信息检索是有效利用信息资源,实现其最大价值的科学方法●2.信息检索是再学习的工具,是获取知识的有效途径●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间●2.1.4 信息检索的历程●1.手工检索●2.计算机检索●2.2 信息检索系统(重要)●2.2.1 信息检索系统的概念●1.信息检索系统的含义●2.信息检索系统的工作原理●2.2.2 信息检索系统的构成●1.信息选择子系统●2.信息索引子系统●3.词表管理子系统●4.用户接口子系统●5.匹配子系统●2.2.3 信息检索系统的分类●1.手工检索系统●1.书本式的手工检索系统●2.卡片式的手工检索系统●2.计算机检索系统●1.硬件●2.软件●3.数据库●1.参考数据库●1.书目数据库●2.指南数据库●2.源数据库●1.数值数据库●2.文本—数值数据库●3.全文数据库●4.术语数据库●5.图像数据库●6.多媒体数据库●2.3 信息检索方法(重要)●1.直接浏览法●直接查找法●2.常用法●顺查●倒查●抽查●3.追溯法●4.综合法(分段查找法、循环法、交替法)●2.4 信息检索效果(重要)●2.4.1 信息检索效果评价●信息检索效果的概念●1.检索结果有效性评价●2.检索系统实用性的评价●3.检索费用—效率评价●信息检索效果评价对于信息检索系统的建设和发展的意义●信息检索效果评价的核心问题是建立一套切实可行的评价指标●1.查全率和查准率●2.误检率和漏检率●3.响应时间●其他与检索效果相关的指标●2.4.2影响信息检索效果的因素●1.标引的质量●2.检索途径的数量●3.检索策略的优劣●4.检索人员的素质。
(完整版)信息检索考试重点
新
hing at a time and All things in their being are good for somethin
(二)
1、什么是检索工具?它的主要作用是什么? 答:检索工具是用来存储、报道和检索一次文献的工具,属于二次文献。 主要作用:报导作用、累计作用、查询作用、选择作用。 2、目录、题录、索引、文摘、文献指南各有那种类型? 答:目录可以分为国家目录、馆藏目录、联合目录、出版社与书商目录和专题目录。 题录的类型一般都是用代号表示。 索引类型可分为篇目索引和内容索引 文摘按其内容的详简程度可以分为指示性文摘和报道性文摘;按其适用对象可以分为一 般性文摘和倾向性文摘;按内容性质可以分为综合性文摘和专业性文摘。 文献指南主要介绍该科学和专题的主要文献类型。 3、什么是参考工具书?它有哪些主要作用? 答:参考工具书是根据一定的社会需要,广泛汇集某一范围的知识材料,按一定方式加以 编排,专供人们解释疑惑的特定类型的出版物。 作用:查字词、查事项、查人物、查机构、查产品、查物名、查地名、查年代、查数据。 4、字典和词典、百科全书、年鉴、名录、图录有哪些主要类型? 答:字典类型一般分为两种:○1 详解词典○2 专门词典。 词典从语种文别角度分为:○1 单语言辞典○2 多语言辞典。 从词量规模角度:○1 大型词典○2 中型词典○3 小型词典。 从收录内容角度:○1 百科全书○2 语文词典○3 专门词典。 百科全书分为两种类型:一类是概括人类一切门类知识,包括哲学、社会科学、自然科学 和应用科学等所有门类知识的综合性百科全书。另一类是指内容只收内容某一学科或某个 门类、某个专业的知识信息的专科性百科全书。 年鉴类型分为综合性年鉴、专业性年鉴、统计性年鉴。 名录类型分为人名录、地名录、物名录、机构名录。 图录类型分为地图录、科学技术用图集、历史图谱、文物图谱及人物图录。 (三)
信息检索复习资料(有答案版)
1.请说明一次文献、二次文献和三次文献的特点和功用。
(1)一次文献(Primary Document):通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。
如期刊论文、科技报告、会议论文、专利说明书(2)二次文献(Secondary Document):是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。
二次文献的重要性在于可以帮助人们查找一次文献。
如目录、题录、文摘、索引、各种书目数据库(3)三次文献(Tertiary Document):是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。
包括综述研究和参考工具两类。
如综述、述评、词典、百科全书、年鉴、指南数据库、书目之书目2.请说明题录目录文摘的特点以及区别(1)题录是揭示和报导单篇文献外表特征的工具。
特点:以单篇文献为著录对象(2)目录是系统积累和提供图书、期刊和其它单行本的名称、收藏单位和索取号等外表特征的揭示和报导的工具。
特点:以单位出版物为著录对象,反映馆藏情况,主要揭示文献外部特征(3)文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。
特点:带摘要的题录3. 布拉德伏特文献文献分散定律和期刊影响因子的概念(1)布拉德福文献分散定律:本专业文献的1/3刊登在本专业核心期刊上,另外的2/3则分散在其他的相关期刊和边缘期刊上。
如果将科技期刊按其刊载某专业论文数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个领域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2......的关系。
(2)期刊影响因子的概念是:某一种期刊在第三年得到的前两年的引文数与该刊前两年的总论文数之比。
4. 请阐述信息、知识、情报的概念,并分析它们三者之间的关系。
信息检索复习提纲
信息检索复习提纲一、填空题:1.根据文件载体的物理形式,文件可分为现代机读文件、视听文件和微型文件,以及传统的印刷文件。
2.按照检索的查找对象,信息检索分为数据、事实及文献检索。
3.一个完整的信息检索系统主要由六个子系统组成:文档选择、信息检索语言、文档索引、信息检索、用户系统交互和匹配。
4.各种检索语言的基本特性是:分类语言按学科专业集中文献信息;主题语言按特定事物集中文献信息;引文语言按引用关系集中文献;自然语言按词语集中文献信息。
5.信息检索中使用的检索方法可归纳为三类:常用方法、回溯方法和循环方法。
6.《中国出版年鉴》于1981年首次出版,此后每年出版一次,反映了前一年图书出版业的情况。
7.《四库全书》是中国和世界上最大的一部剧集。
8.在《四库全书》中,政治书籍属于历史系,班级书籍属于分系。
9.信息检索的本质是问号与文献号的比较。
10.召回率和准确率的计算。
2、术语解释:1。
文件传输2。
信息检索3。
数字图书馆4。
信息素养教育5。
主题词6.参考咨询服务三、简答题:1.简要描述信息源和信息资源的概念和区别?2.手册和年鉴有什么区别?3.类书与百科全书的区别?4.类书与资料汇编的异同?5.尝试描述文献信息的水平及其关系?6.信息检索的步骤?附件:手册与年鉴的区别?(1)手册内容基本,得到人们的肯定;年鉴包含了正在发展和变化的东西。
(2)本手册注重应用性和实用性,具有指导实践的功能;《年鉴》强调信息的准确性和及时性,不起指导实践的作用。
(3)手册中没有评论。
这是纯粹的信息,而年鉴允许权威评论。
(4)本手册主要面向专业人士,一般都很简单练、科学的专业语言,年鉴主要以普通读者为对象,较少使用专业语言。
教科书和百科全书有什么区别?(1)类书侧重于资料性,它将文献资料以类相从不加改动地直接辑录,仍保留着原始文献的形式。
而百科全书则是概括人类的一切知识并系统地加以叙述,侧重于知识性;(2)类书重在编,它将不同来源的同一资料不避重复地汇编于同一主题下,是原始资料的堆砌。
信息检索 复习资料
第一部分:基本常识1.文献按照出版形式可分为哪几种类型?举例。
图书、期刊、报纸、特种文献。
图书:专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等期刊:化学学报、煤炭学报、电工技术学报、高等教育研究、建筑工程与科学在CNKI 期刊全文数据库中检到共209条记录:国际城市规划、建筑结构学报、交通运输工程学报、建筑经济、土木工程学报、岩土工程学报、岩土力学、空间结构、地震工程与工程振动、中国给水排水、工程力学世界建筑工业建筑工程勘察中外建筑工程建设等。
报纸:人民日报特种文献:科技报告、会议文献、专利文献、学位论文、政府出版物、标准文献、产品资料、科技档案美国政府的四大报告1、国防部的AD报告2、商业部的PB报告3、国家航空及宇航局的NASA报告4、能源部的DOE报告。
2现代科技文献具有的特点哪些?答:(1)数量多、增长快, (2)出版形式多、文种多,(3)文献异常分散, (4)文献失效加快, (5)报道内容重复交叉, (6)文献总体质量下降3什么是核心文献、相关文献和边缘文献?答:核心文献通常是指与本学科发展水平、发展动向密切相关的一些文献。
如核心期刊等。
相关文献和边缘文献是指内容与学科的关系相对疏远一些的文献。
相关文献和边缘文献是本学科和其它学科相互渗透、互相结合的结果。
4 什么是文献?构成文献的有哪四个要素?答:文献的定义是记录有知识的一切载体称为文献。
构成文献的四要素是:知识内容,信息符号,载体材料,记录方式。
5 电子文献的主要类型和文件格式是什么?答:(1)按照载体的形态,电子文献可以有软磁盘(FD)、只读光盘(CD-ROM)、可擦写光盘(CD-RW )等之分;(2)按照文献的电子格式,电子文献有文本格式的txt文件、doc文件、pdf文件,图像格式的 gif文件、jpg文件以及标记文件格式的 html文件和xml文件之分;(3)按照出版周期和内容特点,电子文献可以有电子期刊,电子图书,电子报纸以及数据库等之分;(4)按照内容的性质和时效性,电子文献可以有论文文献和动态消息之分;(5)按照版权状况,电子文献又可分为有版权电子文献和无版权电子文献两类;(6)从文献信息利用的角度来看,可分为有版权的电子期刊、电子图书、报告的学术价值相对较高,而单篇论文和动态性的电子文献有时虽然没有注明版权,也有相当的参考价值。
信息检索复习资料
信息检索复习资料一、名词解释1.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。
2.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。
3.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
4.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。
5.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词某一部分允许有一定词形变化。
6.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识原始来源和属性的数据库。
7.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。
8.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。
9.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。
10.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。
11.电子报纸—多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。
12.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。
13.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。
计算机信息检索期末复习资料
计算机信息检索期末复习资料汇总A1卷第一部分:单选题(每小题1分,共30小题,共30分)1.将计算机的内存储器与外存储器相比,内存储器的主要特点之一是()。
A.价格更便宜B.存取速度快C.存储容量大D.价格虽贵但容量大2.二进制数整数1111101转换成十六进制数是()。
A.FBB.ACC. 7DD.9D3.1945年6月,()提出了在数字计算机内部的存储器中存放程序的概念。
A.乔治•布尔B.莫奇莱C.艾仑•图灵D.冯·诺依曼4.当一个文档窗口被保存并关闭后,该文档将()。
A.保存在外存中B.保存在内存中C.保存在剪贴板中D.既保存在外存也保存在内存中5.打开“资源管理器”所使用的快捷键是()。
A.Ctrl+AB.Alt+EscC.Win+ED.Ctrl+S6.计算机存储器中的一个汉字占用()个字节。
A.一B.二C.三D.四7.Word在正常启动之后会自动创建一个名为()的文档。
A.新文档1.DOCB.1.TXTC.DOC1.DOCD.文档18.在WINDOWS7中,对话框是一种特殊的窗口,但一般的窗口可以移动和改变大小,而对话框()。
A.仅可以移动,不能改变大小B.仅可以改变大小,不能移动C.既不能移动,也不能改变大小D.既能移动,也能改变大小9.在Windows7下,以下文件夹名正确的是()。
A.d/bB.11*2!C.2b&4d%D.<book>10.在windows7中,多应用程序窗口的切换可以通过()。
A.在任务栏上用鼠标单击右键B.Alt+TabC.按Alt+Shift键D.按键关闭当前活动窗口11.在Word中,有关表格的操作,以下说法()是不正确的。
A.文本能转换成表格B.表格能转换成文本C.文本与表格可以相互转换D.文本与表格不能相互转换12.在文件操作中,经常使用的通配符是()。
A./与%B.?与*C.*与%D.?与&13.在Word中,剪切的键盘快捷键是()。
信息检索知识点
信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进展相符性比较,但凡信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,那么具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体.检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进展标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进展标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进展比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法〔1〕顺查法〔2〕倒查法〔3〕抽查法〔4〕追溯法〔5〕循环法5.信息检索的途径〔1〕部特征途径a)分类途径b)主题途径〔2〕外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:〔1〕简单,形式简洁,易于理解;〔2〕可操作性强,应用广泛;〔3〕构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常准确的语义概念;〔4〕能处理构造化提问。
缺点:〔1〕表达用户复杂需求效果欠佳〔2〕准确匹配无法提供定量比较〔3〕匹配标准不尽合理〔4〕检索结果不易控制7.概率排序原那么:如果一个检索系统对用户的每个检索提问的反响是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
8.什么是计算机信息检索.所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那局部信息的过程。
信息检索复习资料
信息检索复习资料1.信息:信息是事物运动的状态与方式,是物质的一种属性。
2.知识:知识是人类对客观事物规律的认识,是人的主观世界对于客观世界的概括和如实反映。
3.情报:情报就是人们在一定的时间内为一定的目的而传递的有使用价值的知识或信息。
4.信息、知识、情报三者之间的关系:情报来源于知识,知识又来源于信息,用逻辑来表示:情报∈知识∈信息。
5.文献:文献,记录有知识的一切载体。
6.文献的三要素:知识(文献的内容),载体(文献的物质形式),记录(将内容固化在载体上的手段或方式)。
7.科技文献的特点:数量急剧增长;内容交叉重复;文献文版分散;文献失效加快;文献类型增多;文献语种增多。
8.科技文献的类型:1>按出版形式划分:科技图书;科技期刊;科技报告;会议文献;专利文献;学位论文;标准文献;产品资料;政府出版物;技术档案。
(主)2>按载体形态划分:印刷型文献;缩微型文献;声像型文献;机读型文献。
(主)3>按文献内容的加工深度划分:零次文献;一次文献;二次文献;三次文献。
4>按相对利用率划分:核心文献;相关文献;边缘文献。
*科技图书:一般分为阅读类图书和参考类图书。
前者包括教科书、专著和论文集等;后者包括各种参考工具书,如词典、百科全书、手册、年鉴、名录、表谱等。
9.信息检索:按检索对象的内容进行划分,信息检索分成了文献检索、数据检索、事实检索。
(作用、意义)文献检索是以文献为检索对象的一种检索,凡是查找某一年主题、某一学科、某一著者的有关文献均属于文献检索的范畴;文献检索是一种相关性检索,即检索系统不直接解答用户提出的技术问题本身,只提供与之相关的文献供用户参考;数据检索是以数据为检索对象,从已收藏的数据资料中查找出特定数据的过程。
数据检索是一种确定性检索,系统要直接回答用户提出的问题,提供用户所需要的确切的数据;事实检索即通过对信息集合中已有的基本事实或数据进行处理,然后得出新的(即未直接存入信息集合中的)事实的过程。
信息检索复习资料整理
信息检索复习资料第一章1、文献的定义:记录有知识的一切载体。
情报的属性:知识性、传递性、效用性。
文献的四个要素:知识内容、记录符号、物质载体、记录手段。
信息、知识、情报与文献的关系包含关系,转化关系,交叉关系信息的定义:信息是物质存在的一种方式、形态和运动状态,也是事物的一种普遍属性,一般指数据消息中包含的意义,可以是消息中所描述事件的不确定性减少。
知识的定义:P10知识是人类社会实践经验的总结,是人类智慧的结晶,是人的大脑通过思维对客观事物本质与规律性的认识和掌握。
情报的定义:人们为解决某一特定的问题而搜索、传递有特定效用的知识或信息。
文献信息分类——按物质载体及记录方式分类:手写型(古代手稿等)印刷型(图书、报纸等)缩微型(胶卷等介质类)声像型(唱片、录音带等)机读型(光盘、磁盘类)按加工程度分类:一次文献(个人期刊、科技报告、会议论文等等,首次公开发表的文献)特点:内容新颖、成熟、丰富,数量庞大。
二次文献(包括目录、索引、文摘等数据库,是数据库的搜索结果。
)特点:汇集性、检索性、报道性。
三次文献(图书是三次文献)特点:慨括性强、文字精炼、知识面广按出版形式分类:图书:ISBN(国际标准书号)表示汉语;209表示出版社号;03949表示书序号;X表示计算机校验码。
图书特点:成熟、可靠期刊:ISSN(国际标准刊号)期刊是最重要的信息源,从期刊中获得的信息量,占整个科技信息源的60%-70%以上。
期刊字段:题名、作者、刊名、卷期、机构期刊特点:速度快、能及时反应研究动态。
报纸:信息量大、通俗、传播面广、但资料庞杂零散。
科技报告:表述严谨、数据可靠,参考价值高。
学位论文:D是学位论文的缩写,有题名、作者、指导老师、学位授予单位等等字段。
会议文献:专业领域集中,针对性强。
包括题名、作者、会议名称等等字段。
专利文献:专利文献是世界上最大的信息技术源,具有新颖性、创造性、实用性等特点。
专利的类型:发明专利(延迟审查制;1)、实用新型专利(形式审查;2)、外观设计(形式审查;3)专利的特性:专有性、时间性、地域性CN 200910053606.0CN:中国;2009:年份;1:发明专利;0053606:申请专利的流水号;0:计算机校验码。
计算机信息检索复习资料
计算机信息检索复习资料计算机信息检索复习知识点第一章1、人类生活的3个基本要素是材料、能源和信息。
(单选)2、信息是指应用文字、数据或信号等形式,通过一定的传输和处理,来表达各种相互联系的客观事务在运动中所具有的特征性内容夫人总称。
(名词)3、信息的特征有:客观性、动态性、相对性、依存性、可传递性。
(多选)4、共享性是指同一内容的信息可以在同一时间里被多个信息用户使用。
5、信息的功能有哪些?(简答)(1)信息是感知世界的中介;(2)信息是管理决策的依据;(3)信息是科学研究的必要条件;(4)信息是社会发展的资源;6、信息的类型有哪些?(论述)(1)按信息的表达形式划分,可以分为①文献信息②声像信息③电子信息(2)按信息的应用范围划分,可分为①白色信息②灰色信息③黑色信息(3)按信息的加工层次划分①一次信息②二次信息③三次信息7、信息需要:所谓信息需要,就是指人们在从事各项实践活动的过程中,为解决所遇到的各种问题而产生的对信息的需要。
(名词)8、信息需求的特征有哪些?广泛性、社会性、发展性、多样性(多选)9、现代信息技术的基础是微电子技术(单选)10、数据库是指为满足多个用户的多种应用需要,按一定的数据模型在计算机中组织、存储和使用的相互联系的数据集合。
(名词、单选)11、通信系统的基本组成包括信源和:信宿、变换器、反应器、信道、噪声源12、信号的接收者称为信宿13、信息传输的通道称为信道14、信号在传输过程中受到的干扰称为噪声15、数据库简称DB16、数据库的四种基本操作是:检索、更新、删除、插入17、数据库的特点有哪些?(简答)(1)数据共享;(2)面向全组织的数据结构化;(3)数据独立性;(4)可控数据冗余度;(5)统一数据控制功能。
18、数据结构化有利于实现数据共享19、数据库管理系统可以提供哪些方面的数据控制功能:安全性、完整性、并发控制、数据恢复20、构成数据库的三个主要层次是:文档、字段、记录21、记录的基本单元是:字段22、文档的基本单元是记录23、一个文档中你好,认识一下!包含大量的记录24、检索系统提供的数据库相关文档组成包括的文件数是3个25、顺排文档:按记录的存取号的大小顺序存入全部记录,它相当于印刷型检索工具的正文部分。
信息检索复习整理
一、什么是信息(Information)?在西方英文中information一词有情报、资料、消息、报道之意,我国大陆曾译为情报或信息,后经国家有关部门核准,统一译成“信息”。
在我国台湾、香港地区,该词被译为“资讯”。
信息是被反映物的属性再现,信息的属性在于表现它物。
也就是说,信息不是事物的本身,而是由事物发出的消息、情报、指令、数据、信号中所包含的内容,是对客观世界中各种事物发出的特征、变化及其相互联系的最新反映。
一切事物包括自然界和人类社会都会产生信息。
一个完整的信息过程,包括信息的传递、接收、贮存、加工和利用。
2、信息具有以下特征:1)普遍性(2)时效性:信息在一定的时间内是有效的信息,在此时间之外就是无效信息。
而且任何信息从信源传播到信宿都需要经过一定的时间,都有其时滞性。
(3)传递性(4)可转换性:信息是可以由一种形态转换成另一种形态。
信息一般有4种形态:数据、文本、声音、图像。
这4种形态可以相互转化,例如,照片被传送到计算机,就把v图像转化成了数字。
(5)可再生性(6)共享性:同一信源可以供给多个信宿,因此信息是可以共享的,且不因共享而减少(7)可识别性:信息是可以识别的,识别又可分为直接认别和间接识别,直接认别是指通过感官的识别,间接识别是指通过各种测试手段的识别。
不同的信息源有不同的识别方法。
(8)可存储性:信息是可以通过各种方法存储的。
二、信息检索广义:将信息按一定的方式组织和存储起来,并根据用户需要找出相关文献的过程。
其中包括存与取两个环节,存即信息存储,是对信息进行收集、标引、描述、及组织,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程。
取即信息查找,是通过某种查询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程。
狭义:仅仅指信息查找的过程。
即取的环节。
三、信息检索的发展1、第一阶段:完全手工检索阶段2、第二阶段:半机械检索系统-机电、光电检索系统的发展阶段3、第三阶段:计算机检索系统的发展阶段4、第四阶段:基于Internet 的网络化检索系统阶段信息资源的分类:1、信息源可分为自然信息源和社会信息源。
计算机信息检索复习
计算机信息检索复习计算机信息检索是指通过计算机技术来获取和利用大量信息资源的过程。
在现代社会,数据量爆炸式增长,人们需要从海量的信息中快速准确地找到所需的信息。
计算机信息检索因此成为一门重要的学科,被广泛应用于各个领域。
本文将从计算机信息检索的基本概念、分类方法、技术算法以及发展前景等方面进行复习。
一、基本概念1.1 信息检索与搜索引擎的区别信息检索是指通过用户输入的关键词等信息,在信息资源中查询并返回相关信息的过程,而搜索引擎是指以互联网为载体,通过爬取、索引和检索技术,提供全面、快速、准确的信息查询服务。
1.2 关键词关键词是用户在进行信息检索时使用的重要词汇,它能够准确描述用户的需求。
在信息检索系统中,关键词通常通过布尔逻辑运算符进行联合查询,以便更加准确地匹配用户需求。
1.3 相关性相关性是指检索结果与用户需求的一致程度,是衡量信息检索系统性能的重要指标。
相关性通常通过计算文档与查询之间的相似度来确定。
二、分类方法2.1 根据检索领域根据检索领域的不同,可以将计算机信息检索分为一般文本检索、专业文献检索、多媒体检索等。
2.2 根据检索模式根据检索模式的不同,可以将计算机信息检索分为精确检索和模糊检索。
精确检索要求检索结果与用户需求完全一致,而模糊检索则容许检索结果与用户需求存在一定程度的差异。
2.3 根据检索技术根据检索技术的不同,可以将计算机信息检索分为基于关键词的检索和基于内容的检索。
基于关键词的检索是目前应用最广泛的检索方式,而基于内容的检索则能够更好地满足用户个性化需求。
三、技术算法3.1 倒排索引倒排索引是一种常用的信息检索技术,它将文档集合中的每个词汇与包含该词汇的文档进行关联,快速地定位文档。
倒排索引能够大大提高检索效率和准确性。
3.2 向量空间模型向量空间模型是一种通过计算文档与查询之间的相似度进行检索的方法,它将文档和查询表示为向量,通过计算它们之间的夹角来衡量相似度。
信息检索期末复习资料
信息检索一.名词解释1.索引(P150):索引是将书籍、期刊等文献所刊载的论文题目、作者,以及所讨论的或设计的学科主题、名词术语、所引用的参考文献等,根据一定的需要,经过分析分别摘录出来,注明其所在书刊的页码,按一定的原则和方法排列起来的一种检索工具。
2.回溯检查法:又称追溯法、引文法、引证法,是一种跟踪查找的方式。
即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。
通过回溯法所获得的文献有助于对课题的主题背景和立论依据等内容有更深的理解。
该方法获得文献针对性强、数量较多,在没有检索工具或检索工具不齐备的情况下,利用此法能够获得一些所需要的文献资料。
3.可视化:将数据库中不可见的语义关系以图像的形式可视化显示,并表达用户检索过程。
一个可视化的环境为用户展示更丰富、更直观的信息,一个透明的检索过程使检索更容易、更有效。
它包括检索过程的可视化和检索结果的可视化。
可视化信息检索技术缩短了用户理解信息的时间,提供了感觉和思考之间的有效反馈机制,它代表着信息检索的未来,将会取代以布尔逻辑为基础的、传统的信息检索系统。
4.自动标引:是指直接通过计算机的操作处理,自动实现赋予检索标志的活动。
分为自动主题标引和自动分类标引,即根据计算机内信息(标题、摘要或全文),借助算法自动给出反应主题内容的标引词和自动分配分类号。
5.全文扫描:是以从文本文档中找出与查询表示的字符串完全一致的部分为目的,检索结果返回包含查询字符串的文本及其位置的检索技术。
6.查全率:查全率是指从检索系统检出的与某课题相关的文献信息数量与检索系统中实际与该课题相关的文献信息总量之比。
对于数据库检索系统,查全率为检索出的款目数与数据库中满足用户检索式需求的款目数之比;而对于互联网信息检索系统来说,文献总量是很难计算的,甚至连估算都困难。
在这里人为因素的影响比较大。
相对查全率=(专业人员检出文献的数量数/全部实际检出文献集合并集中文献数量) *100%7.图像信息抽取:是指从数字图像中抽取包括基于文本的特征(说明,注释等关键词)和视觉特征或底层特征(颜色,文理,形状等),作为图像的特征描述,支持信息检索。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机信息检索复习知识点第一章1、人类生活的3个基本要素是材料、能源和信息。
(单选)2、信息是指应用文字、数据或信号等形式,通过一定的传输和处理,来表达各种相互联系的客观事务在运动中所具有的特征性内容夫人总称。
(名词)3、信息的特征有:客观性、动态性、相对性、依存性、可传递性。
(多选)4、共享性是指同一内容的信息可以在同一时间里被多个信息用户使用。
5、信息的功能有哪些?(简答)(1)信息是感知世界的中介;(2)信息是管理决策的依据;(3)信息是科学研究的必要条件;(4)信息是社会发展的资源;6、信息的类型有哪些?(论述)(1)按信息的表达形式划分,可以分为①文献信息②声像信息③电子信息(2)按信息的应用范围划分,可分为①白色信息②灰色信息③黑色信息(3)按信息的加工层次划分①一次信息②二次信息③三次信息7、信息需要:所谓信息需要,就是指人们在从事各项实践活动的过程中,为解决所遇到的各种问题而产生的对信息的需要。
(名词)8、信息需求的特征有哪些?广泛性、社会性、发展性、多样性(多选)9、现代信息技术的基础是微电子技术(单选)10、数据库是指为满足多个用户的多种应用需要,按一定的数据模型在计算机中组织、存储和使用的相互联系的数据集合。
(名词、单选)11、通信系统的基本组成包括信源和:信宿、变换器、反应器、信道、噪声源12、信号的接收者称为信宿13、信息传输的通道称为信道14、信号在传输过程中受到的干扰称为噪声15、数据库简称DB16、数据库的四种基本操作是:检索、更新、删除、插入17、数据库的特点有哪些?(简答)(1)数据共享;(2)面向全组织的数据结构化;(3)数据独立性;(4)可控数据冗余度;(5)统一数据控制功能。
18、数据结构化有利于实现数据共享19、数据库管理系统可以提供哪些方面的数据控制功能:安全性、完整性、并发控制、数据恢复20、构成数据库的三个主要层次是:文档、字段、记录21、记录的基本单元是:字段22、文档的基本单元是记录23、一个文档中你好,认识一下!包含大量的记录24、检索系统提供的数据库相关文档组成包括的文件数是3个25、顺排文档:按记录的存取号的大小顺序存入全部记录,它相当于印刷型检索工具的正文部分。
26、倒排文档:把记录中的可检字段抽出,包括单元词、多元词,按某种顺序重新加以组织后得到的一种文档。
27、倒排文档只包括记录的标识、信息的数量及信息存取号。
28、存储了数据库所有记录的特征标识的是倒排文档29、数据库文档中便于随机存取,实现非顺序存储结构的文件是索引文档30、传统的检索对象主要是文献型的信息源31、传统的检索对象的存储介质是纸张32、对超文本、超媒体信息资源实施的检索是超维检索第二章1、计算机信息检索经历了哪几个主要发展阶段?(简答)(1)脱机批处理检索阶段;(2)脱机检索阶段;(3)光盘检索阶段;(4)网络化检索阶段2、计算机信息检索必备的条件是物质和人员3、计算机检索的类型有哪些?(论述)计算机信息检索的类型可以通过检索的内容、信息出版的时间和检索工作的方式加以划分1根据计算机信息检索的内容划分,检索可以分为(1)数据检索;(2)事实检索;(3)文献检索2根据被检索信息出版的时间划分,可分为:(1)定题信息检索;(2)回溯性信息检索3根据计算机检索工作的方式划分,可分为:脱机检索系统;(2)联机检索系统4、事实检索的对象是事实5、检索结果能够满足用户需要的文献线索或文献全文的是文献检索6、回溯性信息检索:根据用户提供某一段时间范围内的文献信息的检索方法7、计算机批处理的信息检索系统称为脱机检索系统8、用户以联机会话方式直接访问系统及其数据库的信息检索系统称为联机检索系统9、信息检索系统:是指按照某种方式、方法见利起来的供读者检索信息的一种有层次的体系,是表征有序的信息特征的集合体。
10、信息检索系统的职能有:报道职能、存储职能、检索职能11、信息数据库可以划分为:参考数据库、源数据库、混合型数据库12、参考数据库:是指用户从中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库13、源数据库:能够直接为用户提供原始资料或具体数据的一类数据库。
14、信息系统的构成模式是什么?(简答)(1)信息数据的选择、处理、录入和维护子系统;(2)词表和标引子系统;(3)检索子系统;(4)系统----用户接口子系统统15、信息检索系统的存储结构有:印刷存储、微缩存储、磁存储、半导体存储、光存储16、信息存储的逻辑结构有:线性结构、非线性结构、树形结构、网形结构17、数据元素按一定顺序构成一个有限序列的信息存储结构称为:线性结构18、非线性结构中最常用的的是树形结构和网形结构19、将信息用二进制表示称为编码20、计算机处理信息的最小单位是一位二进制数21、两级存储器是指主存储器和辅助存储器22、信息检索的概念起源自文献信息检索23、对信息进行主题分析,提取代表该信息的特征的过程称为标引24、自动抽词标引:利用计算机直接从信息正文、标题或文摘中抽出能表达信息主题的关键词作为标引词,并自动生成关键词索引或倒排文档。
25、对一本书或一篇文章所做的扼要摘述称为文摘26、利用计算机自动编制文摘称为自动文摘27、在信息检索自动化处理中,常用的运算是排序28、常用的自动排序的方法有选择排序和快速排序29、存储区域网简称为SAN30、目前大多数中小企业见利网络环境的协议基础是TCP/IP31、信息检索系统的组织:为了控制信息的流速和流向、数量和质量等,把传递中的杂乱无序的信息整理为系统有序状态的活动。
32、信息检索系统的组织目的是什么?(简答)(1)减少社会信息流的混乱程度;(2)提高信息系统的质量和价值;(3)建立信息检索系统与用户的联系;(4)节省社会信息活动的总成本。
33、信息检索系统的组织的要求有哪些(1)信息内容有序化;(2)信息流向明确化;(3)信息流速适度化;(4)信息质量最优化。
34、信息检索系统组织方法:是指对每一信息的各种外表特征和内容特征进行描述并确定其标识,然后按一定方式或规则将其内容组织起来以供检索的方法35、信息检索系统的传统组织方法有哪些?(1)分类组织法;(2)主题组织法;(3)字顺组织法;(4)号码组织法;(5)自然组织法36、进行网络信息资源组织的方式主要有:文件组织方式、主题树组织方式、超文本组织方式、超媒体组织方式、元数据组织法37、以文件为单位共享和传输信息的组织方式称为文件组织方式;38、超文本的信息组织方法是非线性;39、元数据又称描述数据;40、对初选信息的鉴别、筛选和删除称为优化;41、优化选择的方法有:比较法、分析法、核查法、引用摘录法、专家评估法42、检索语言:检索信息所使用的人工语言;43、登录在类表、词表中的所有标识称为词汇44、检索语言的作用有哪些?(简答)(1)对信息内容进行主题分析;(2)便于将标引、检索用的标识符进行相符性比较,保证检索和标引的一致性;(3)保证检索结果和检索要求的一致性;(4)保证信息存储集中化和系统化45分类语言的基础是科学分类46主题语言是使用词语标识的一类信息检索语言,称为主题法47、把主题词按照一种便于检索的方式编排起来,称为主题词48、关键词:从信息的题名、摘要和内容中抽取出来的,能够表达信息主题内容的具有检索意义的关键性词汇。
49、叙词:是指从自然语言中优选出来并经过规范化处理的名词术语,属于后组式语言的一种,是采用表示单元概念的规范化语词的组合来对信息主题或内容进行描述的标识系统。
50、叙词的特点:专指性、直观性、多维检索、适应性、网络结构51、按照学科体系进行系统排列的语言称为分类语言52、按照主题词的字顺序列排列的语言称为主题语言53、计算机信息检索是指利用计算机存储信息和检索信息54、进入检索的入口称为检索途径55、按学科分类体系查找信息的途径称为分类检索56、利用信息主题内容进行检索的途径称为主题检索57、选择实现检索计划的具体方法和手段是选择检索方法58、利用检索系统查找信息的方法称为工具法59、信息检索策略:将课题的提问及其检索词与检索系统的收录内容、编排特点相匹配而确定的检索方案或程序。
60、检索效果:是指信息系统检索信息的有效程度,反映了信息系统的检索能力61、查全率:检索出的相关信息量与信息系统中的相关信息量之比62、查准率:检索出的相关信息量和检索出的信息总量之比。
63、衡量检索效果的相对合理指标是差准率和查全率第三章1、布尔逻辑检索:是指通过标准的布尔逻辑关系词来表达检索词与检索词之间逻辑关系的检索方法。
2、布尔逻辑运算符有:逻辑与、逻辑或、逻辑非3、INTERNET上信息出传输的主要方式是FTP4、检索者将检索词在他认为合适的地方截断称为截词5、限制检索:在检索系统中,使用缩小和限定检索范围的方法称为限制检索6、邻近检索:通过专门符号来规定检索词在结果中的相对位置7、中级检索技术包括哪些内容?(1)加权检索技术;(2)自然语言检索技术;(3)相关信息反馈检索技术;(4)模糊检索技术;(5)概念检索技术。
8、自然语言处理应用领域之一是信息检索9、概念层次网络简称HNC10、自然语言处理技术可以分为机器翻译、语义处理以及人机会话11、搜索引擎用到的自然语言处理技术是机器翻译与语义处理12、实现只能搜获的过程主要分为:语义处理、知识管理、知识检索13、从用户角度看,用户可以分为最终用户和职业用户14、信息检索发展史上的突破是应用了自然语言检索15、智能代理资源管理器的基本结构是:适配器、引擎、知识、库、视图16、智能代理信息检索系统的特点有哪些?(论述)(1)智能代理侧重于面向用户。
(2)智能代理主要借助知识库、数据库,并参考用户需求习惯和一段时期内的偏好,推断用户提问的真实意图,提高检索的专指性。
(3)智能代理采用机器学习、用户框架模型、推理机制主动协助用户查找信息。
(4)智能代理不仅是关键字的匹配,而且是基于概念和知识的检索。
(5)智能代理能不断了解用户需求的变化,并根据用户的反馈信息及时修正检索目标策略。
(6)智能代理能分离发送请求和接收结果,使它们异步进行。
(7)智能代理能使用户按照个人的兴趣爱好进行信息分类。
17人们进行信息检索时总是期望获得较高的查全率和查准率18对信息进行采集、标引、存储、处理,最后形成信息集合体19、通过模拟自然进化过程搜索最优解的方法称为遗传算法20、搜索引擎和挖掘引擎处理的都是字串和文本21、数据挖掘也称知识发现22、聚类:按照事物的某些属性,把事物聚集成类,使类间的相似性尽量小,类内相似性尽量大23、一种很有效的预测模型技术是神经元网络第四章1.INTERNET起源于ARPANET2、我国的四大互联网络是:中国科技网、中国教育科研网、中国公用互联网、中国公用经济信息网3、INTERNET提供的基本信息服务有:电子邮件、文件传输、远程登陆、电子公告板、网络新闻组4、可以在异地主机上登陆注册的服务是TELNET5、通过专用电缆与INTERNET主干网直接连接在一起的称为专线连接6、综合业务数字网简称ISDN7、非对称数字用户环路简称ADSL8、网络信息资源主要类型是联机检索系信息资源和网络信息资源9、联机检索信息资源的主要表现形式是联机数据库10、文件传输协议是FTP11、网络信息资源进行组织的主要方式有:文件方式、主题树方式、超文本方式、数据库方式、超媒体方式、元数据方式。