信息检索知识点92382
信息检索知识点

信息检索知识点 Revised by Liu Jing on January 12, 2021信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)着者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
信息检索知识点

信息检索知识点信息检索是指从大规模的信息资源中,通过利用各种信息检索工具和技术,准确和高效地找到用户所需要的信息的过程。
信息检索技术在现代社会中扮演着重要的角色,它不仅广泛应用于互联网搜索引擎,还在图书馆、数据库、企业信息管理等领域发挥着重要作用。
本文将介绍信息检索的定义、关键概念和一些常用技术。
一、信息检索的定义和目标信息检索是指通过计算机等工具从大规模的信息资源中,按照用户的需求进行检索,提供相关性高、准确性好的信息结果。
它的目标是帮助用户快速地找到所需的信息,提升信息搜索效率和准确性。
二、关键概念1. 查询:用户提交的检索请求,通常由一系列关键词组成。
2. 检索词:查询中使用的关键字或关键词短语。
3. 检索结果:根据查询返回的与之相关的文档或信息。
4. 相关性:衡量检索结果与查询之间相关程度的指标,通常使用相关性排序算法进行排序。
5. 文档:信息资源的基本单位,可以是网页、文章、图片、音频等形式。
三、信息检索的主要技术1. 分词技术:将文本数据按照一定规则分割成有意义的词语,是信息检索的基础步骤。
2. 索引技术:将文档中的关键词与其所在位置进行索引,以提高检索效率和准确性。
3. 倒排索引:根据关键词构建索引表,记录关键词与文档之间的对应关系,常用于搜索引擎等场景。
4. 相似度计算:根据查询和文档的相似性,为检索结果进行排序。
5. 结果评估:通过评估检索结果的质量,改进检索算法和模型。
四、常用的信息检索模型1. 布尔模型:将查询和文档转化为布尔表达式,按照布尔运算进行检索。
2. 向量空间模型:用向量表示文档和查询,通过计算向量之间的相似度进行检索。
3. 概率检索模型:基于统计方法,利用概率模型进行信息检索。
五、信息检索的挑战和发展方向1. 大规模数据处理和存储:随着互联网的快速发展,信息资源呈指数级增长,如何高效地处理和存储大规模的数据成为了一个挑战。
2. 多语言检索:不同语言的信息检索在跨语言信息检索中面临很大的难度和挑战。
信息检索原理期末重点背诵知识点

信息检索1、信息检索概念:P12、信息检索的原理一整节内容要自己理解:P3-P4图1-1要掌握文献替代和文献整序的概念要掌握3、信息检索在历史上的不同表现:联机检索、光盘检索、网络检索的区别和特征:P6-P94、信息检索的模型概念:P95、布尔模型、向量空间模型、经典概率模型要理解并掌握各自的优缺点:P11-P126、信息检索系统的概念:P127、检索效果的评价指标:P15-P164个指标:查全率、查准率、漏检率、误检率掌握它们的含义并懂得计算8、网络检索的表达式:布尔逻辑检索、邻近检索、短语检索、截词检索的特点、区别和联系:P17-P219、信息检索的技巧要理解尤其是要掌握及时调整检索策略:P33-P3610、搜索引擎的概念:P3711、数据库知识,实验内容,特点12、引文的概念13、搜索引擎的分类:P40-41搜索引擎划分的类别以及元搜索引擎的概念要掌握12、CBR概念P11312、多媒体信息检索的原理和方法:P110-P114其中要重点理解基于内容的多媒体信息检索的检索形式(可以结合课件)13、专利的概念:P12514、专利的类型:P126(理解一下各类型的区别)15、专利文献的概念:P12716、专利文献的类型:P127(理解一下各类型的区别)17、灰色文献的概念:P14718、会议文献的概念:P15819、科技报告的概念:P16320、查新的概念:P20021、科技查新的作用:P201(每一个小标题后面要自己展开一段)关于上课讲的那几个数据库大家自己看一下PPT,掌握一下。
以上纯属个人观点题型:名词解释:5*4=20简答题:4*10=40论述题:2*20=40考试时间:1月8日上午:9:00—11:001.信息检索的概念(P1)信息检索有广义和狭义两重含义。
广义上说,信息检索是指将信息按照一定的方式组织和存储起来,并根据信息用户的需求查找相关信息的过程。
它包含信息存储和信息查找两个过程。
信息检索基础知识

TP 自动化技术、计算技术
3 计算技术、计算机
31
计算机软件
316
操作系统
.1
分时操作系统
.2
实时操作系统
.7
Windows操作系统
39
计算机的应用
… F25 物资经济 F250 物资经济理论 F252 物资流通
… F5 交通运输经济 F50 交通运输经济理论
… F53 铁路运输经济 F54 陆路、公路运输经济
匹配有其匹配标准,这里涉及到两者一致性、 相关度等问题,按一定的标准筛选出符合要求的 信息。
精选ppt
3
信息检索一般过程
信息源
信息分析、 著录、标引
信息的表示
用户
检索语言
用户需求分析
数据库 匹配过程
输出检索结果 精选ppt
检索表达式
4
信息检索的过程往往需要一个评价反馈途径,多次比较匹配, 以获得最终的检索结果。其图示如下:
9
责任者 及其单位
中图分类号 文献标示码
关键词
正文
精选ppt
题名 摘要
10
分类语言
也属于主题语言。分类语言是按学科范畴划分而构成的一 种语言体系,它集中反映学科的系统性、反映它们的相关、 从属、派生等关系,从总体到局部分层、分面展开,形成 分类体系。由类目号码及名称作为检索语言,构成分类类 目表,如前述图书分类表、专利分类表用的都是分类语言 。
13
……
主题语言
包括:关键词语言、单元词语言、标题词语言、叙词语言等,它们有不同 的主题词表。主题词表达概念本身,在主题词表中通过参照系统来指示词 汇之间的关系。如”交通运输”、“国际物流”。主题语言分为规范主题语
信息检索基础知识考点整理

信息检索基础知识考点整理●2.1 信息检索的概念与原理●2.1.1 信息检索的概念(重要)●2.1.2 信息检索的原理●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出●信息检索的类型●1.文献检索●2.数据检索●3.事实检索●2.1.3 信息检索的意义/作用(重要)●1.信息检索是有效利用信息资源,实现其最大价值的科学方法●2.信息检索是再学习的工具,是获取知识的有效途径●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间●2.1.4 信息检索的历程●1.手工检索●2.计算机检索●2.2 信息检索系统(重要)●2.2.1 信息检索系统的概念●1.信息检索系统的含义●2.信息检索系统的工作原理●2.2.2 信息检索系统的构成●1.信息选择子系统●2.信息索引子系统●3.词表管理子系统●4.用户接口子系统●5.匹配子系统●2.2.3 信息检索系统的分类●1.手工检索系统●1.书本式的手工检索系统●2.卡片式的手工检索系统●2.计算机检索系统●1.硬件●2.软件●3.数据库●1.参考数据库●1.书目数据库●2.指南数据库●2.源数据库●1.数值数据库●2.文本—数值数据库●3.全文数据库●4.术语数据库●5.图像数据库●6.多媒体数据库●2.3 信息检索方法(重要)●1.直接浏览法●直接查找法●2.常用法●顺查●倒查●抽查●3.追溯法●4.综合法(分段查找法、循环法、交替法)●2.4 信息检索效果(重要)●2.4.1 信息检索效果评价●信息检索效果的概念●1.检索结果有效性评价●2.检索系统实用性的评价●3.检索费用—效率评价●信息检索效果评价对于信息检索系统的建设和发展的意义●信息检索效果评价的核心问题是建立一套切实可行的评价指标●1.查全率和查准率●2.误检率和漏检率●3.响应时间●其他与检索效果相关的指标●2.4.2影响信息检索效果的因素●1.标引的质量●2.检索途径的数量●3.检索策略的优劣●4.检索人员的素质。
信息检索基础知识汇总

分类语言 (classification) 主题词(subject) 关键词(keyword)等
表述文献外表 特征的语言 检 索 语 言 表述文献内容 特征的语言
分类语言(classification)
将各种概念按学科性质进行分类和系统排列 的语言,具体体现为用分类号和类名来表达信息 的主题概念。 中国图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法
IPC国际专利分类法
中图分类法
《中图法》分 5个基本部类,将知识门类分为 “哲学”、“社会科学”、“自然科学”三大部 类。马克思主义、列宁主义、毛泽东思想是指导 我们思想的理论基础,作为一个基本部类,列于 首位。此外,考虑到图书本身的特点,对于一些 内容庞杂,类无专属,无法按某一学科内容性质 分类的图书,概括为“综合性图书”,作为一个 基本部类,置于最后。在此基础上扩展为 22个大 类。 标记符号采用拉丁字母与阿拉伯数字相结合的混 合号码制。
8 其它途径
检索途径的选择取决于两个方面:
一是课题的已知条件和课题的范围及检 索效率要求;
二是所选择的检索工具所能提供的检索 途径。
构造检索式
检索式是检索策略的逻辑表达式,是用来表达 用户检索提问的,由基于检索概念产生的检索词和 各种组配算符构成。
组配算符通常有布尔逻辑算符、截词符(通配 符)、位置算符、嵌套算符(优先算符)四种。
第三章
信息检索基础知识
知识要点
★ 信息检索概念及其分类 ★ 信息检索基本原理及检索语言 ★ 信息检索的基本步骤 ★ 检索效果及其评价
信息检索(information retrieval)概念
信息检索初步知识点总结

信息检索初步知识点总结信息检索是指利用计算机系统来检索和获取文档或者信息资源的技术和方法。
在当今信息爆炸的时代,信息检索具有非常重要的意义。
信息检索系统可以帮助人们快速准确地获取所需要的信息资源,不仅可以提高工作和学习效率,还可以帮助人们更好地利用信息资源。
在信息检索中,有一些基本的知识点是非常重要的,下面我将对这些知识点进行总结。
1. 信息检索的概念和发展历史信息检索是指从信息库中按照一定的要求来搜索、检索信息的过程。
它主要是利用计算机技术来实现信息的存储、检索和利用。
信息检索的发展可以追溯到20世纪50年代,随着计算机技术的发展,信息检索技术也得到了很大的发展。
现代信息检索系统不仅能够实现文档的存储和检索,还可以实现自然语言处理、信息抽取、信息过滤等功能。
2. 信息检索的基本过程信息检索的基本过程包括信息需求分析、文档表示和查询处理、检索模型和算法、评价和反馈等几个方面。
其中,信息需求分析是整个信息检索过程的第一步,它包括对用户的信息需求进行分析和建模,确定用户的检索目标和检索词,为后续的检索准备工作做好准备。
文档表示和查询处理是指对文档和查询进行适当的表示和处理,以便计算机系统能够理解和利用。
检索模型和算法是指根据文档和查询的表示,计算出相关度得分,以确定文档的相关性。
最后,评价和反馈是指对检索结果进行评价和反馈,以优化检索系统的性能。
3. 信息检索的技术手段信息检索的技术手段主要包括文本索引技术、全文搜索技术、信息抽取技术、信息推荐技术等几个方面。
其中,文本索引技术是指将文档中的关键词进行索引,以便计算机系统能够快速地定位到相关的文档。
全文搜索技术是指利用全文索引进行搜索,可以实现对文档中所有内容的搜索。
信息抽取技术是指从文档中抽取出有用的信息,以便为用户提供更精确的搜索结果。
信息推荐技术是指根据用户的行为和偏好,为用户推荐相关的信息资源。
4. 信息检索的评价指标信息检索的评价指标主要包括召回率、准确率、F值、MAP值等几个方面。
信息检索复习知识点

信息检索复习知识点1.信息(Information)信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不确定性减少。
* 信息的属性——客观存在性* 信息的作用——消除不确定性* 信息的形式——数据、消息等事实2.各种客观存在的、可供人们直接或间接开发与利用的信息的集合总称为信息资源3. 信息用户Information User信息的使用者即是信息用户。
使用的情况可以包括需要信息、接受信息和利用信息。
4. 信息需求Information Demand人们在社会实践活动中,为了解决各种实际问题,会产生对信息的需要,这种需要可表现为对信息的必要感和不满足感。
我们把意识到的信息需要定义为信息需求5. 信息检索Information Retrieval对信息用户而言,信息检索就是根据各自的目的和要求,选择恰当的信息资源,采用适当的检索手段、检索技术、检索方法,对所需要的信息进行查找、筛选和索取的过程或活动。
6. 信息素质:人们能够敏锐地察觉信息需求,并能进行相应的信息检索、评估以及有效利用所需信息的水平。
* 信息意识* 信息能力* 信息道德7. 信息社会是以知识和信息为基础从而促进社会高速发展的一种社会形态。
8. 经济领域的特征a.劳动力结构出现根本性的变化,从事信息职业的人数与其它部门职业的人数相比已占绝对优势;b.在国民经济总产值中,信息经济所创产值与其它经济部门所创产值相比已占绝对优势;c.能源消耗少,污染得以控制;d.知识成为社会发展的巨大资源。
9. 社会、文化、生活方面的特征10.社会观念上的特征11当代信息环境特征描述* 信息超载严重信息超载又称信息泛滥或信息爆炸。
它是指在信息时代,伴随着科学技术的迅速发展,出现的数据爆炸、信息平庸化以及噪音化趋势,人们无法根据自己的需要和当前的信息能力选择并消化自己所需要的信息。
* 信息失衡明显所谓信息失衡是对由于各国经济水平、科技水平和其它多种相关因素的影响,不同国家、不同地区以及不同阶层的人群在信息占有水平以及利用程度上存在极大差距的描述。
信息检索重点知识

信息:信息是事物存在的方式,运动状态及其特征的反映,是事物发出的信号,消息信息的特征:载体依附性无线共享性永不枯竭性开发增值性应用时效性存在普遍性知识:知识是信息的升华和结果,系统化理论化的的信息就称为就称为知识文献:用一定的方式记录在一定的载体上的知识都称之为文献信息源:个人为满足信息的需要而获得信息来源称之为信息源信息源类型:①个人信息源②组织机构信息源③实物型信息源④文献信息源⑤电子型信息源①及时、新颖、传递迅速、但带有主观随意性,久传易出错②内部信息源,共管理人员分析③直观性强,信息量大,有一定隐蔽性④当今数量最大,利用率最高的信息资源⑤内容广泛、使用简便信息资源:即作为资源的信息。
信息资源的构成要素: 信息生产者,信息,信息技术。
文献信息源分为:图书期刊学位论文科技报告专利文献标准文献产品样本会议文献政府出版物零次文献:未经出版发行或者未进入社会交流的最原始的文献一次文献:以作者本人取得的成果为依据而创作的作文报告等公开发表或出版的各种文献二次文献:按照特定的目的进行筛选,即所谓用一定的检索工具进行过加工的文献三次文献:根据二次文献提供的线索,选用大量一次文献的内容,经过筛选分类综合和浓缩而再度出版的文献信息素养DY:能认识到何时需要信息和有效的搜索评估和使用所需要信息的能力医学信息素养内容:信息意识信息知识信息能力信息道德(DY以医学信息获取、评价和利用等处理能力为核心)信息检索DY:信息检索包括信息储存和信息获取两个过程,信息的存储:根据信息的外表和内部特征,按照一定的组织编排,使之成为有序化信息集合的过程。
信息的获取:根据特定的需要,运用组织好的检索系统和工具,将特定信息找出来的过程。
信息检索的类型:文献检索事实检索数据检索信息检索原理:是通过对大量分散无序的文献信息进行收集,加工,组织,存储,建立各种各样的检索系统。
并通过一定量的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效的获取和利用信息源。
信息检索基础知识介绍

原始文献 加工整理
提 问
数据库 存 储
检 索
输 出
检 索
三、信息检索的类型
(一)按检索对象和目的划分 1、数据检索
LOGO
是以数据为检索对象,检索的结果是经过测试、
评价过的各种数据、可直接用于分析和研究。
2、事实检索
是以具体事项为检索对象,检索结果是有关 某一事物的具体答案。
3、书目检索
以标题、作者、来源出处、专利号等为检索对象,
主题词语义参照系统
汉语拼音 Zà o shēng gān răo 符 英文 参照项 含义 噪声干扰 简称 英文全称 [56MB] 范畴分类号 正式主题词 号 简称 Zábō gān răo 汉语拼音 Noise jamming 英译名 用项 同义词(正 用 Y USE Use D 杂波干扰 Dià n zĭ duì kà ng 非正式款目主题词 杂波干扰 [56MB] 范畴分类号 式主题词 ) 瞄准式干扰 电子对抗* F · 通信对抗 代项 同义词 (非扫频干扰 代 Noise D jamming UF Used For 参 英译名 · · 通信干扰 关 阻塞式干扰 照 正式主题词 ) · · · 脉冲干扰 系 S 通信干扰 Y 噪声干扰 符 参照符号 关系词 · · · 欺骗性干扰 分项 狭义词 分 F NT Narrower Term 词 号 有源干扰 · · · 载波干扰 · · · 噪声干扰 属项 广义词 Z 电子对抗 属* S BT Broader Term · · · · 扫频干扰 C 连续波干扰 · · · · 阻塞式干扰 族项 族首词 族 Z TT Top Term 脉冲干扰 · · 通信抗干扰 调制干扰 参项 相关词 参 C RT Related Term
INFORMATION RETRIEVAL
信息检索基础必备知识点

1、信息检索的定义:是指将信息按一定的方式组织和存储起来,并根据信息用户的需求找出相关的信息的过程和技术。
信息检索的作用:a:节省查找文献的时间。
b:有利于文献专题查找。
c:克服语言障碍。
2、信息:所有事物的存在方式和运动状态以及关于所有事物的存在方式和运动状态的陈述。
信息的特征:普遍性、客观性、抽象性、依附性、可加工性、传递性、共享性。
信息的作用:(1)信息是人类社会生存的条件,信息是人类社会发展的资源(2)信息是主客体的中介,信息是思维的材料(3)信息是组织的保证,信息的管理的基础(4)信息是决策的依据,信息是控制灵魂文献的特点:(1)数量急剧增长(2)内容交叉重复(3)专业文献出版分散(4)文献老化加快(5)文献语种繁多(6)文献载体形态增加文献类型:(一)按照载体的形式不同,文献可分为:1、印刷型2、缩微型3、声像型4、电子型(二)按照内容、性质和加工深度的不同,文献可分为:1、一次文献2、二次文献3、三次文献4、零次文献(三)根据性质、特点和出版形式的不同,文献可分为:1、科技图书2、科技期刊3、科技报告4、政府出版物5、会议文献6、专利文献7、学位论文8、标准文献9、科技档案10、产品样本a、主题语言主题检索语言是用语词来表达文献主题概念,它不管各语词之间相互关系如何,一律按字顺排列成主题词表,故称主题检索语言。
分为标题词语言、关键词语言和叙词型语言三种。
○2关键词语言:由于关键词语言能适应使用计算机的需要,因而大大加速了文献标引过程,缩短了检索工具出版的时间,便于用来检索最新文献,大大增加了检索点,使用灵活方便。
查准率和查全率较低。
○3叙词型语言:用途较广,既适合于手工检索,又适合计算机检索语言。
6、信息检索的途径:书名途径,著者途径,序号途径,分类途径,主题途径。
7、信息检索方法:(一)常用法所谓常用法,顾名思义是检索中最为常用的方法,指利用成套的检索工具检索文献信息的方法,也称之为工具法。
第1章 信息检索的基础知识.ppt

申请专利三个条件:新颖性、创造性和实用性 中国专利类型:发明专利、实用新型专利、外观设计专利
网络资源 信息检索
专利类型
发明专利:具有较高水平的发明,是在某个领域 内具有独创性的发明
实用新型专利:对机器、设备、装置、用具的形 状、构造及其结合所提出的实用的新的技术方案
外观设计专利:指对产品的形状、图案、色彩或 它们的结合作出富有美感而适用工业上应用的新 设计
信号
理解接受
信息
网络资源 信息检索
信息特征
一、概念---信息
预先性(如天气预报,必须是提前的,落后则失效) 实用性 时效性 可传递性
网络资源 信息检索
一、概念---文献
大凡人类的知识用文字、图形、符号、声频、视 频的手段记录下来的东西,统统可称为文献。也 可以称为固化在一定载体上的知识。
对象不同
二次信息以“ 篇” 或“ 本” 为单位进行加工, 三次信息则归纳了较多的一次信息内容
• 用途不同
二次信息为检索一次信息的工具;
三次信息能直接提供检索答案.
• 学习网检课的目的:如何通过二次信息去查找一次
信息
网络资源 信息检索
二、信息的类型及特点
3.按信息载体的物理类型划分P7
印刷型 缩微型 电子型 声像型文献(视听型文献)
网络资源 信息检索
四、文献检索
2、文献检索的类型
直接检索
是从通过阅读原始文献直接获取所需信息
快捷、方便 漏查率高
间接检索
是通过检索工具的指导再查找原始文献 而获取所需信息。
系统、全面
滞后
网络资源 信息检索
定义 条件 类型
五、文献的检索工具
信息检索知识点范文

信息检索知识点范文信息检索是指从大量的信息中找到与用户需求相关的信息的过程。
以下是信息检索的一些重要知识点:一、信息需求分析:1.了解用户需求:包括明确用户的信息需求,了解用户的背景和需求的具体要求。
2.制定信息策略:确定的关键词、限定范围、排除冗余和无关信息的策略。
二、信息源:1.内部信息源:组织内部的数据库、档案等。
2.外部信息源:包括互联网上的网页、文档、图片等。
三、信息检索模型:1.自动索引:使用关键词或主题对文档进行描述和索引,并建立索引词表,方便用户检索。
2.布尔模型:将检索式表示为逻辑表达式,利用逻辑运算符对检索词进行组合,实现精确的文档检索。
3.向量空间模型:通过计算文档和查询的向量空间相似度,将文档按相关性排序。
4.概率检索模型:通过统计分析文档和查询的概率模型,计算文档的相关性概率。
5.链接分析模型:根据页面之间的链接关系和链接的权重等信息来评估页面的相关性。
四、检索评价:1.检索精度:通过计算检索结果的相关文档和非相关文档的比例,来评估信息检索系统的精确性。
2.检索效率:评估信息检索系统执行查询的速度和资源消耗程度。
3.检索一致性:评估系统在连续多次查询时的稳定性和一致性。
五、信息检索技术:1.关键词:通过输入关键词进行检索,系统会返回与关键词相关的文档。
2.高级:包括利用限定符进行、布尔逻辑、通配符等。
3.相关性反馈:根据用户的反馈信息,调整检索结果的排序,提高检索的准确性。
4.语义分析:通过对查询语句和文档的语义进行分析,找到语义上的相关性。
5.分布式检索:将索引和查询分发到多个节点上进行检索,提高速度和可靠性。
六、信息检索系统的应用:1. 网络引擎:例如Google、百度等,为用户提供互联网上的信息服务。
2. 文献检索系统:用于科研人员查找相关文献,例如PubMed、IEEE Xplore等。
3.图像检索系统:通过图像的内容特征进行检索,例如相似图片、人脸识别等。
4.音乐、视频检索系统:通过音乐或视频的特征进行检索,例如识别歌曲、相似视频等。
信息检索知识点

计算机检索1.信息素养信息素质、信息能力:作为具有ILinformation literacy能力的人;必须能够充分地认识到何时需要信息;并有能力去有效地发现、检索、评价和利用所需要的信息;从而具有终身学习的能力;总能够为任何任务和决策找到所需信息..2.信息检索广义:指将信息按照一定的方式组织和存储起来;并根据信息用户的需要找出有关信息的过程和技术..包括存储和检索两个过程..狭义:从信息集合中找出所需信息的过程..信息查找Information Search;Information Seeking2.1信息现状分析1信息爆炸导致文献量急剧增加;内容相互渗透;语种增多;文献分布异常分散;文献寿命愈来愈段;2由于条件限制;人们吸收和利用信息的能力并未得到相应的提高.. 3.检索的作用1促进智力资源的开发;2协助管理者做出正确的决策;3帮助科研人员借鉴前人的研究成果;避免重复劳动;4信息检索是知识更新的手段..4.数据库类型1:作为图书馆数字资源的数据库特指为科学、教学、学习所需各种参考资料的集合;以数据库的形式管理和利用..自建数据库:馆藏目录OPAC;本校学位论文数据库..商业性数据库:数据库商、出版商和其他机构以商业化方式提供的各种电子资源;图书馆需要支付一定的费用购买数据库的使用权再提供给一定的读者群..免费数据库:开放获取资源、机构典藏和其他免费的网络资源..5.数据库类型2从收录文献的内容分;有综合性数据库和专业性数据库之分;从收录文献的类型分;有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、标准数据库等;从提供文献的形式分;有全文数据库、文摘数据库、引文数据库;各数据库举例:专业数据库:Petroleum AbstractPA、EnCSciFinder SchoiarCA综合性数据库:读秀、Scopus、EI、SCI特定文献类型;如图书、期刊、学位论文等:超星、EIsevier ScienceDirect、PQDT全文数据库:CNKI、维普、SPE摘要性数据库:EI、PA引文数据库:Web of Science、CSSCI中文社会科学引文索引6.Science Citation Index ExpandedSCI-E是个什么样的数据库它是ISI检索平台中Web of Science核心合集中的一个子库它是一个摘要型数据库它是一个引文数据库它是一个期刊数据库它收录的学科范围包括科学、技术的各学科7.查文献应该如何选择数据库学科专业:有专业型数据库时;首选专业型数据库;数据量:选择数据量大的;文献类型:根据研究的需要..如果仅需要某种文献;最好选择该类型的子库;检索功能:准确性高、易用、检索结果的处理能力;分析功能第三章信息资源的分类8.信息存贮载体:印刷型、缩微型、声像型、机读型9.根据加工程度划分零次文献:口头信息、未公开发表的文字资料手稿、书信、笔记等;时效性强;大量而无序;一次文献:期刊论文、专利文献、科技报告、会议录等;研究人员最终索取的文献;二次文献:检索工具:如SCI、EI、CA、PubMed/Medline三次文献:选用大量有关的文章;经过综合、分析、研究而编写出来的文献;如:综述、评论、评述、进展、动态等;研究人员最终需要的文献..科研人员与科学信息的获取和利用:研究人员的文献平台可以由二次文献作为入口;满足整体的需求;然后;通过这个入口来获取有用的高质量的全文期刊一、三次文献来满足纵深对的研究需要..10.根据文献编辑出版的特征和范围划分11科技图书BooksMonograph;Anthology;Textbook;Reference book:内容系统成熟可靠;新颖性较差;学习;教育之用..2科技期刊 Periodical Journal;magazine;serial:数量大;覆盖面广;内容新颖;及时;交流;影响广泛;信息价值高..3报纸Newspaper:出版周期更短;获取实事性、政策性信息..4政府出版物Government Publications:源自官方、权威、可靠、价廉;可获取政策性、法规性及科技信息..5科技报告Sci/Tech Report:反映前沿科技、内容新颖、有密级控制..如:美国政府四大科技报告:PB;AD;NASA;DOE报告..6专利文献Patent Document;Patentspecification/bulletin/aids:类型有:专利说明书、专利公报、专利分类表、专利文摘等检索工具..反映新的技术发明;是重要的技术、经济信息源..7会议文献Conference paper;Proceedings:会议论文集;回忆录;会议资料等;反映最新成果;最新动向;高水平;前沿发展动态..8学位论文Dissertations\Thesis;内容专深;非卖品;有较高学术参考价值..9标准文献Standards:反映成熟技术;掌握技术政策;技术水平;可供研究新产品;改造老产品;改进工艺和操作水平是借鉴..10产品资料:形象、直观、新颖、可了解工业水平、产品发展、市场动态等..11广告Advertisement:可及时把握竞争对手最新推出的产品品种;市场卖点..准确掌握个地区市场的广告竞争态势..12技术档案和图纸:技术性;适用性;保密性..11.检索语言:根据检索需求而编制的检索系统存储与检索共同使用的人工约定语言..分类:体系分类语言、标题词语言、关键词语言、叙词语言.. 12.检索途径:又称检索点;指利用信息的各种内外特征;作为检索出发点;从不同角度来检索信息..有:分类Classified:所属学科分类主题Subject:所属主题内容、关键词着者Author:团体着者Corporate Author名称;题目Title代码Code13.基本运算符1逻辑算符“与”:and 或例:telecommut and productiv逻辑算符“或”:or 或 +例:computer or microcomputer逻辑算符“非”:not 或—例:aspartame not beverage14.基本运算符2:截词符用于解决一些词干相同、词义相近、但词尾或词头不一致的派生词如有同一词根派生出的名词、动名词、动词、形容词、副词等;或名词的单、复数形式;或痛一次的英美不同拼写形式等词的一次输入..PQD平台的截词符用、和$表示..截词符 Nurse —nursed/nurses ad—added/adult/adopt用于替换某个字词中间或结尾的任何一个字符;不能代表没有字符..截词符 control—control/controlled/controlling 代替0-10个字符截词符$ $5beat—Upbeat/offbeat/heartbeat 限定截词符用$n表示;代替0-n个字符..15.基本运算符3:位置算符P/n、N/n用于限定词与词之间的位置关系;以提高查准率..当检索词为词组形式时;或两个检索词之间可能被禁用词或标点符号隔开时;均应使用位置算符..P/0 两个单词中间有一个空格或一个字符;在文献中出现的前后位置不能互换..Polar P/0 embedded可检索到:polar-embedded或polar embedded P/1 两个单词中间可能有0-1个单词;在文献中出现的前后位置不能互换..位置算符P/n与位置算符N/n的用法近似;区别在于前后单词是可以互换的..16.PQD检索词自动匹配在PQD中检索时;系统会自动匹配单词的单复数;英美拼写变体;形容词比较级最高级等形式..17.短语检索:“”双引号检索短语在PQD中可把短语放在引号内进行精确短语检索;但这种检索方式不能自动匹配..在PQD中;空格默认为逻辑算符and..18.字段检索格式:字段名检索词或检索式AUsmithand TIfood:检索标题含有food;作者含有smith的文章..多个字段检索时;字段与字段之间用逗号隔开AB;TIfood:检索标题含有food或者摘要含有food的文档..PQD中;检索式常用限制字段为TI;AB;SU;IF..PQD中的主题词SU字段是系统标引的独立字段..19.检索策略:指为实现检索目标而制定的检索计划和方案..检索式是检索策略的具体体现;是指计算机检索中用来表达用户检索提问的逻辑表达式;通常由检索词和各种逻辑算符、截词符、位置算符以及系统规定的其他连接符号等构成..20.检索的基本步骤1分析检索课题;明确检索要求;确定检索的主题内容、范围等2确定检索概念3选择表达概念的检索词选择所有不同的能够表达检索概念的词使用截词检索各种词尾变化的词使用位置算符指定词组或词间的相对位置关系4)使用逻辑算符组配检索概念;拟定检索表达式5)选择恰当的数据库6)上机检索21.获取全文的方法全文链接按钮、全文数据库、馆际互借、图书馆文献传递、免费全文网站、提供免费全文的期刊;作者E-mail联系或作者主页..22.检索策略的优化方法1扩大命中文献量的方法1选择其他同义词、相关词、上位词2去掉一个不太重要的检索信息3将限制严谨的位置算符改为较宽松的位置算符;或通过and算符代替位置算符4取消某些限制过严的后缀符、限制符等5增加检索途径;将主题途径与非主题途径结合起来使用 6利用截词技术;检索所有相同词干的词7用E指令扩词以核实拼写8选择其他数据库进行检索23.检索策略的优化方法2缩小命中文献量的方法1提高检索式的专指度;增加或换用下位词和专指度较强的词2增加一个检索概念3将检索式中的and算符改为位置算符;或将较宽松的位置算符改为更严谨的位置算符4使用后缀限制;将检索词限制在基本索引的“重要”字段中;如规范词字段或题目字段5用辅助索引的某些字段与主题索引组结合限制检索范围6截词使用不当24.三大检索系统概况SCIScience Citation IndexSCI-EScience Citation Index Expanded科学引文索引SSCISocial Science Citation Index社会科学引文索引A & HCIArts & Humanities Citation Index艺术与人文引文索引CPCIConference Proceedings Citation IndexCPCI-SConference Proceedings Citation Index-Science科学会议CPCI-SSHConference Proceedings Citation Index-Social Science Citation Index社会科学与人文艺术会议EIThe Engineering Index工程索引25.三大检索系统收录质量区别SCI最能反映基础学科研究水平和论文质量检索系统收录的科技期刊比较全面集中各学科高质量优秀论文的精粹成为世界科技密切注视的中心和焦点CPCI、EI这两个检索系统评定科技论文和科技期刊的质量标准相对要宽松CPCI是一种综合性的科技会议文献检索刊物;该检索工具收录包括自然科学、技术科学以及历史与哲学等;覆盖的学科范围广;收录会议文献齐全;而且检索途径多;出版速度快..易成为了检索全世界正式出版的会议文献的主要的和权威的工具..26.临近算符NEAR/x :NEAR代表所链接的两个词之间的词语数量小于等于N;默认的使用Near的缺省值是15..SAME:要求两个检索词是在一个检索字段中..Yale SAME hosp27.利用WOS强大的分析功能Web of Science数据库中可以对检索结果按照以下方式进行研究:按照作者分析:了解某个研究的核心研究人员是谁;按照国际和地区分析:了解核心研究国是哪里;按照文件类型分析:了解该研究通常以什么途径发表;按照机构名称分析:了解有哪些机构在从事这项研究;按照语种分析:了解该研究是以什么语种发表的;按照出版年分析:了解该研究的发展趋势;按照期刊标题分析:了解该研究通常发表在哪些期刊上;按照学科分类分析:了解该研究设计了哪些研究领域..28.检索方式选择EI Compendex Web的主要检索方式有三种:快速检索Quick Search——系统默认界面专家检索Expert Search词表检索Thesaurus Search此外;还有浏览检索Browse Indexes等其它辅助检索工具..29.检索表达式的构造逻辑运算符AND;OR;NOT:逻辑运算符的运算优先级别相同;自左向右..字段限制符wn 字段码:window wn TI AND sapphire wn TI短语检索“检索短语”或者 {检索短语}截词运算符词根检索$:$management 可查 manage;managed;manager; Managers;managing等..30.浏览索引浏览索引可帮助用户选择合适的检索词;在快速检索和专家检索中都提供浏览索引功能;在快速检索中有作者、作者单位、刊名、出版社和Ei受控次的浏览索引;在专家检索中还增加了论文类型、文献类型和语言的浏览索引..由于Ei Compendex 以不同的格式引用作者的姓名;所以特别建议用户在检索时使用作者浏览索引..31.结果浏览可以在结果浏览中浏览命中记录的文摘信息Abstract—系统默认格式和详细信息Detailed Record可以改变记录的排列顺序可以获取记录的全文和链接图书馆馆藏可以进行组合检索可以回顾检索历史、保存检索策略、保存检索结果、通过E-mail发送最新文献的点子通告等32.小结Ei Conpendex使用的平台是Engineering Village;uong检索收录或文献时;注意选库..Ei用于检索工程领域的二次文献..检索方法有快速检索、专家检索和词表检索;建议初学者采用快速检索的方法..注意采用该数据库特有的浏览器索引功能;可使检索结果更准、更全..33.专利类型发明专利:是指对产品、方法或其改进所提出的新的技术方案..实用新型专利:是指对产品的形状、构造或其结合多提出的适于使用的新技术方案..外观设计专利:是指对产品的形状、团或者其结合以及色彩与形状、图案的结合所做出的富有美感并适于工业应用的新设计..34.专利的特点专有性:是指专利权人对其发明创造所享有的独占的制造、使用、销售和进口的权利..地域性:一个人/国家依照其本国专利法授予的专利;在该国法律管辖的范围内有效;对其他国家没有任何约束力;外国对其专利权不承担保护义务..时效性:对于专利的保护期限;各国的规定不尽相同..我国专利法规定:发明专利、实用新型专利以及外观设计专利的保护期限自申请日起分别为20年、10年、10年..。
信息检索知识点

信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
8.什么是计算机信息检索?所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。
《信息检索》知识要点

《信息检索》知识要点1、文献是记录有知识的一切载体。
2、信息与材料、能源一起成为人数社会发展的三大支柱。
3、查找奇特事物,我们可以采用百科全书,也可以利用综合性手册。
4、广义的信息检索包括信息的存储与检索两过程。
5、搜索引擎一般提供两种检索方式:分类检索和关键词检索。
6、文献的属性有:知识性、实体性、记录性、发展性。
7、按信息检索的内容划分,可以将信息检索划分为数据检索、事实检索、文献检索类型。
8、信息检索的发展,经历了以下哪些阶段手工信息检索阶段、计算机信息检索阶段、机械信息检索阶段。
9、网络信息检索时,用AND、OR、NOT算符构造检索表达式进行检索的方法是布尔逻辑检索。
10、信息检索的基本原理就是要将查找的信息转换为检索系统能够识别的检索提问标识,然后通过与检索系统中的信息存储标识进行匹配比对,凡是双方标识一致的,就将具有这些标识的信息按要求从检索系统中输出。
11、评价一个网站的信息质量主要应从以下哪几方面考虑权威性、准确性、客观性、适时性。
12、信息检索工具是指用以报道、存储、查找信息线索的工具。
13、我校图书馆OPAC查询系统的主要查询功能有:馆藏查询、分类查询和读者查询。
14、如要查找书、刊等出版物的收藏地点,应选择的检索系统类型为馆藏目录、联机公共目录(OPAC)、联合目录。
15、评价网站提供的信息质量,可以不考虑的因素是合不合自己的意愿。
16、二次检索指的是在上一次检索的结果集上进行的检索。
17、利用词的某些部分进行非精确匹配检索,如acid*,这种形式叫截词检索。
18、专利的特点包括专有性、时间性和地域性,其中我国专利法关于时间性的规定中,发明类专利的保护期限一般为20年。
19、文献检索工具是通过著录文献的特征,依据一定的规律组织排列,使文献由无序变为有序。
20、评价一本工具书,一般来说最主要的是易用性、适时性、客观性。
21、追溯法是利用原始文献所附的参考文献进行追溯查找文献信息的方法。
信息检索基本知识

叙词
•叙词是主题语言的高级形式。是以较正规和正式的 科学名称为基础组织而成一种主题法检索标识系统。 •由在概念上不可再分的基本概念单元词汇组成,检 索时可以利用这些单元词进行组配,以表达一个复杂 的概念。
•如课题: 太阳能热水器研究 汉语主题词表中正式主题词是太阳能利用、太阳 能加热等代替。
标题词
中国图书馆图书分类法
• 简称《中图法》,由中国图书馆图书分类法编辑委 员会编。1975年科学技术文献出版社出版第一版。 • 使用字母与数字相结合的混合号码,基本采用层累 制编号法。 • 《中图法》主要供大型图书馆图书分类使用。另外 为适应不同图书信息机构及不同类型文献分类的需 要,它还有几个配套版本:《中国图书资料分类 法》、《中国图书馆图书分类法(简本)》和 《〈中国图书馆图书分类法〉期刊分类表》等。 • 自1988年起,中国出版图书的标准书号中采用《中 图法》的大类号。
关规定和格式撰写的,能完整而真实地反映其所从事科 研活动的技术内容和经验的特种文献。具有内容翔实、 具体完整,技术含量高,实用意义大,便于交流,时效 性好等特点。做好科技报告工作可以提高科研起点,大 量减少科研工作的重复劳动,节省科研投入,加速科学 技术转化为生产力。
•会议文献:指学术会议文献。
•学位论文:是高校研究生、毕业生为获得学位进行 科学研究而写出的学术性论文中,常含有独创性的学 术性文献资料。 •专利文献:专利是与产业活动密切相关的,实用性 非常强。根据专利的技术水平和应用情况,其类型有 invention(发明)、utility patent(实用新型)、和 design patent(外观设计)等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)着者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
8.什么是计算机信息检索所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。
实质上计算机信息系检索是利用计算机信息检索系统存储和查找信息的技术,是计算机硬件资源、系统软件、检索软件和数据库的综合。
9.计算机信息检索的类型:(1)根据检索系统的工作方式,可分为:a).脱机信息检索脱机信息检索是利用单台计算机的输入装置进行检索的系统,用磁带作为存储介质,并且为连续的顺序检索方式,适合大批量的定题信息检索。
b).联机信息检索联机信息检索是利用计算机终端设备,通过通信线路或网络,与世界上的信息检索系统相连,从信息检索系统的数据库中进行检索并获取信息的过程。
联机检索模式是主从式,即为所有的工作都在主机上进行,主机负担重,一旦主机瘫痪,整个系统都将处于瘫痪状态,因此对主机的性能要求极高。
c).光盘信息检索d).网络信息检索(2)根据信息的服务方式,可分为:a).定题检索定题检索是用户根据课题的要求,事先编写出逻辑检索提问式,并将存储在计算机的存储器中,每次系统加入新的信息,系统便会按检索要求,找出用户所需的资料,并把结果分给用户,用户能及时得到最新的文献信息。
具有定期性、新颖性和批处理性的特点。
b).回溯检索回溯检索是追溯查找过去的信息,让用户一次检索一段时间内与某一课题有关的信息。
也可以查找最新的信息,可以适应多数用户的查询需要。
c).日常检索10.计算机信息检索技术初级检索6个1)布尔逻辑检索2)位置限制检索3)短语检索4)截词检索5)字段限制检索6)区分大小写检索11.计算机信息检索技术高级检索6个1)加权检索2)自然语言检索3)相关信息反馈(相似检索)4)概念检索5)模糊检索6)聚类检索布尔逻辑检索(1)逻辑与用AND或*表示检索式写作A AND B或A *B(2)逻辑或用“OR”或“+”表示(3)逻辑非用NOT 或—表示 A NOT B (A当中除去B所剩下的)字段名称及缩写AB abstract TI title AU author JN journal nameLA language PY publication year SP source publication分类和聚类的异同相同点:基于“类”的思想进行检索。
不同点:(1)分类基于分类法,其类目体系主要是先组式,有系统性的。
类目与文献之间具有相对独立性。
而聚类则先有文献后聚类,类的性质及整体类目体系完全由系统中的文献决定。
(2)从类目形成过程看,分类是总到分,聚类由分到总。
会构建检索式(主要是积木型)12.计算机信息检索策略含义狭义的计算机信息检索策略是指检索提问式的构建,即运用系统特定的检索技术,确定检索词之间的逻辑关系,形成表达用户信息需求的检索提问式。
广义的计算机信息检索策略是指在分析检索课题的实质内容和明确检索目标的基础上,选择检索工具,确定检索途径与检索用词,以及检索词之间逻辑关系与查找步骤最佳方案的一系列科学安排。
13.计算机信息检索策略类型(即联机检索五原则)(1)最专指面优先:从最专指的概念入手(2)最低登录量面优先(3)积木型(重点掌握,会构建此检索式)(4)引文珠型增长(5)逐次分馏14.网络信息资源的评价方法:(1)定性评价法:是指按照一定的评价标准从主观角度对网络信息资源所做的优选和评估,主要有指标体系法和调查表法。
(2)定量评价法:国内外比较典型的定量评价方法有信息计量法、层次分析法和对应分析法等三种。
(3)综合评价法:是定性评价和定量评价相结合的一种方法,有包括分析法、模糊综合评价法等。
(4)分类方法:分为第三方评价法、用户评价法和网络计量法。
15.搜索引擎的类型:(1)按检索机制划分:检索型、目录型和混合型检索工具(2)按检索内容划分:综合型、专题型和特殊型检索工具(3)按包含检索工具数量划分:单独型和集合型检索工具(4)按检索资料类型分:万维网检索工具和非万维网检索工具16.元搜索引擎的含义所谓元搜索引擎,是对分布于网络的多种检索工具的全局控制机制,它通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作。
17.元搜索引擎的特点:(1)虚拟索引数据库(2)查全率高(3)用户界面友好 (4)适宜二次加工 (5)扩展性好18.元搜索引擎的工作原理19.实现跨语言信息检索的方法:(1)提问式翻译方法(2)文献翻译方法(唯一结果是源语言描述)(3)提问式—文献翻译方法(将查询语言提问式翻译成目标语言提问式,与目标语言描述的信息库进行匹配,检索相关信息,然后再把检索结果的全部或部分内容翻译成查询语言描述的信息。
检索结果一般选择部分翻译,这样工作量较小,容易提高翻译的效率和质量,部分翻译一般是对结果文本的前两行、文摘或文本中重要的词进行翻译,在重要词的翻译中,如何确定重要词是决定这种方法效果的关键。
(4)中间语种翻译方法(5)非翻译方法20.语义网的应用(2)智能信息检索(3)基于语义的网页搜索引擎(4)企业数据管理收录论文的两个层次(1)Compendex数据。
数据的内容全面,主要包括:论文标题;作者;作者单位;英文文摘;论文所在期刊名称;卷,期;论文页码;分类码;主题词等等。
其中:分类码;主题词需要专业人员单独给出。
(2)Page One数据:数据内容主要包括:论文标题;作者;作者单位;论文所在期刊名称;卷,期;论文页码;少数数据带有英文文摘。
不需要任何专业人员再做工作。
数据和Page One数据的主要区别在于:数据中是否有分类码和主题词;有这两项内容的数据是Compendex数据,反之是Page One数据。
有没有主题词和分类号是判断论文是否被Compendex数据正式收录的唯一标志。
23.主题指南按字母顺序列出与分类表中类目名称相关的主题词,并注明相关的分类号,实际上是分类表的主题索引,是从分类途径检索文献的指南。
便于不能确定分类号的读者实现从主题查到分类号,再由分类号查到文献所在页码。
(科学引文索引)的编制结构及检索方法(2)来源索引(3)机构索引(4)轮排主题索引25.如何决定收录期刊的数量和种类(1)“加菲尔德文献集中定律”——确定适宜的期刊数量该定律认为:在几万种科技期刊中,最重要的期刊(即核心期刊)不过一千种,甚至可能还不足500。
因而,把收录期刊的范围定在3000种以内,足以把重要的科技文献包括在内。
(2)“费用—效果原则”——用来选择每一种期刊,具体方法是“引用频率统计法”先计算一种期刊在一年内被引用的总次数,再计算其中每篇论文的平均引文章,其他因素对引文章的影响通过加某些修正系数来解决,引用频率越高,说明该刊质量越高。
通过上述两个指标决定了收录期刊的数量和种类26.什么是专利这种受法律保护的发明就称专利。
含义:专利权——法律受专利法保护的发明创造——专利技术专利说明书等专利文献——文献这三层含义的核心是受专利法保护的发明,而专利权和专利文献是专利的具体表现。
27.什么是同族专利同族专利指同一个发明为了在不同国家得到保护,而在这些国家分别申请的一系列内容相同或基本相同的专利。
由于同族专利或相同专利都具有相同的优先权项,所以通过优先权项可以方便、快捷地检索出有关同一发明的全部相同专利或同族专利。
28.专利的类型(1)发明专利(2)实用新型专利(3)外观设计专利(4)植物性专利(5)防卫性专利知识产权:工业产权和着作产权29.学位论文的文献价值:(1)较高价值的一次文献:写作不受篇幅限制,论述详尽:从研究背景、技术线路、实验方法到数据获取、分析结论论述翔实。
(2)珍贵的信息资源价值:能集中反映所在单位的科研领域、学术活动、研究进展和最新成果,论文的使用者可以跟踪名校导师的科研进程。
(3)综述性二次文献:对相应研究领域有系统深入的讨论和综述,拥有详尽的参考文献,可得到课题研究现状综述。
(4)写作技巧的启发蓝本:通过对学位论文的阅读,可大致梳理出作者的写作思路和研究方法,学习学位论文的写作方法。
30.信息检索评价方法(1)测试文档集合法(2)人机交互(3)用户体验日志分析法(4)自然观察法31.召回率:R=(检索出的相关文献量/ 数据库中的全部相关文献)x100%准确率:P=(检索出的相关文献量/ 检出的文献总量)x100%32.平均准确率(并会计算)平均准确率是一个通过所有相关文献测定系统绩效的单值指标。
如果检索系统能快速返回所需的相关文献,并对被检文献进行等级排序,则该系统的性能较好。
平均准确率是求各个相关文献准确率的平均值。
因此平均准确率的计算只考虑相关文献的数量,而与检出文献的总量无关。