信息检索复习重要知识

合集下载

计算机复习信息检索

计算机复习信息检索

计算机复习信息检索信息检索是指通过计算机技术,根据用户的需求,在大规模的信息资源中准确、快速地找到相关的信息。

在当今信息爆炸的时代,信息检索的重要性不言而喻。

本文将介绍信息检索的基本概念、技术和应用,并附带答案和解析。

一、信息检索概述信息检索是指通过计算机对大规模信息资源进行全文检索、关键词检索等方式,根据用户需求提供相关信息的过程。

其目标是提高检索准确性和检索效率,帮助用户快速获取所需信息。

信息检索系统由信息资源、检索模型、检索方法和用户界面等组成。

其中,信息资源包括数据库、文档集合等;检索模型包括向量空间模型、布尔模型等;检索方法包括倒排索引、词频统计等;用户界面提供检索接口供用户输入查询词,并显示检索结果。

信息检索的基本流程包括:用户输入查询词->检索系统进行查询处理->检索系统返回相关文档。

二、信息检索技术1. 关键词检索关键词检索是最常见的信息检索方式,用户通过输入关键词,检索系统根据关键词在信息资源中进行匹配,并返回相关文档。

关键词检索常用的算法有向量空间模型、TF-IDF算法等。

全文检索是指对文档集合中的全部文本进行检索,而不仅仅是关键词。

全文检索主要通过分词、建立倒排索引等技术来实现。

用户输入的查询词可以是一个短语或一句话。

3. 自然语言查询自然语言查询是指用户使用自然语言进行查询,而不是像关键词查询那样只输入几个词。

自然语言查询需要将用户的自然语言转化为计算机可处理的查询语言,如SQL语句。

4. 语义检索语义检索是一种基于语义理解的检索方法,通过对查询词的语义进行分析,实现更精准、准确的检索。

语义检索常用的技术有词义消歧、词向量模型等。

三、信息检索应用1. 搜索引擎搜索引擎是信息检索的最常见应用之一,在互联网上广泛使用。

搜索引擎通过爬虫程序对互联网进行爬取,建立庞大的索引库,并通过用户输入的查询词返回相关页面。

2. 文献检索在学术界和科研领域,文献检索是非常重要的工作。

信息检索基础知识考点整理

信息检索基础知识考点整理

信息检索基础知识考点整理●2.1 信息检索的概念与原理●2.1.1 信息检索的概念(重要)●2.1.2 信息检索的原理●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出●信息检索的类型●1.文献检索●2.数据检索●3.事实检索●2.1.3 信息检索的意义/作用(重要)●1.信息检索是有效利用信息资源,实现其最大价值的科学方法●2.信息检索是再学习的工具,是获取知识的有效途径●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间●2.1.4 信息检索的历程●1.手工检索●2.计算机检索●2.2 信息检索系统(重要)●2.2.1 信息检索系统的概念●1.信息检索系统的含义●2.信息检索系统的工作原理●2.2.2 信息检索系统的构成●1.信息选择子系统●2.信息索引子系统●3.词表管理子系统●4.用户接口子系统●5.匹配子系统●2.2.3 信息检索系统的分类●1.手工检索系统●1.书本式的手工检索系统●2.卡片式的手工检索系统●2.计算机检索系统●1.硬件●2.软件●3.数据库●1.参考数据库●1.书目数据库●2.指南数据库●2.源数据库●1.数值数据库●2.文本—数值数据库●3.全文数据库●4.术语数据库●5.图像数据库●6.多媒体数据库●2.3 信息检索方法(重要)●1.直接浏览法●直接查找法●2.常用法●顺查●倒查●抽查●3.追溯法●4.综合法(分段查找法、循环法、交替法)●2.4 信息检索效果(重要)●2.4.1 信息检索效果评价●信息检索效果的概念●1.检索结果有效性评价●2.检索系统实用性的评价●3.检索费用—效率评价●信息检索效果评价对于信息检索系统的建设和发展的意义●信息检索效果评价的核心问题是建立一套切实可行的评价指标●1.查全率和查准率●2.误检率和漏检率●3.响应时间●其他与检索效果相关的指标●2.4.2影响信息检索效果的因素●1.标引的质量●2.检索途径的数量●3.检索策略的优劣●4.检索人员的素质。

信息检索复习资料(有答案版)

信息检索复习资料(有答案版)

1.请说明一次文献、二次文献和三次文献的特点和功用。

(1)一次文献(Primary Document):通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。

如期刊论文、科技报告、会议论文、专利说明书(2)二次文献(Secondary Document):是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。

二次文献的重要性在于可以帮助人们查找一次文献。

如目录、题录、文摘、索引、各种书目数据库(3)三次文献(Tertiary Document):是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。

包括综述研究和参考工具两类。

如综述、述评、词典、百科全书、年鉴、指南数据库、书目之书目2.请说明题录目录文摘的特点以及区别(1)题录是揭示和报导单篇文献外表特征的工具。

特点:以单篇文献为著录对象(2)目录是系统积累和提供图书、期刊和其它单行本的名称、收藏单位和索取号等外表特征的揭示和报导的工具。

特点:以单位出版物为著录对象,反映馆藏情况,主要揭示文献外部特征(3)文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。

特点:带摘要的题录3. 布拉德伏特文献文献分散定律和期刊影响因子的概念(1)布拉德福文献分散定律:本专业文献的1/3刊登在本专业核心期刊上,另外的2/3则分散在其他的相关期刊和边缘期刊上。

如果将科技期刊按其刊载某专业论文数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个领域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2......的关系。

(2)期刊影响因子的概念是:某一种期刊在第三年得到的前两年的引文数与该刊前两年的总论文数之比。

4. 请阐述信息、知识、情报的概念,并分析它们三者之间的关系。

信息检索知识点

信息检索知识点

信息检索知识点信息检索考点整理 1 、信息检索的概念广义的信息检索就是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储与检索两个过程; 而狭义的信息检索仅指有序化信息的检索查找。

2. 信息检索的原理就就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡就是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就就是初步命中检索所需的信息。

3 、为什么说信息存储与检索就是两个不可分割的有机体?检索的全过程包括存储与检索两个过程,存储与检索就是相辅相成、不可分割的。

存储过程主要就是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要就是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。

检索过程就是存储过程的逆过程。

因此,检索者只有在全面了解存储者就是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。

4 、信息检索的方法 (1)顺查法 (2)倒查法 (3)抽查法(4)追溯法 (5)循环法 5 、信息检索的途径 (1)内部特征途径a) 分类途径 b) 主题途径 (2)外部特征途径 a) 题名途径 b) 著者途径 c) 文献编号途径 d) 检索途径 e) 机构检索法 f) 引文检索途径 6 、布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2) 可操作性强,应用广泛;(3) 构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4) 能处理结构化提问。

缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7 、概率排序原则: 如果一个检索系统对用户的每个检索提问的反应就是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果就是最好的。

信息检索初步知识点总结

信息检索初步知识点总结

信息检索初步知识点总结信息检索是指利用计算机系统来检索和获取文档或者信息资源的技术和方法。

在当今信息爆炸的时代,信息检索具有非常重要的意义。

信息检索系统可以帮助人们快速准确地获取所需要的信息资源,不仅可以提高工作和学习效率,还可以帮助人们更好地利用信息资源。

在信息检索中,有一些基本的知识点是非常重要的,下面我将对这些知识点进行总结。

1. 信息检索的概念和发展历史信息检索是指从信息库中按照一定的要求来搜索、检索信息的过程。

它主要是利用计算机技术来实现信息的存储、检索和利用。

信息检索的发展可以追溯到20世纪50年代,随着计算机技术的发展,信息检索技术也得到了很大的发展。

现代信息检索系统不仅能够实现文档的存储和检索,还可以实现自然语言处理、信息抽取、信息过滤等功能。

2. 信息检索的基本过程信息检索的基本过程包括信息需求分析、文档表示和查询处理、检索模型和算法、评价和反馈等几个方面。

其中,信息需求分析是整个信息检索过程的第一步,它包括对用户的信息需求进行分析和建模,确定用户的检索目标和检索词,为后续的检索准备工作做好准备。

文档表示和查询处理是指对文档和查询进行适当的表示和处理,以便计算机系统能够理解和利用。

检索模型和算法是指根据文档和查询的表示,计算出相关度得分,以确定文档的相关性。

最后,评价和反馈是指对检索结果进行评价和反馈,以优化检索系统的性能。

3. 信息检索的技术手段信息检索的技术手段主要包括文本索引技术、全文搜索技术、信息抽取技术、信息推荐技术等几个方面。

其中,文本索引技术是指将文档中的关键词进行索引,以便计算机系统能够快速地定位到相关的文档。

全文搜索技术是指利用全文索引进行搜索,可以实现对文档中所有内容的搜索。

信息抽取技术是指从文档中抽取出有用的信息,以便为用户提供更精确的搜索结果。

信息推荐技术是指根据用户的行为和偏好,为用户推荐相关的信息资源。

4. 信息检索的评价指标信息检索的评价指标主要包括召回率、准确率、F值、MAP值等几个方面。

信息检索考试大一下知识点

信息检索考试大一下知识点

信息检索考试大一下知识点信息检索是指从大量的信息中快速找到满足特定需求的信息过程。

在大一下学期的信息检索考试中,通常会涉及以下几个知识点:一、信息检索基础概念1. 信息检索的定义和目的信息检索是指通过使用计算机技术,在海量信息中寻找到与用户需求相匹配的信息。

其目的是快速、准确地获取到用户所需的信息。

2. 检索模型和流程信息检索基于检索模型,常见的模型包括布尔模型、向量空间模型和概率模型。

检索流程一般包括问题建模、索引构建、查询处理和结果排序等步骤。

二、关键词检索1. 关键词的选择与组合在进行信息检索时,关键词的选择和组合非常重要。

关键词应该准确描述用户需求,并且能够尽可能覆盖相关领域的信息。

2. 布尔查询与逻辑运算符布尔查询是一种基础的检索方式,通过使用逻辑运算符(AND、OR、NOT)对关键词进行组合,从而获得符合用户需求的信息。

三、索引构建与检索技术1. 逆向索引逆向索引是一种常用的索引结构,它通过将文档中的每个单词与包含该单词的文档进行关联,实现了关键词到文档的快速定位。

2. 向量空间模型向量空间模型将文档和查询都表示为向量,在向量空间中进行计算,通过计算文档与查询之间的相似度来判断文档的相关性。

3. 布尔模型的实现与优化布尔模型的实现与优化涉及到倒排索引的构建与压缩、布尔运算的优化算法等方面的技术。

四、评价与改进1. 检索结果的评价对于检索系统的性能评价,一般使用准确率、召回率、F值等指标来衡量检索的有效性和完整性。

2. 改进方法与技术为了提升检索系统的性能,可以采用词干提取、查询扩展、排名算法优化等方式进行改进。

五、实际应用与发展趋势1. 商业搜索引擎与个性化推荐商业搜索引擎通过不断改进和优化信息检索技术,提供高效准确的搜索服务。

个性化推荐则基于用户的兴趣和行为,向用户推荐符合其需求的信息。

2. 大数据与信息检索随着大数据时代的到来,信息检索面临着处理海量数据的挑战。

如何有效地利用大数据技术来进行信息检索是当前的研究热点之一。

信息检索复习题以及重点

信息检索复习题以及重点

信息检索复习题1、信息检索的步骤包括:界定问题、选择信息源、制定检索策略并实施检索、评价信息、分析利用信息五个步骤。

2、文献中ISBN、ISSN分别是指:国际标准书号、国际标准刊号。

3、文献按出版形式划分为哪几种?简述之。

答:按出版类型划分:图书、期刊、特种文献:(科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品资料、技术档案)4、给出“基于云计算的煤矿安全监测预警系统研究”一文的关键词。

煤矿监测预警云计算数据挖掘5、给出3种常用搜索引擎名称,什么情况下应该使用百度快照?答:百度、Google、360、搜狗搜索到的结果无法打开或打开速度很慢的情况下,可以使用百度快照。

6、利用百度搜索一份技术开发合同,应该在搜索框输入(技术开发合同 filetype:doc 或技术开发合同 filetype:ppt )。

(提示:技术开发合同的格式:doc或pdf)。

百度以“filetype:”来限制,后面是文档格式。

文档可以是pdf、doc、xls、ppt等。

首选gov(政府)、edu(教育)、org(非盈利性机构)、ac(学术类)网站;次选com(商业) net(网络)等7、CNKI中国知网主要收录哪些类型的全文学术文献?期刊文献,报纸,会议文献,国外学术文献,工具书,年鉴,专利,成果,标准文献,博士学位论文,硕士学位论文8、查找中文全文图书和期刊文献分别有哪几个数据库?中文全文数据库:CNKI中国知网.维普期刊资源整合服务平台.万方数据知识服务平台,读秀学术搜索9、学位论文有哪些特点?简述之。

4)学位论文(dissertation,thesis)指高等院校和科研机构的毕业生在获取相应学位时,必须提交的论文。

外部特征:著者、论文题名、颁发学位的机构名称、学位等级、授予年份等。

其主要辨识特征是学位名称,特征词:Ph,D,MS等。

从内容上看,学位论文具有以下四个特点:学术性,科学性,创造性,规范性10、依据GB/T7714-2005,分别给出图书、期刊和学位论文的著录格式,并各举一例。

大一信息检索与利用考试知识点

大一信息检索与利用考试知识点

大一信息检索与利用考试知识点信息检索与利用是信息科学与技术专业的一门重要课程,旨在培养学生对信息资源进行系统化检索和有效利用的能力。

本文将介绍大一信息检索与利用考试的相关知识点,帮助同学们更好地复习和备考。

一、信息检索基础知识1. 信息检索的定义和基本原理信息检索是指从大量信息中查找和获取所需信息的过程。

其基本原理包括信息需求分析、信息储存与组织、信息检索模型、检索评价等。

2. 关键词的选择和搜索策略在信息检索过程中,关键词的选择和搜索策略起着至关重要的作用。

学生需了解如何选择合适的关键词,并掌握常用的搜索策略,如布尔逻辑检索、通配符检索和短语检索等。

二、信息资源与检索1. 图书馆资源的检索与利用学生需熟悉图书馆资源的分类和编目规则,掌握常用图书馆资源的检索方法,如OPAC检索和图书馆数据库检索等。

2. 学术搜索引擎的使用学生需要了解学术搜索引擎的特点和使用方法,如Google学术、谷歌学术和百度学术等。

掌握高效的检索技巧,如使用引号搜索、高级搜索和文献引用等。

三、文献检索与阅读1. 文献检索的方法和工具学生需了解文献检索的常用方法和工具,如在线数据库检索、文献溯源和文献导航等。

可以根据具体需求选择合适的检索途径。

2. 文献综述的撰写和细节要求学生需要了解文献综述的撰写规范和细节要求,包括引言、方法、结果和讨论等部分的写作技巧和注意事项。

四、信息利用与知识管理1. 信息评估和筛选学生需要学会评估信息质量,判断信息的可信度和适用性,并掌握信息筛选和整理的方法,提高信息利用的效果。

2. 知识管理的基本理论和方法学生需了解知识管理的基本理论和方法,掌握知识管理工具的使用。

熟悉知识流程的各个环节,并学会运用相应的工具进行知识管理。

五、信息检索与利用的伦理问题1. 信息隐私和数据保护学生需了解信息检索与利用过程中产生的隐私问题和数据保护的重要性。

遵守信息伦理规范,保护用户隐私和信息安全。

2. 信息获取和版权保护学生需要了解信息获取的合法途径和版权保护的相关法律法规,学习在信息检索与利用过程中正确引用他人作品的方法和原则。

信息检索基础必备知识点

信息检索基础必备知识点

1、信息检索的定义:是指将信息按一定的方式组织和存储起来,并根据信息用户的需求找出相关的信息的过程和技术。

信息检索的作用:a:节省查找文献的时间。

b:有利于文献专题查找。

c:克服语言障碍。

2、信息:所有事物的存在方式和运动状态以及关于所有事物的存在方式和运动状态的陈述。

信息的特征:普遍性、客观性、抽象性、依附性、可加工性、传递性、共享性。

信息的作用:(1)信息是人类社会生存的条件,信息是人类社会发展的资源(2)信息是主客体的中介,信息是思维的材料(3)信息是组织的保证,信息的管理的基础(4)信息是决策的依据,信息是控制灵魂文献的特点:(1)数量急剧增长(2)内容交叉重复(3)专业文献出版分散(4)文献老化加快(5)文献语种繁多(6)文献载体形态增加文献类型:(一)按照载体的形式不同,文献可分为:1、印刷型2、缩微型3、声像型4、电子型(二)按照内容、性质和加工深度的不同,文献可分为:1、一次文献2、二次文献3、三次文献4、零次文献(三)根据性质、特点和出版形式的不同,文献可分为:1、科技图书2、科技期刊3、科技报告4、政府出版物5、会议文献6、专利文献7、学位论文8、标准文献9、科技档案10、产品样本a、主题语言主题检索语言是用语词来表达文献主题概念,它不管各语词之间相互关系如何,一律按字顺排列成主题词表,故称主题检索语言。

分为标题词语言、关键词语言和叙词型语言三种。

○2关键词语言:由于关键词语言能适应使用计算机的需要,因而大大加速了文献标引过程,缩短了检索工具出版的时间,便于用来检索最新文献,大大增加了检索点,使用灵活方便。

查准率和查全率较低。

○3叙词型语言:用途较广,既适合于手工检索,又适合计算机检索语言。

6、信息检索的途径:书名途径,著者途径,序号途径,分类途径,主题途径。

7、信息检索方法:(一)常用法所谓常用法,顾名思义是检索中最为常用的方法,指利用成套的检索工具检索文献信息的方法,也称之为工具法。

信息检索(理工)复习重点

信息检索(理工)复习重点

第1章 信息检索概论
第1节:概论 一、信息检索的类型及特点 二、信息检索技术 三、检索相关知识 第2节:文献信息源
一. 信息检索的类型及特点
文献检索:
书目信息检索:相关性检索,提供线索
全文信息检索:直接查找原文
数据信息检索:查找数值型信息 事实信息检索:查找发生的事件
书目信息检索
检索对象:以标题、作者、来源出处、 摘要及收藏地点为检索对象的一类检索 称之为书目信息检索 特点:检索结果不直接解答用户提出的 技术问题,只提供有关线索。
思考题(续)
15. 已知作者姓名, 怎样查找其在三大检索系统中 的收录情况? 怎样在SCI中查引用?
16 . 怎样在JCR中查某种期刊的影响因子?影响 因子如何计算? 17. 期刊文献、专利文献的原文出处是什么?
18. 《中图法》分类号的构成?
19. 如何利用图书馆主页?怎样查馆藏图书和期 刊? 怎样操作图书续借和预约?
右截词
又称后端截词、前端一致。分为有限右截 词和无限右截词。是一种满足前方一致的 检索。
• 允许检索词尾部有若干变化形式
例如:检索式 book? computer*
例如:检索式:computer*
computer computering computerised computerized computerization
哪些数据库属于书目数据库
存储目录、题录、文摘等书目数据的
EI、SCI、全国期刊联合目录、
全文信息检索
以论文或专利说明书的全文为检索对象。 特点:检索结果是与课题相关的论文或 专利说明书的全文。 是在书目信息检索基础上更深层次的内 容检索。(如‘维普’从书目到全文一步 到位)
全文数据库有哪些

信息检索考试复习内容

信息检索考试复习内容

一、逻辑算符、检索式l布尔逻辑算符:and 、or、 not(含义)1.逻辑“与”(AND 或 *) 用于表达两个或两个以上检索词(关键词、主题词)之间的相交关系或限定关系运算。

逻辑与检索能增强检索的专指性,使检索范围缩小。

2.逻辑“或”(OR或 + )用于表达两个或两个以上检索词(关键词、主题词)之间的并列关系。

运算逻辑或检索扩大了检索范围,提高检索信息的查全率。

此算符适于连接有同义关系或相关关系的词。

3.逻辑“非”(NOT或-)用于表达两个或两个以上检索词(关键词、主题词)之间中排除不需要的检索词(关键词、主题词)运算,可以缩小检索范围,增强检索的准确性。

此运算适于排除那些含有某个指定检索词(关键词、主题词)的记录。

但如果使用不当,将会排除有用文献,从而导致漏检。

检索式举例:题目:第三方物流信息管理系统检索式:第三方*物流*信息*管理*系统(and)检索入口:题目或关键词l截词检索:是一种常用的检索技术,尤其是在西文文献的检索中,使用更为广泛。

截词检索方式可分为三种,即:后截断、前截断、中间截断。

按截断的字符的数量上看,又可分有限截断与无限截断两种。

通常用* 表示无限截词。

用?表示有限截词。

后截断:是最常用的一种检索技术,将截词放在一个字符串之后,以表示其后有限或无限个字符不影响之前的检索字符串的检索结果。

如biolog*,可检索biologcal biologist biology等词, physic ??,可检索 physical、physicst等词。

、前截词将截词符号置于一个字符串的前方以表示其之前有限或无限个字符不影响之后的检索字符串的检索结果如*physics,可检索 physics、astrophysics、biophysics、chemiphysics、geophysics 等词。

中截词又称“ 内嵌字符截断” 。

将检索字符置于一个检索词中间,而不影响前后字符串的检索结果。

如:organi?ation可检索 organization、organisation。

大一信息检索知识点总结

大一信息检索知识点总结

大一信息检索知识点总结信息检索是指通过计算机技术和各种检索方法,从大规模文献资源中快速、准确地获取用户所需信息的过程。

在大一学习信息管理与信息系统专业的过程中,我们需要了解一些关键的信息检索知识点。

本文将对大一信息检索的相关知识进行总结,帮助同学们更好地理解和掌握这一领域的基础知识。

一、信息检索的基本概念与原理(1)信息检索的定义:信息检索是指根据用户的需求,在文献、数据库和其他信息资源中寻找与之相符合的信息的过程。

(2)信息检索的基本原理:包括索引构建和检索处理两个阶段。

索引构建阶段将信息资源进行结构化整理,并建立相应的索引表;检索处理阶段通过用户提供的检索词,结合索引表,通过匹配算法找到与之相关的信息资源。

二、信息检索的关键技术(1)词项选择与权重计算:根据用户需求,选择合适的检索词,并使用权重计算方法为词项赋予合适的权重,提高检索效果。

(2)检索模型:包括布尔模型、向量空间模型和概率模型等不同的模型,用于描述检索系统中信息资源与用户需求之间的匹配关系。

(3)评价指标:用于评价检索系统的性能,常见的指标包括召回率、准确率以及F值等。

(4)查询扩展:通过对用户查询词进行扩展,提高检索系统的召回率和准确率。

三、信息检索的常用工具和技术(1)搜索引擎:如百度、谷歌等,通过互联网收集、分析并索引网页信息,为用户提供搜索服务。

(2)数据挖掘:通过对大规模数据进行模式识别和深入分析,挖掘其中有价值的信息,为决策提供支持。

(3)文献管理工具:如EndNote、NoteExpress等,用于管理、组织和检索学术文献。

(4)信息可视化技术:通过可视化手段,将海量的信息以直观的方式展示给用户,提高信息的理解和使用效率。

四、信息检索的应用领域(1)图书馆信息服务:包括文献检索、馆藏资源管理、读者咨询等。

(2)企业信息管理:包括企业知识管理、产品信息检索、竞争情报等。

(3)科学研究与学术交流:通过信息检索工具,快速获取相关领域的最新研究进展和学术成果。

信息检索知识点范文

信息检索知识点范文

信息检索知识点范文信息检索是指从大量的信息中找到与用户需求相关的信息的过程。

以下是信息检索的一些重要知识点:一、信息需求分析:1.了解用户需求:包括明确用户的信息需求,了解用户的背景和需求的具体要求。

2.制定信息策略:确定的关键词、限定范围、排除冗余和无关信息的策略。

二、信息源:1.内部信息源:组织内部的数据库、档案等。

2.外部信息源:包括互联网上的网页、文档、图片等。

三、信息检索模型:1.自动索引:使用关键词或主题对文档进行描述和索引,并建立索引词表,方便用户检索。

2.布尔模型:将检索式表示为逻辑表达式,利用逻辑运算符对检索词进行组合,实现精确的文档检索。

3.向量空间模型:通过计算文档和查询的向量空间相似度,将文档按相关性排序。

4.概率检索模型:通过统计分析文档和查询的概率模型,计算文档的相关性概率。

5.链接分析模型:根据页面之间的链接关系和链接的权重等信息来评估页面的相关性。

四、检索评价:1.检索精度:通过计算检索结果的相关文档和非相关文档的比例,来评估信息检索系统的精确性。

2.检索效率:评估信息检索系统执行查询的速度和资源消耗程度。

3.检索一致性:评估系统在连续多次查询时的稳定性和一致性。

五、信息检索技术:1.关键词:通过输入关键词进行检索,系统会返回与关键词相关的文档。

2.高级:包括利用限定符进行、布尔逻辑、通配符等。

3.相关性反馈:根据用户的反馈信息,调整检索结果的排序,提高检索的准确性。

4.语义分析:通过对查询语句和文档的语义进行分析,找到语义上的相关性。

5.分布式检索:将索引和查询分发到多个节点上进行检索,提高速度和可靠性。

六、信息检索系统的应用:1. 网络引擎:例如Google、百度等,为用户提供互联网上的信息服务。

2. 文献检索系统:用于科研人员查找相关文献,例如PubMed、IEEE Xplore等。

3.图像检索系统:通过图像的内容特征进行检索,例如相似图片、人脸识别等。

4.音乐、视频检索系统:通过音乐或视频的特征进行检索,例如识别歌曲、相似视频等。

信息检索复习课件

信息检索复习课件

信息检索(第二篇)天津理工大学信息检索教研中心第一章信息检索基本知识介绍信息检索的基本知识,主要是让大家了解一些文献、信息、检索等常识,初步建立起信息意识。

♦第一节信息的基本知识♦第二节检索的基本知识第一章信息检索基本知识第一节信息的基本知识这一节的中心内容包括:信息、知识、情报信息与文献科技文献种类及特点第一章信息检索基本知识三者的关系信息与知识、文献的关系•信息是知识的基础,知识是信息的核心。

•文献是传播知识与信息的主要手段和途径。

•知识、载体、记录是构成文献的三要素。

•文献是获取信息的重要来源;信息与情报的关系•情报包含于信息,是信息的一部分。

信息知识情报文献第一章信息检索基本知识科技文献种类及特点依出版类型划分•图书、连续出版物、特种文献(科技报告、会议论文、学位论文、专利文献、标准文献、政府出版物、档案、产品样本等)依文献内容加工深度划分•零次文献、一次文献、二次文献、三次文献依文献载体划分•印刷型、缩微型、电子型、声像型(作业10练习总结的一个方面)各种信息源的特点♦书:系统、全面(历史悠久,多用于学习参考)♦刊:动态、量大、内容新、影响广(研究价值高,利用率高)♦报告:新颖、专深、具体(情报价值高、获取成本高)♦会议录:专业、及时、可靠(与科技期刊相似,利用率仅次期刊)♦学位论文:独创性强、水平参差♦专利:新颖、具体、题材广(经济和技术价值不容忽视)♦标准:系统性、指令(指导)性、时效性(可关注阶段性技术底线)♦政府出版物:权威性♦(Internet:综合性、交互性、包容性、即时性)♦一次文献:原始文献,新颖、具体。

如期刊、专利等♦二次文献:工具文献,汇集性、检索性。

如目录、题录、索引等♦三次文献:综述性文献,参考性、可检索性。

如年鉴、手册等♦零次文献:未公开文献,原始、详尽、具体。

如手稿、记录等(所用的方法:比较与分类,归纳与演绎)第二节检索的基本知识这一节的中心内容包括:信息检索检索语言检索工具检索方法、途径和步骤信息检索♦按存储和检索的内容划分–文献检索(过程、方法和策略)–资料检索(数据、数值检索)–事实检索–多媒体检索♦按检索手段划分–手工检索–计算机检索检索工具♦检索工具的形式–按加工程度划分•目录、题录、索引、文摘–参考工具书•百科全书、年鉴、手册、名录、字典、词(辞)典–按收录范围划分•综合性检索工具、专业性检索工具、单一性检索工具♦检索工具的内容结构–编辑使用说明、正文部分、索引部分、附录部分(产品说明书、网站帮助等可以参考此内容结构)检索工具的特点♦目录:以单位出版物为著录对象,按“种”为单位记录与报道。

网络资源与信息检索(本科)讲课要点与考试重点

网络资源与信息检索(本科)讲课要点与考试重点

网络资源与信息检索(本科)讲课要点第一章信息检索的基础知识讲课要点:一、信息(一)基本概念(P1-2)1、信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。

2、文献:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。

也可以称为固化在一定载体上的知识。

3、资料:固化在一定的实物或载体上的知识。

4、信息的传递渠道(二)信息的类型及特点(P4-7)从不同的角度信息可以分为不同的类型1、加工层次(请注意这三者的不同与联系)(1) 一次信息(原始文献)(2) 二次信息(检索工具)(3) 三次信息(参考工具)2、出版形式——图书、期刊、特种文献,结合教材P24-25的内容(请从基本概念、内容特点、著录特点三个方面着重掌握图书、期刊、会议、专利、标准、学位六种类型)3、物理类型——印刷型、缩微型、机读型、声像型4、按信息的性质划分P75、按信息所表征的服务对象划分P7二、信息检索(P2-4)(一)信息检索就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者是包含用户所需事实与消息的文献的过程。

它包括三个方面:数据检索、事实检索、文献检索数据检索、事实检索、文献检索三者中以文献检索为主。

数据和事实检索是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。

(二)文献检索及其类型1、定义:检索系统的建立及检索工具的组织和积累文献的查寻,利用检索工具检出与课题相关的文献。

2、直接检索是从通过阅读原始文献直接获取所需信息快捷、方便漏查率高3、间接检索是通过检索工具的指导再查找原始文献而获取所需信息。

系统、全面滞后? 为什么间接检索是一种更为科学的检索方法?三、检索工具(P8-11)(一)基本概念:按一定的学科、主题等进行搜集整理并给予文献的标志,是及时报道的二次文献,具有报道、存贮、检索的功能。

信息检索复习资料

信息检索复习资料

一、名词解释1.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。

2.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。

3.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

4.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。

5.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词某一部分允许有一定词形变化。

6.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识原始来源和属性的数据库。

7.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。

8.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。

9.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。

10.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。

11.电子报纸—多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。

12.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。

13.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。

信息检索知识点

信息检索知识点

计算机检索1.信息素养(信息素质、信息能力):作为具有IL(information literacy)能力的人,必须能够充分地认识到何时需要信息,并有能力去有效地发现、检索、评价和利用所需要的信息,从而具有终身学习的能力,总能够为任何任务和决策找到所需信息。

2.信息检索广义:指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。

包括存储和检索两个过程。

狭义:从信息集合中找出所需信息的过程。

信息查找(Information Search,Information Seeking)2.1信息现状分析1)信息爆炸导致文献量急剧增加,容相互渗透,语种增多;文献分布异常分散;文献寿命愈来愈段;2)由于条件限制,人们吸收和利用信息的能力并未得到相应的提高。

3.检索的作用1)促进智力资源的开发;2)协助管理者做出正确的决策;3)帮助科研人员借鉴前人的研究成果,避免重复劳动;4)信息检索是知识更新的手段。

4.数据库类型(1):作为图书馆数字资源的数据库特指为科学、教学、学习所需各种参考资料的集合,以数据库的形式管理和利用。

自建数据库:馆藏目录(OPAC),本校学位论文数据库。

商业性数据库:数据库商、出版商和其他机构以商业化方式提供的各种电子资源,图书馆需要支付一定的费用购买数据库的使用权再提供给一定的读者群。

免费数据库:开放获取资源、机构典藏和其他免费的网络资源。

5.数据库类型(2)从收录文献的容分,有综合性数据库和专业性数据库之分;从收录文献的类型分,有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、标准数据库等;从提供文献的形式分,有全文数据库、文摘数据库、引文数据库;各数据库举例:专业数据库:Petroleum Abstract(PA)、EnCSciFinder Schoiar(CA) 综合性数据库:读秀、Scopus、EI、SCI特定文献类型,如图书、期刊、学位论文等:超星、EIsevier ScienceDirect、PQDT全文数据库:CNKI、维普、SPE摘要性数据库:EI、PA引文数据库:Web of Science、CSSCI(中文社会科学引文索引)6.Science Citation Index Expanded(SCI-E)是个什么样的数据库?它是ISI检索平台中Web of Science核心合集中的一个子库它是一个摘要型数据库它是一个引文数据库它是一个期刊数据库它收录的学科围包括科学、技术的各学科7.查文献应该如何选择数据库?学科专业:有专业型数据库时,首选专业型数据库;数据量:选择数据量大的;文献类型:根据研究的需要。

信息检索复习重要知识

信息检索复习重要知识

一、名词解释(4题,20分)目录:以一个完整的出版单位或收藏单位作为著录的基本单位,将一批著录款目按照一定的次序编排而成的一种揭示及报道文献的工具。

索引:将某一信息集合中的相关信息按照某中可查顺序排列并系统地指引给读者的一种检索工具。

年鉴:一种按年度出版,概述或反映上一年度有关领域的重大事件、重大进展和重要成果,汇集重要文献、详尽数据很统计资料的连续出版物。

手册:是汇集某一范围内基础知识和基本数据资料,以便于人们在生产、科研、教学等具体工作过程中可以经常查证的实用便览型参考工具。

OPAC:由开放的公共查询目录演化而来,是20世纪70年代末由美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。

CALIS:是经国务院批准的我国高等教育公共服务体系之一,在教育部的领导下,把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来。

信息检索:广义上,信息检索是指信息存储与查找的过程,狭义上,指信息查找的过程,信息查找是指通过查询机制从各种检索系统中查找出用户所需要的特定信息的过程。

搜索引擎:泛指网络上以一定的策略搜集信息,对信息进行组织和处理,并为用户提供信息检索服务的工具和系统,是网络资源检索工具的总称。

百科全书:是指收录了各个知识门类的知识,或者系统而完备地概述了某一知识门类知识的大型参考性工具,是最完备的参考工具,有“工具书之王”的美誉。

学位论文:学位论文是伴随着学位制度的实施而产生的,是高等院校或科研机构的毕业生为获取学位资格而撰写的学术性研究论文。

特种文献:一种介于图书与期刊之间的文献类型,通常在出版发行或获取途径方面比较特殊,因此也被称为灰色文献。

电子图书:是指以数字形式加工,通过计算机网络进行传播,,并借助于计算机或类似设备来阅读的图书,是电子出版物中最常见的文献形式。

参考工具书:是根据一定的社会需要以特定的编排方式和检索方法汇编某学科或特定范围的知识和资料,其目的是为人们解决疑难和提供数据或事实信息,是作为工具使用的专供查考的特定类型的图书。

信息检索知识点

信息检索知识点

信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。

2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。

3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。

存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。

检索过程是存储过程的逆过程。

因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。

4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。

缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。

8.什么是计算机信息检索?所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。

信息检索的基本知识

信息检索的基本知识

信息检索的基本知识
信息检索是一种重要的技术,它用于从大量的数据中提取所需信息。

以下是一些信息检索的基本知识:
•索引:信息检索的首要步骤是构建索引。

索引是一个按关键字组织的数据结构,用于快速定位和访问文档。

•关键字:关键字是进行信息检索的基本单位。

它们可以是单个词或短语,根据检索目的和搜索引擎的功能来确定。

•搜索引擎:搜索引擎是信息检索的核心工具。

它利用索引和算法来找到与用户查询相关的文档,并按相关性排序。

•查询:用户通过查询向搜索引擎提供信息需求。

查询可以是简单的关键字、短语,也可以是复杂的语句。

•相关性:搜索引擎根据文档与查询的匹配程度计算相关性。

相关性分数用于确定排名,从而决定返回给用户的搜索结果顺序。

除了以上基本知识,信息检索还涉及更多高级技术:
•倒排索引:倒排索引是一种常用的索引结构,它将关键字映射到包含这些关键字的文档列表中,以支持快速的搜索。

•词频和权重:搜索引擎通常根据关键字在文档中出现的频率和位置,以及其他因素来计算关键字的权重。

•自然语言处理:信息检索利用自然语言处理技术来理解用户查询和文档内容,以提高搜索效果。

•评估和优化:为了提供更好的搜索结果,搜索引擎需要不断评估和优化算法,以适应不断变化的用户需求和文档集合。

总结起来,信息检索是一门复杂而关键的技术,它在数字化时代具有重要意义。

了解信息检索的基本知识对于学习和使用搜索引擎、开发相关应用都非常有帮助。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、名词解释(4题,20分)目录:以一个完整的出版单位或收藏单位作为著录的基本单位,将一批著录款目按照一定的次序编排而成的一种揭示及报道文献的工具。

索引:将某一信息集合中的相关信息按照某中可查顺序排列并系统地指引给读者的一种检索工具。

年鉴:一种按年度出版,概述或反映上一年度有关领域的重大事件、重大进展和重要成果,汇集重要文献、详尽数据很统计资料的连续出版物。

手册:是汇集某一范围内基础知识和基本数据资料,以便于人们在生产、科研、教学等具体工作过程中可以经常查证的实用便览型参考工具。

OPAC:由开放的公共查询目录演化而来,是20世纪70年代末由美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。

CALIS:是经国务院批准的我国高等教育公共服务体系之一,在教育部的领导下,把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来。

信息检索:广义上,信息检索是指信息存储与查找的过程,狭义上,指信息查找的过程,信息查找是指通过查询机制从各种检索系统中查找出用户所需要的特定信息的过程。

搜索引擎:泛指网络上以一定的策略搜集信息,对信息进行组织和处理,并为用户提供信息检索服务的工具和系统,是网络资源检索工具的总称。

百科全书:是指收录了各个知识门类的知识,或者系统而完备地概述了某一知识门类知识的大型参考性工具,是最完备的参考工具,有“工具书之王”的美誉。

学位论文:学位论文是伴随着学位制度的实施而产生的,是高等院校或科研机构的毕业生为获取学位资格而撰写的学术性研究论文。

特种文献:一种介于图书与期刊之间的文献类型,通常在出版发行或获取途径方面比较特殊,因此也被称为灰色文献。

电子图书:是指以数字形式加工,通过计算机网络进行传播,,并借助于计算机或类似设备来阅读的图书,是电子出版物中最常见的文献形式。

参考工具书:是根据一定的社会需要以特定的编排方式和检索方法汇编某学科或特定范围的知识和资料,其目的是为人们解决疑难和提供数据或事实信息,是作为工具使用的专供查考的特定类型的图书。

元搜索引擎:是对搜索引擎进行搜索的搜索引擎,是对多个独立搜索引擎的整合、调用、控制和优化利用。

信息检索工具:能够让用户通过其检索出特定信息的一个工具,包括印刷型检索工具和网络信息资源检索工具。

二、不定项选择题(10题,20分)1、信息检索方法的分类(1)按检索对象的内容划分A、文献检索B、数据检索C、事实检索(2)按检索方式划分A、手工信息检索B、计算机信息检索(3)按检索要求划分A、特性检索B、族性检索(4)按检索的时间跨度划分A、定题检索B、回溯检索(5)按检索对象的信息表现形式划分A、文本检索B、多媒体检索C、超文本检索2、检索效果的评价指标(1)(2)(3)(4)3、搜索引擎的分类及其代表性引擎名称(1)目录型搜索引擎:雅虎、搜狐、新浪、Galaxy、Open Directory、Infoseek、The WWW Vitual Library、BUBL LINK、AOL Search、蓝帆(2)索引型搜索引擎:Google、百度、天网搜索、Alta Vista、Excite、Allthe Web、LYCOS、Inktomi、Hotbot、LookSmart(3)元搜索引擎:Ixquick、Vivisimo、Dogpile、MetaCrawler、WebCrawler、万维搜索4、了解知名搜索引擎及其检索功能等。

(1)搜狐:分类目录导航检索、简单检索、高级检索、结果显示(2)雅虎:主题分类目录浏览检索、关键词检索、结果显示(3)Galaxy:分类目录浏览、简单检索、高级检索、结果显示(3)Google:基本查询、高级搜索、搜索范围限制功能、查询结果、特色查询功能(4)百度:简单检索、高级检索、结果显示(5)Dogpile:简单检索、高级检索、定制偏好、结果显示(6)万维搜索:简单检索、高级检索、结果显示5、特种文献的类型。

特种文献主要包括:会议文献、学位论文、专利文献、标准文献、科技报告、政府出版物、产品样本、产品目录及档案。

6、国内学位论文的查检途径。

我国学位论文一般收藏于本院校的图书馆、国家图书馆、中国科技信息研究所和中国社会科学院信息所、国内各大学位论文数据库(如:万方数据知识服务平台中国学位论文数据库、CNKI中国优秀硕博士学位论文全文数据库、CALIS高校学位论文数据库等)。

7、所学过的检索技巧的应用。

(一)传统的信息资源检索技术(1)布尔逻辑检索A、或(+、OR)可以扩大检索范围,增加命中文献数量,有利于提高检索结果的查全率。

B、与(*、AND)对检索词进行限定,从而缩小检索范围,有利于提高检索结果的查准率。

C、非(—、NOT)缩小命中文献的范围,增强检索的准确性。

注意事项:A、执行顺序,NOT、AND、ORB、非在写关系式时,a – b 错误写法;a –b正确写法,- 跟b之间不能有空格(2)截词检索?表示单个字符 *表示多个字符不同检索工具,字符不一定相同A、后截断 stu*B、中截断 stu?ent 中截断只允许有限截断C、前阶段 *dent(3)位置检索A、词位置检索:提高检索的查全和查准率有重要作用,但网络检索中基本只支持(W)和(N)运算符W与nW: a(W)b a(nW)b 检索出来的词序不能颠倒W:所连接的词之间除了可以有一个空格、一个标点符号或一个连接号外,不得夹有任何其他单词或者字母。

nW:允许连接在两个检索词之间最多夹入n个其他单元词(冠词、介词、连接词)N与nN: a(N)b a(nN)b 检索出来的词序可以颠倒N:所连接的词之间除了可以有一个空格、一个标点符号或一个连接号外,不得夹有任何其他单词或者字母。

nW:允许连接在两个检索词之间最多夹入n个其他单词X与nX: a(X)a a(nX)a 检索出来的两侧检索词完全一致,并以指定顺序相邻X:所连接的词之间除了可以有一个空格、一个标点符号或一个连接号外,不得夹有任何其他单词或者字母。

nX:允许连接在两个检索词之间最多夹入n个其他单元词(冠词、介词、连接词)B、同句检索C、同字段检索(4)限制检索A、字段限制检索:可以缩小检索范围,提高查准率基本字段:题名(TI)、文摘(AB)、叙词(DE)等。

辅助字段:作者(AU)、刊名(JN)、语种(LA)、专利号(PN)、年代(PY)等。

B、限制符限制检索AU(作者)、CS(作者单位)、JN(刊物名称)、PY(出版年份)、LA(语言)等。

(5)加权检索A、词加权检索B、词频加权检索(二)信息资源检索方法(1)常规法A、顺查法:由远及近,适合检索理论性或学术性的课题B、倒查法:由近及远,多用于检索新课题或有新内容的老课题,或对某课题研究已有一定基础,需要了解其最新研究动态的检索课题C、抽查法:选择与该课题有关的文献信息最可能出现或最多出现的时间段,话费较少时间获得较多文献的检索方法(2)回溯法回溯法又称引文法,是指在已获得所需文献的基础上,再利用文献末尾所付的参考文献、相关书目、推荐文章和引文注释作为检索入口,依据文献之间的引证和被引证关系揭示文献之间的某种内在练习,进而查找到更多的相关文献的方法。

优点:在检索工具不全或检索系统收录内容不完整的情况下,借助此法非常有效。

缺点:费时、盲目性大,信息查全效果差(3)综合法综合法也称交替法或循环法,是将常规法和回溯法结合起使用的检索方法。

分阶段、按周期地交替使用两种方法,对检索效率的提高有很大帮助。

三、简答(6题,30分)1、信息检索的原理信息检索的实质就是将用户的检索提问标识与存储在信息检索系统中的信息特征标识进行比较、匹配,两者一直或者信息特征标识包含了检索提问标识,则具有该标识的信息就从检索系统中输出,输出的信息就是检索系统命中的信息。

2、文献检索及其内容文献检索是指以查找某一课题的相关文献为目标的检索。

文献检索包含全文信息检索和目录、题录、索引、文摘等二次文献信息检索。

3、手工检索与计算机检索的异同点。

手工检索和计算机检索的本质是相同的,都是从特定的检索系统中查找、匹配、输出所需要信息的过程;二者的区别在仅在于信息的载体形式、存储方式和匹配机制有所不同。

手工检索优点:检索过程灵活,可以随时修改检索策略,检索结果较为准确;缺点:检索速度慢、效率低、更新慢、查全率低。

计算检索优点:与手工信息检索系统相比较,计算机信息检索系统具有检索范围广、信息量大,检索速度快、效率高,检索不受时空限制,数据更新快,可以及时获得最新数据,查全率和查准率高,检索功能强,辅助功能完善,以及使用方便等特点。

缺点:费用高,需要较好的检索技术,还有一系列设备,且受网络影响稳定性相对较差。

4、提高信息检全率和检准率的方法(1)如何提高查全率? 1. 优先使用最简单常用的主题词; 2. 逐渐减少不重要的检索词; 3. 加用多个等同词,用“或”(OR、|)语法; 4. 换用上位词; 5. 增加检索途径;(2)如何提高查准率? 1. 换用专指性更强的主题词; 2. 逐渐加用主题词; 3. 加用辅助词; 4. 利用词和网页的外部特征限制输出结果; 5. 观察不相关检索结果的特征,使用“减”(-)语法排除; 6. 使用下位词5、所学过的图书、期刊数据库的简介及特点等。

《中国期刊全文数据库》是目前国内内容较为丰富的动态更新的中国期刊全文数据库。

至2006年3月31日,收录国内公开出版的7600多种重要期刊,其中含1735种核心期刊与专业特色期刊,累计1994年以来的全文文献1750万篇;其中4000多种刊物回溯至创刊,如1915年创刊的《清华大学学报(自然科学版)》、《中华医学杂志》等。

产品分为九大专辑:理工A、理工B、理工C、农业、医药卫生、文史哲、经济管理与法律、教育与社会科学综合、电子技术与信息科学。

推出网络数据库、专辑光盘数据库和专题数据库等服务。

中心网站及数据库交换服务中心每日更新。

《中文科技期刊数据库》是我国最大的数字期刊数据库,该库受到国内图书情报界的广泛关注和普遍赞誉,目前已拥有包括港澳台地区在内2000余家大型机构用户,是我国数字图书馆建设的核心资源之一,高校图书馆文献保障系统的重要组成部分,也是科研工作者进行科技查证和科技查新的必备数据库。

期刊总数:12000 余种核心期刊:1957 种文献总量:3000 余万篇更新周期:中心网站日更新全文质量:采用国际通用的高清晰PDF全文数据格式学科范围:社会科学、自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报检索方式:快速检索、传统检索、分类检索、高级检索、期刊导航《数字化期刊数据库》该库是万方数据资源系统的重要组成部分,由万方数据自主建设。

相关文档
最新文档