信息检索策略
信息检索

中文书本式的检索工具
《国内总书目》--《全国新书目》《科技新 书目》:查找国内出版的图书目录 《外文新书通报》:查找国外新书目录 《全国报刊索引》:查找国内期刊论文的工 具 科技 文献书目型数据库检索系统 事实型数据库检索系统 数值型数据库检索系统 全文数据库检索系统
“逻辑或”的组配种类
同义词 同一个人多个姓名 通用的英文缩写 化学物名称 Eg:CAD
逻辑非
用于排除含有不需要概念的信息,可缩小所 检索信息的范围。 逻辑运算符:“NOT”、“-” 逻辑表达式:“A NOT B ”“A-B” 语义表示:被检索文献中含有A而不含有B
4字段(限制)检索
在检索系统中,数据库设置的可供检索的字 段通常有两种: 表达文献主体内容特征的基本字段 表达文献外部特征的辅助字段 基本字段包括篇目(TI)、文摘 (AB)…… 辅助字段包括作者(AU)、语种 (LA)……
4字段(限制)检索
为了缩小检索范围,可利用字段代码来限制检索词 出现的字段,以提高检索速度和命中率。 如: economic models in ti(表示只在题 目字段中查找文献) economic models in de(只在主题词中 查找) economic models in ab(只在文摘中查 找) au = Smith,J.C (查作者为Smith,J.C 的 文章) py = 1998(只查1998年的文章) la =Chinese (只查语种为中文的文献)
位置算符检索即运用位置算符表示两个检索 词间的位置。 如果说布尔逻辑算符是表示两个概念之间的 逻辑关系的话,位置算符表示的是两个概念 在信息中实际物理位置关系。
检索时会经常遇到这样的问题?
计算机信息检索的策略和方法

计算机信息检索的方法与策略1. 计算机信息检索过程中的相关概念(1)数据库:数据库是“至少由一个文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合”。
通俗地说,数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。
数据库是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源,也是信息检索的重要资料来源。
根据载体的不同,数据库可分为:联机数据库(online-database),光盘数据库(CD-ROM-database)和网络数据库(networked-database)三种。
(2)检索界面:指在进行计算机检索时,检索者与计算机交互对话的界面。
(3)检索方式:以检索过程的繁简程度或从何入手来区分的不同检索过程。
在数据库中往往设有初级检索/简单检索/基本检索(单途径检索);高级检索(多途径组合检索);专业检索(构造检索式);按类检索;按刊检索(刊物查询、刊名导航),篇目检索/论文查询;引文检索等方式供选择。
(4)检索途径:又叫检索入口、检索项,也有的数据库称之为检索字段。
指输入的检索条件所查询的数据区域。
不同数据库所设的途径并不相同。
一般都设有篇名、作者、关键词、全文等途径。
(5)检索词:检索词是检索者给出的字、词、字符或短语,用于查找含有它(它们)的记录。
(6)排序:指检索结果输出时的排列顺序。
输出结果按相关度排序时,则检索结果按检索词在检索字段中发现的频度由高到低依次排列。
无相关度时,输出结果则按文献的出版日期逆序排列或随机排列。
(7)二次检索:指在前一次检索结果的基础上,进一步限定检索条件所进行的再次检索。
二次检索可以多次使用,逐步缩小检索范围。
(8)限制条件:在检索对象的时间、文献类型、语种、同义词等方面做限制,与检索途径配合使用,以精化检索结果。
(9)检索词匹配:指输入的检索词在数据库的可检索字段值中的位置关系。
一般表示为前方一致、后方一致、完全一致(精确匹配)、任意一致(模糊匹配)等。
信息检索 策略

信息检索策略
信息检索策略是为了实现检索目标而制定的全盘计划和方案,对整个检索过程进行谋划和指导。
在制定信息检索策略时,首先需要进行所选课题的分析。
接着,基于对检索提问的分析,确定检索的数据库、检索的用词,并明确检索词之间的逻辑关系和查找步骤的科学安排。
具体来说,文献检索可以分为以下几个步骤:
1. 分析问题,明确文献需求。
2. 选择文献检索工具,如中国知网、维普或万方等。
3. 确定检索途径、检索词,构造检索式。
4. 根据初次检索的结果调整检索策略。
5. 根据文献线索,获取全文。
3-3 信息检索过程与策略

有些课题的实质性内容往往很难从课题名称上反映出 来,需要从中提取隐含概念,另外有些检索词已含有 的概念,在选词时应予以排除。
例: 聚乙烯的合成 垃圾的处理 垃圾的处理
聚乙烯 合成 垃圾 处理 回收 再生 玻璃纤维 石膏
玻璃纤维增强 玻璃纤维增强石膏制品 增强石膏制品
针对每一个概念, 针对每一个概念,选择与之相关的同义词或相关词 相关的词有: 与somking相关的词有: 相关的词有 smoker,smokers,tobacco等; 等 heart disease的同义词有 的同义词有cardiopathy,heart 的同义词有 trouble, heart attack. 将这些相关词记录下来,用于构造检索式: 将这些相关词记录下来,用于构造检索式: 概念1: 概念 :somking,smokers,tobacco 概念2: 概念 : cardiopathy, heart disease,heart , trouble, heart attack
以上步骤不一定按顺序执行,可根据所检课题和所使用的检索系统的情 况灵活运用。其中(3)和(4)是比较重要的。
3. 几种检索策略
计算机检索策略是近几年才得到人们的重视和 广泛研究的,很多检索策略只不过是某种检索 方式或检索式构造方法,真正称得上检索策略 的还不多。其中,美国人鲍纳(Charles Bourne)提出的检索策略影响较大:
如:“吸烟与心脏病的关系” 可以表达为 connection between somking and heart disease 通过分析发现,其中,只有somking和heart disease两个概念词,而“connection between”则不属于概念词。 概念1:somking 概念2:heart disease
文献检索试题及答案结合所学知识对基于计算机网络的信息检索策略

文献检索试题及答案结合所学知识对基于计算机网络的信息检索策略一、寄语计算机计算机网络信息检索策略的目的1.为什么检索?如何检索?它山之石可以攻玉。
但并不是每块石头都可以攻玉的。
用何方法寻找最好石头。
2.利用信息解决问题。
提高自我科学研究过程中对事物现有的认知能力并弥补认知缺陷。
3.从信息中发现问题。
有助于自我认知区域局限的跨域从必然认知世界走向自由认知世界。
二、计算机信息检索的基本构成检索词的确定、检索策略、编制检索式。
计算机网络信息量飞速膨胀,使用户从海量的信息中迅速而准确地获取对自已有用的信息十分困难。
而影响计算机网络信息检索效率的因素有很多,比如计算机网络信息源因素、计算机网络信息检索工具的问题、用户的素质等。
针对这一问题,通过调查研究出了一些比较有用的检索方法和技巧,以提高网络检索信息的效率。
信息检索方法为:1.直接用信息源查找。
利用域名的命名规则查找信息源的URL。
因特网的域名结构是由若干个圆点隔开的分量组成的,可简单地表示为计算机名单位(或机构)机构所属类别。
2.利用搜索引擎查找信息搜索引擎是一种提供信息检索服务的计算机系统,是互联网产生后派生出的一个为网上用户快速查询信息的新生事物。
可以说利用搜索引擎检索信息是计算机网络上最重要的一种手段。
但要想利用有限的时间和费用,获得有效的查询信息,就必须掌握一定的使用方法与技巧。
如可以选择适当的搜索引擎、使用加减号限定查找、使用双引号进行精确查找、明确搜索目标等。
3.利用计算机网络新闻组查找信息。
新闻组,简单地说就是一个基于计算机网络的计算机集合,新闻服务器上存在各种主题的栏目,内容覆盖社会生活的各方面,在其中的大多数新闻组中,每个人都可以自由地发布信息、提出问题或答复别人的问题,有些组里还有专家主持,解答各种问题。
使用新闻组的方法很简单,用户需要有新闻组阅读器程序,并且要知道新闻组服务器的域名地址。
4.利用已有计算机网站的导航功能。
一些网站精心挑选使用频度高或与其相关的网站以超链接的方式放在其主页上,用来给所有的网络用户提供导航。
检索策略及检索过程

检索策略及检索过程检索过程及检索策略信息检索的全过程大概分为六个步骤:分析课题、选择检索工具、确定检索途径、选定检索方法、查找文献线索、索取原始文献。
一、分析课题GIS在医药行业的应用研究与探索。
概述地理信息系统技术在现代医药行业的应用探索与研究,重点介绍GIS在公共卫生与疾病领域、药品监管、医药商业等领域的应用,并讨论了这些基础在应用过程中存在的问题。
将GIS技术应用于医药行业以解决现阶段存在的一些问题,将会给医药行业带来更好的发展。
二、检索工具首先使用学校的购买的资源,比如CNKI、万方、sciencedirect 等,由于我们学校只买了医药方面的数据库权限,没有购买计算机方面的权限,所以就通过网上找的一些代理和其他学校VPN、MD、ezproxy等,通过获得的账号可以访问其他学校的资源,下载全文文献。
三、确定检索途径、方法以及策略检索途径:主要运用了题名检索、机构检索、主题检索和关键词检索等。
首先在CNKI中,使用“GIS”作为题目检索项进行跨库检索,获得文献24978篇,其中大部分文献都是以介绍GIS在各个行业的应用,其应用范围主要集中在工程利于,比如物流、商业分析等。
但也有不少文献讲述了GIS在中药种植方面的应用。
总体说来,在CNKI中的检索得到的文献与预期不是很符合。
然后又在硕士博士数据库中重新选取关键词进行筛选,筛选了相关部分的一些文献。
再次检索:使用Google学术进行检索。
使用高级检索“在文中标题中”进行检索,获得GIS相关综述类文献(根据之前的经验,分别针对包含和不包含“医药行业”关键字进行检索,获得一些其他方面信息),下载引用数靠前的文献,用作综述中简述、医药行业的应用以及一些研究进展。
并将这部分文献的标引信息导入Endnote中备用。
补充检索:这一部分主要针对在进行综述写作中遇到的一些不够清楚和详细的问题进行检索。
这部分内容主要在各种相关专业的数据库和期刊中进行检索。
有时候还会用到维基百科、百度百科中相关的专业术语的解释,以易于理解。
第八课 网络信息检索的原则与策略解析

一、网络信息检索的原则
1、准 信息检索以查准为主,在较高的查准率 下考虑查全,因而在检索网络信息时针对性要 强。
2、新 通过限定时间或加相关关键词完成查新 要求,查找到最新的信息。
3、勤 每个人对关键词的定义与选择方式都是 有差异的,如果搜索不到相关信息,可以勤换 关键词来尝试新的检索。或通过搜索引擎提供 的“相关搜索” 联想功能提供的相关关键词 进行新一轮检索。
4)序号途径 是以信息专用的号码为特征,按
号码大小顺序编排和检索的途径。如报告号索引、 合同号索引、登记号索引和专利号索引等。 特点:该途径各索引编制简单,使用方便,但不 能作为信息检索的主要途径。
5)书名途径 是以书刊的名称查找信息的途
径。主要是利用《期刊名目录》和《图书书 名目录》。
特点:是按书刊名称的字顺编排的使用方便。
2)倒查法 和顺查法正好相反。它是一种逆
时间顺序,由近及远查找文献的方法。查找 的资料新,检索工作量小,但是漏检率较大, 常用于战术方面的信息检索。用于要求查询 快、新信息。
3)抽查法 是针对某一学科的发展特点,发
表文献较多的一段时间(几年或十几年)进 行检索,用以解决要求快速检索的课题。
4)追溯法 就是以文章图书末尾所附的“参考
2)确定所需信息类型
根据检索课题性质分析,确定所需信息 在哪些类型的出版物中。例:如课题属理论 探讨性质,侧重于会议文献、期刊;如课题 属尖端科技,则侧重科技报告;如课题属工 艺革新、发明创造等,则侧重专利文献;如 属产品的设计、生产造型则侧重标准文献、 产品样本。
3)确定检索的时间范围
确定适当的查找期限,可节省大量的查找 时间。
特点:是以学科概念为中心,反映事物的派生、 隶属、平等等关系,便于从学科专业角度来 查找,能较好的满足族性检索的要求。
信息检索搜索引擎的工作原理与优化策略

信息检索搜索引擎的工作原理与优化策略信息检索搜索引擎作为我们在日常生活中经常使用的工具,其工作原理及优化策略对于提高搜索结果的准确性和相关性十分重要。
本文将从搜索引擎的工作原理和优化策略两个方面进行论述。
一、搜索引擎的工作原理搜索引擎的工作原理可以分为三个主要步骤:网页抓取与索引、查询处理以及结果返回。
1. 网页抓取与索引搜索引擎通过网络爬虫程序对互联网上的网页进行抓取,并将抓取到的网页内容存储到索引库中。
爬虫程序会按照一定的策略遍历网页,获取网页的URL、标题、正文等内容,并在索引库中建立相应的索引。
2. 查询处理当用户输入查询词进行搜索时,搜索引擎会对查询进行处理。
首先,会对查询词进行分词处理,将词语切分为多个关键词。
然后,搜索引擎会根据关键词在索引库中进行检索,找出包含相关关键词的网页。
3. 结果返回搜索引擎根据检索到的网页进行排序,并将最相关的网页结果返回给用户。
排序的算法通常会考虑多个因素,如关键词的权重、页面的质量等。
搜索引擎还会根据用户的位置、历史搜索记录等个性化因素进行结果的调整,以提供更符合用户需求的搜索结果。
二、搜索引擎的优化策略为了提高搜索引擎的准确性和相关性,优化策略是必不可少的。
以下是几个常见的搜索引擎优化策略。
1. 关键词优化在网页内容中合理地使用关键词是提高搜索引擎排名的重要手段。
关键词应出现在网页的标题、正文、链接等位置,并保持一定的关键词密度。
然而,关键词堆砌是不可取的,搜索引擎对此会给予惩罚。
2. 网页结构优化良好的网页结构可以提高搜索引擎对网页的理解和解析能力。
网页应该具有清晰的标题、正文、引用等内容,并使用合理的HTML标记。
同时,网页的内外链建设也是优化策略的一部分,可以增加页面权重和链接流量。
3.提高网页质量搜索引擎对网页质量有一定的评估标准,如网页的加载速度、用户访问时长等。
优化策略可以从页面设计、网页代码优化、服务器速度等方面入手,提高网页的质量。
提高学生信息素养的信息检索策略

提高学生信息素养的信息检索策略引言随着数字化时代的快速发展,信息技术对我们的日常生活和学习产生了深远的影响。
作为学生,掌握有效的信息检索策略对于提高信息素养至关重要。
本文将介绍一些可以帮助学生提高信息检索能力和信息素养的策略,并提供一些实用的技巧和建议。
什么是信息素养?在进一步讨论信息检索策略之前,让我们先了解一下什么是信息素养。
信息素养是指个体在信息社会中获取、评估、应用和创造信息的能力。
具备良好的信息素养意味着学生能够有效地发现、评估和利用各种信息资源,从而更好地满足学习和生活的需求。
信息素养对学生的重要性信息素养对学生十分重要,它可以帮助他们更好地学习和成长。
首先,信息素养可以提高学生的学习效率。
通过掌握合适的信息检索策略,学生可以更快地找到他们所需要的信息,并更好地利用这些信息来解决问题和完成任务。
其次,信息素养可以培养学生的创造力和创新能力。
合理利用信息资源可以为学生提供更多的思路和观点,激发他们的创造力和创新意识。
最后,信息素养可以帮助学生成为自主学习者。
通过掌握信息检索策略,学生能够主动获取所需的知识和技能,培养自主学习的能力,而不仅仅依赖于教师和课堂。
信息检索策略之一:选择合适的搜索引擎搜索引擎是学生进行信息检索的首要工具。
选择合适的搜索引擎可以帮助学生更快地找到他们所需要的信息。
目前,常见的搜索引擎有谷歌、百度、必应等。
每个搜索引擎都有自己的特点和搜索算法。
学生可以根据自己的需求选择最适合的搜索引擎。
信息检索策略之二:关键词的选择和使用关键词是进行信息检索的基础。
学生应该学会选择和使用恰当的关键词来获取更精准和相关的结果。
一般来说,关键词应该尽可能具体和明确,以减少无关和杂乱的信息。
同时,学生还可以尝试使用同义词和相关词汇来扩大搜索范围,获得更多的相关信息。
信息检索策略之三:使用搜索技巧和高级搜索选项除了选择合适的关键词,学生还可以学习一些搜索技巧和高级搜索选项来提高信息检索的准确性和效率。
谈谈信息检索策略以及这些文献的引用方法。

谈谈信息检索策略以及这些文献的引用方法。
信息检索策略是指在海量的信息中,通过合理的方法和技巧,快速准确地找到所需信息的过程。
随着互联网的发展和普及,我们所面对的信息量越来越大,因此掌握一些有效的信息检索策略和文献引用方法对于我们的学习和工作都非常重要。
首先,信息检索的策略包括关键词搜索、分类搜索和专业数据库搜索等。
关键词搜索是最常见的检索策略,我们可以通过在搜索引擎中输入相关的关键词来查找相关的信息。
在使用关键词搜索时,我们需要选择准确的关键词,并使用逻辑运算符(如AND、OR、NOT)来缩小或扩大搜索范围。
此外,还可以利用搜索引擎提供的高级搜索功能,如限定搜索范围、按时间排序等来提高检索效果。
分类搜索是指根据信息的分类体系进行检索。
在某些网站或数据库中,信息已经按照一定的分类体系进行了整理和归类,我们可以通过选择相应的分类来进行检索。
这种检索策略适用于我们已经知道所需信息所属的领域或分类的情况下。
专业数据库搜索是指利用专门的学术数据库进行检索。
相比于常见的搜索引擎,学术数据库通常包含更多的学术论文、期刊文章等专业性的资料。
在进行专业数据库搜索时,我们需要选择合适的数据库,并使用相关的检索语法和操作符来进行检索。
此外,还可以利用数据库提供的高级检索功能,如按作者、标题、关键词等进行精确检索。
除了信息检索策略,文献引用方法也是非常重要的。
在撰写学术论文或研究报告时,我们需要引用他人的研究成果来支持自己的观点或论证。
正确地引用文献不仅能够增加论文的可信度和权威性,还能够尊重他人的知识产权。
文献引用方法主要包括直接引用和间接引用两种方式。
直接引用是指直接将他人的观点或论述原封不动地引入自己的论文中,并在引用处注明作者和出处。
在直接引用时,需要使用引号将原文括起来,并在引号后面注明作者和出处的信息。
间接引用是指根据他人的观点或论述进行自己的表述,并在引用处注明作者和出处。
在间接引用时,可以使用自己的话对原文进行改写,并在改写后的句子末尾注明作者和出处的信息。
分析网络信息检索影响因素及策略

分析网络信息检索影响因素及策略摘要随着信息化时代的到来,信息技术的应用越来越广泛,计算机与互联网技术已经逐渐在国内普及。
而网络信息检索也成为了重要关注的内容,本文将从几个不同方面来分析网络信息检索效率的影响因素,并制定对应的策略,以提高检索的效率。
关键词网络信息检索;影响因素;策略所谓网络信息检索,主要是指从众多网络信息当中,快速、全面且准确找到有效信息,作为开发、利用信息资源,是当下开展创新科技的前提条件。
本文将主要从网络信息的检索工具入手,探讨数据标引与检索入口词的判别,同时对于检索人员综合素质等方面也进行了一定分析。
一、网络信息检索影响因素分析(一)网络信息的检索工具当下社会已经逐渐实现信息化,计算机與互联网逐渐普及,网络信息资源如今成为人们获取信息的主要途径,是人们生活与工作不可缺少的一部分。
网络信息检索工具也不断更新,但还存在不少缺点,这些缺点很大程度上影响了网络信息检索效率。
比如说:检索工具的覆盖范围较有限,至今还没有研发出一种检索工具可以覆盖整个网络信息源;还有检索工具的功能还有待提高,检索点不可以从多方面来限制检索问题,仅仅是从一个关键词来进行笼统检索,获取有效信息还需要进行筛选;另外还有很多检索工具目前还不具备多媒体信息检索能力等等。
(二)数据标引质量数据标引目的是为了确保文献获取检索标识,把繁多的无序文献转变成为有序文献集合,为用户检索提供了有效方法,所以,标引结果的质量对数据库质量影响较大,在很大程度上决定了数据库检索效率。
当前,有很多网络数据库使用的系统没有标引检索,尽管大大降低了文献的处理成本,提升了文献的处理速度,简化了文献处理难度,使得检索系统简单易用,但却在很大程度上降低检索效率。
比如说:客户在获取信息时,往往查询到的信息很全面,但是不够准确,用户对获取的检索信息很难满意。
(三)检索入口词选择检索入口词选择,直接关系到检索效果,但是选择科学合理的检索入口词也非常困难。
检索策略的步骤

执行检索:在选择的检索工具中输入构建好的检索语句,执行搜索操作。
浏览结果:检查搜索结果的相关性,并浏览摘要或简介,以确定是否符合你的信息需求。
评估和筛选:评估搜索结果的质量和可靠性,并筛选出最相关的信息。
检索策略是在信息检索过程中为了获取最相关和有效的信息而采取的一系列步骤和方法。以下是一个常见的检索策略步骤的简要描述:
确定信息需求:明确你需要找到什么样的信息,具体的主题或问题是什么。
分析关键词:根据信息需求,将其分解成一组关键词或短语,这些关键词将用于进行搜索。
选择合适的检索工具:根据你的信息需求,选择适当的检索工具,如图书馆目录、在线数据库、搜索引擎等。
获取和记录:获取选定的信息资源,并记录相关的详细信息,如作者、标题、来源、出版日期等。
分析和整理:对获取的信息进行分析、整理和归纳,以满足你检索策略的有效性和效率,对下一次搜索做出调整。
这些步骤提供了一个一般性的框架,但实际的检索策略可能因个人需求、搜索工具的特点和其他因素而有所不同。
信息检索策略与课题分析

用主题词检索往往能比用关键词检索得到更多 的检索结果。
2013
1.4 基本概念:关键词
概念
关键词是指那些出现在文献的标题(篇名、章节名) 以至摘要、正文中,对表达文献主题内容具有实质意 义的语词,亦即对揭示和描述文献主题内容来说是重 要的、带关键性的(可作为检索“入口”的)那些词 语。不加规范或只作极少量的规范化处理。
2013
2.4 时间范围
对文献发表的时间范围进行限定是检索中常用的策略 文献老化规律的应用 文献的半衰期:某学科领域现时还在利用的全部文献 中的一半是在多长的时间内发表的。例如:物理学文 献的半率期是4.6年,即是说:现时仍在利用的物理学 文献的50%,其出版年龄不超过4.6年。 学术信息的半衰期一般是3~5年。许多信息的老化如 艺术品、经济信息、市场信息等表现出跳跃性。有时 突然失效,有时永不失效。 查阅文献信息时尽量选取较新的文献。同时要顾及较 早的文献。一般性研究可选择近10年来的文献即可。 了解背景资料的则要长得多。 对发达国家的文献的利用可以在中文文献年限的基础 上增加3~10年。
2013
2.2.2.7 一般可以选择的词
表示具体事物名称的名词术语,如汽车、变压器、反 应堆、水稻、坐标仪等; 表示事物的状态或现象的名词术语,如强度、失真、 土壤熟化、日冕、船舶过载等; 表示科学分类的名词术语,如数学、物理学、中医学 、电子学、建筑工程、水利工程等; 表示研究方法、技术方法的名词术语,如分析(化学 )、针刺手法、有限元法、结构功能法、力学性能试 验等;
注意
一般是两个单元词(不可再分的词)组成一个关键词 ,如“金融危机”。如:“犯罪的心理”-->犯罪心 理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
13
隐性主题具体化
如:酸洗费液的处理 处理 处理:“回收”、“再生” 如:煤灰利用 具体利用:? 检索式:
(粉煤灰+煤炭)*(利用+砖+水泥+混凝土+路基+……)
14
找出核心概念,简化逻辑 关系
• 并不是概念越多越好! • 抓住主题的核心:最能表达检索课题内 容,而且具有实际检索意义的关键词。 • 如“利用稻米皮糠提取天然食品色素”
9
查找某概念的确切含义 如:什么是“blog”
1.1 检索需求类型
特征型知识: 一般通过事实 型、数值型数 据库和搜索引 擎获得。
查找某概念的背景知识 如:谁最先发现青霉素 查找某些事物的数值及量化指标
10
查找某一学科的一般知识 如:关于分子生物学有哪些专著 查找学科专业领域的新进展 如:有关纳米技术的研究综述 查找课题相关的专业文献 最常见的!
38
文献的半衰期:某学科领域现时还在利用 文献的半衰期 的全部文献中的一半是在多长的时间内 发表的。例如:物理学文献的半率期是 4.6年,即是说:现时仍在利用的物理学 文献的50%,其出版年龄不超过4.6年。 • 半衰期与文献的增长、学科差异、学科 发展的阶段和信息环境与需求有关。
• 表示工艺方法、加工技术的名词术语,如铸造、 锻造、热处理、焊接、酿造、取心钻进、爆破 成型、激光切割等; • 表示化学元素、化合物、金属材料与合金的 名词术语,如钠、氧原子、ⅣA族元素、钠化 合物、硅化物、硫酸、钛络合物、钉胺、呋喃、 吡啶、醇聚四氟乙烯、丁二酸(P)以及如金 属板耐蚀钢、耐蚀合金等; • 表示国家名称、地名、组织机构名称及人名 的专有名词以及文献类型、文献载体的名词术 语,
36
3.3 文献信息老化规律的应用
随着时间的推移,信息的价值会逐渐衰减 乃至失效。文献信息表现出老化规律。文献信 息老化的情形有: 所含信息仍有用,但现在已经被包含在其它更 新的文献中。 所含信息仍有用,但现在正处于人们对其兴趣 下降的阶段。 所含信息仍有用,但为后来的文献所超越。 所含信息不再有用。
29
–倒查法 •此法与顺查法相反,是按照时间范 围,利用选定的检索工具由近及远 地逐年查找,直到查到所需文献为 止。 •由于这种方法重点是查检近期文献, 所以能获得较新的文献信息,节省 检索时间。 •然而不如顺查法查全率高,容易产 生漏检的现象。
30
抽查法
• 是根据检索• 用这种方法能获得一批具有代表性、反 映学科发展水平的文献,检索效果和效 率较高,但必须熟悉学科发展的特点。
31
追溯检索法
• 也叫扩展法、追踪法。此法不是利用确定的检索工具, 而是利用已知文献的某种指引,如文献附的参考文献、 有关注释、辅助索引、附录等,追踪查找文献。 • 根据已知文献的指引,查找到一批相关文献;再根据 相关文献的有关指引,扩大并发现新的线索,去进一 步查找。如此反复追踪扩展下去,直到检索到切题的 文献。 • 用追溯法检索文献,最好利用与研究课题相关的专著 与综述,因为它们所附的参考资料既多且精。 • 在检索工具不全、文献线索很少的情况下,可采用此 法。
– 稻米、皮糠、提取、天然、食品、色素 – 稻米、色素
15
排除检索意义不大的词
• 排除检索意义不大而且比较泛指的概念
– 如:展望、发展趋势、现状、近况、生产工 艺、应用、利用、作用、方法、影响、制备、 结果
• 不要望词生义
16
明确概念间的逻辑关系
• 同义词、近义词是或的关系 • 上位词 即扩检,如“教育心理学” • 下位词 即缩检,如“智育心理”、“德 育心理”、“美育心理”、“教学心理 学”、“学习心理学”、“教师心理 学”、“学生心理学”等。
34
3.2 直接检索法
• 是指直接通过浏览、查阅文献原文而 获取所需文献信息的方法。这种方法 不依靠检索工具,所以不是严格意义 上的检索方法
35
• 优点:能够明确判断文献所包含的信息是否需要 –缺点:是难以获得全面的文献,且费时费力,具有 一定的盲目性和偶然性。 –如果检索课题单一,文献相对集中,又熟悉检索书 刊,可用这种检索方法。 –对于有多个主题、文献离散度较大的课题,则不宜 用此法 –由于直接检索具有准确性和实用性优势,能满足用 户直接获取文献的要求,因而是文献检索的必要手 段。
19
2.选择检索工具 了解检索系统
• 与检索主题相关的检索工具有哪些?* (主要看数据库的学科覆盖范围) • 与检索需求的文献类型相关的检索工具 有哪些?(如:哪些数据库或网站中含 有会议论文) • 语种、年限、结果形式(全文还是文摘) (如检索1989~1994年的文献,选择维 普还是CNKI)
•
•
3
2、信息语言
分类语言 以学科和专业集中文献 适宜族性检索 主题语言 能将不同 不同学科的信息集 中到一起 适宜特性检索
不利于新兴学科、交叉学 不利于新兴学科检索 科和边缘学科的检索 查全率不高 查准率不高
4
• 3、信息检索技术 • 计算机信息检索技术是用户信息需求和 文献信息集合之间的匹配比较技术。 • 布尔逻辑检索 截词检索、邻近检索 布尔逻辑检索、截词检索 邻近检索、 短语检索、字段检索 网络信息检索 短语检索 字段检索、网络信息检索 • 几乎所有的检索系统都有布尔逻辑检索、 截词检索(模糊检索)和限制检索,而不同 的检索系统又会有一些特殊的检索技术 和功能。
关联型知识: 文献数据库
11
1.2 主题概念分析
从熟悉的已知文献信息入手 • 分析检索课题的内容实质 • 找出隐性的主题概念并将抽象的主题概念转化 为具体的概念 • 找出核心概念,排除无关概念和重复概念,简 化逻辑关系 • 明确概念间的逻辑关系
12
例如:
• 从镀锌残渣中回收锌工艺?
– 实际是:从高品位镀锌残渣中分离铁 – 所以课题可以这样表述: “从锌块中分离铁”
27
回顾:信息检索方法
28
3.1 间接检索法(即检索方法)
• 间接检索法是借助于检索工具查获所需 文献的方法,包括顺查法、倒查法和抽 查法。 –顺查法 是经过分析,确定查找的起始年代, 再利用选定的检索工具由远及近地 逐年查找文献的方法。 •它适用普查一定时间的全部文献, 查全率较高,并能掌握课题的来龙 去脉,了解其研究历史、研究现状 和发展趋势。
32
追溯检索的更多应用
• • • • • • • 文章 参考文献 更多文章 文章 作者 文章 作者 文章 作者 团体 更多作者 文章 链接 网站 更多链接 期刊论文 图书 图书 期刊论文
33
追溯检索的作用
• 用较少的文献引出较多的文献 • 了解科学研究的前期工作基础、相关文 献、经典著作、主要作者、重点期刊等。
– 若多个下位词都用来检索,相对于一个上位 词来说,一般是扩检。 – 一个下位词相对于一个上位词来说,一般是 17 缩检。
如何选词
• 表示具体事物名称的名词术语,如汽车、变压 器、反应堆、水稻、坐标仪等; • 表示事物的状态或现象的名词术语,如强度、 失真、土壤熟化、日冕、船舶过载等; • 表示科学分类的名词术语,如数学、物理学、 中医学、电子学、建筑工程、水利工程等; • 表示研究方法、技术方法的名词术语,如分析 (化学)、针刺手法、有限元法、结构功能法、 本页面内容参考《汉语主题词表》 本页面内容参考《汉语主题词表 力学性能试验等; 》 18
23
如何了解一个数据库 样例:书生数字图书 书生数字图书
• 国内重要的数字图书之一 • 服务形式:WEB/镜像 • 涵盖学科或主题范围:所有学科 • 文献类型(出版形式、内容层次等): 电子图书,全文(一次文献) • 收录年限,收录对象: 2001~2003,纸本图书的数字化 • 数据量(记录数):11.4万 • 文种:中文 • 更新频率:年 • 访问模式:IP控制
第三讲 信息检索策略与信息需求分析
1
第一节 信息检索基本知识 • 信息检索中需要了解的 几个基础知识 1、信息特点 、 2、信息语言 3、信息检索技术
2
• 1、信息特点 、
• 文献信息分类特点 方便文献信息的排架,便于索取; 类目的结构严谨,逻辑性强; 适合学术信息资源的组织。 网络信息分类特点 根据网络信息的存在状况和当前上网用户的特点来编制的, 科学性、系统性稍差; 适合大众信息资源的组织。 数据库信息分类特点 结合文献信息分类和网络信息分类的优点 方便浏览和检索
25
2.4 如何获得数据库的检索帮 助与指南信息
• 一般数据库界面上都有“帮助”或者 “检索指南”。 • 图书馆等文献机构发布数据库时提供的 使用帮助。 • 通过Google等搜索引擎搜索。 如:filetype:ppt 中国期刊全文数据库
26
3. 确定检索途经,选定检 索方法
• 有什么样的检索标识或检索语言,就有 什么样的检索途经(检索标识:题名、 主题或关键词、摘要、全文、作者、机 构、分类、出版物名等)
37
老化规律应用---限定年限 的检索方法
• 在进行文献信息检索时,注意文献出版年的限 出版年的限 定。学术信息的半衰期一般是3~5年。许多 信息的老化如艺术品、经济信息、市场信息等 表现出跳跃性。有时突然失效,有时永不失效。 • 查阅文献信息时尽量选取较新的文献。同时要 顾及较早的文献。一般性研究 一般性研究可选择近5年来 一般性研究 的文献即可。了解背景资料 了解背景资料的则要长得多。 了解背景资料 • 对发达国家的文献 发达国家的文献的利用可以在中文文献年限 发达国家的文献 的基础上增加3~10年。
7
二 信息检索步骤
① ② ③ ④ ⑤ 分析检索课题,明确信息需求 选择检索工具,了解检索系统 确定检索途经,选定检索方法 实施检索策略,浏览初步结果 调整检索策略,获取所需信息
8
1、分析检索课题 明确信息需求
• 检索需求类型 • 主题概念分析 主题概念分析(注:是课题检索的重点和难点) • 检索目的(申报课题、开题报告、学术论文、成果查 新、课程论文、商业需求以及其它需求类型等) • 文献类型(期刊论文、会议论文、科技报告、图书、 专利、标准、网站等) • 结果形式(全文、文摘、题录、数值、事实等) • 检索年限(如2000年以来的文献) • 语种(中文、外文;英文、日文) • 检索结果数量(100?50?)