文献检索技术

合集下载

文献检索的技术有哪些

文献检索的技术有哪些

文献检索的技术有哪些
信息时代的来临,让传统的纸质文档存储信息的习惯向硬盘存储开始转变,越来越多的数据被转移在计算机上。

当数据量增多时,如何快速获取所需资源成为了人们研究的热点。

由此,检索技术应运而生。

目录式检索技术是通过手动或半自动形式收集信息资源,由专业人员浏览信息后,人工提取信息摘要,并按一定的规则存储所收集的信息。

信息主要是面向网站的,获得的检索结果是与查询需求有关的目录式信息集合。

目录式检索方式是一种相关性检索,由于人工的参与,检索结果比较准确、导航效果良好。

存在的弊端是由于依靠人工的分析与分类,会造成人员的大量损耗,并且信息不能得到及时的更新。

全文检索方式通过解析全文,扫描出每个词,为文档中的每个词建立对应的索引,并且包含该词出现在文档中的次数与位置信息。

当用户提出查询需求时,就可以根据索引来查找相关文档,与通过字典来检索字的方式相类似。

全文检索虽然构建索引数据库工作量会比较大,但是它提供更全面、精确的查询结果,一直是检索技术研究的关键。

科技文献信息检索技术的研究与应用

科技文献信息检索技术的研究与应用

科技文献信息检索技术的研究与应用一、引言信息时代的到来,使得文献信息的获取和应用变得越来越容易,各种文献信息检索技术也应运而生。

科技文献信息检索技术是一种针对科技文献的检索方法,可以帮助研究人员更快地找到所需的资料和信息。

本文主要探讨科技文献信息检索技术的研究与应用。

二、文献信息检索技术的概述文献信息检索技术是指利用计算机技术对大量的、复杂的文献信息进行检索,以解决相关问题的方法。

常见的检索方式包括自由检索、控制检索和混合检索。

自由检索是指用户通过输入关键词等搜索方式,在数据库中进行查找;控制检索则是根据预先设定的检索词表或者分类词表进行检索;混合检索则是将两种方式结合起来进行检索。

三、科技文献信息检索技术的发展历程科技文献信息检索技术的发展历程可以分为三个阶段:手工检索、电子检索和全文检索。

手工检索时代,人们主要依靠图书馆中的书籍和人工索引进行文献检索;电子检索时代,人们开始使用计算机进行文献检索,检索数据主要在本地存储;全文检索时代,人们可以方便地通过互联网搜索各种文献信息,同时支持全文检索,查询效率大大提高。

四、科技文献信息检索技术的应用科技文献信息检索技术在多个领域都有广泛的应用。

在科学研究领域,科技文献信息检索技术可以帮助研究人员快速查找到所需的文献信息,促进科学研究的发展;在医学领域,科技文献信息检索技术可以帮助医生快速获取到最新的医学文献和疾病诊断信息,提高医疗水平和质量;在市场营销领域,科技文献信息检索技术可以帮助企业了解市场动态和竞争对手情况,制定合理的营销策略。

五、科技文献信息检索技术的未来发展趋势随着科技的不断发展,科技文献信息检索技术将会出现以下几个发展趋势:一是信息检索的精确性和速度将会得到进一步提升;二是智能化技术的应用将会更加广泛,例如基于自然语言处理的文献检索;三是数据安全和隐私保护将会得到更加重视,以确保用户的隐私和信息安全。

六、结论科技文献信息检索技术的研究与应用已经取得了显著的成就,并在多个领域得到广泛的应用。

文献综述之信息检索技术

文献综述之信息检索技术

文献信息检索技术综述【摘要】介绍文献信息检索技术的发展过程,分析了网络文献信息检索的主要技术方法,以及今后文献信息检索的发展趋势。

【关键词】文献信息信息检索网络发展趋势一、前言据联合国教科文组织报道,目前世界上每年出版的文献已超过60万种,其中图书30万种,期刊15万种,其他形式的出版物15万种。

在我国仅期刊资源每年增长率就达到5% ~7%。

发表论文增长率为8%~9%。

面对如此巨量的文献资源,要从浩如烟海而又极其分散的信息中迅速、准确地查获自己所需要的信息资料,必须学会使用文献信息检索的方法。

文献信息检索,广义地说,是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要指出其中相关信息的过程,因此它的全称又叫“信息存储与检索”( Information Storage and Retriva1) 。

狭义地说,大多数人讲到信息检索时,一般只涉及“取”,即主要关注如何从存储的信息集合中快速获取各种需要的信息。

本文也主要从文献信息检索的概念、发展历史、主要文献检索方法及文献检索的发展趋势作一般概述。

二、文献信息检索技术的发展过程2.1手工检索方式检索方式主要以手工操作为主,这种检索既费时、费力,而且检索效率也很低。

其中包括纸质文献的检索和缩微式检索。

中国最早的检索工具是西汉刘向、刘歆父子整理编撰的摘要性书目《别录》和《七略》,世界上第一种文摘性科学期刊是1665年1月5日在巴黎创办的《学者周刊》以及著名的《美国工程索引》、《科学引文索引》、《科技会议录索引》等都属于手工检索工具。

2. 2脱机检索方式信息检索逐步实现了计算机检索中的单机批处理检索。

包括计算机可读文献磁带和磁盘检索以及光盘数据库检索。

机读磁带、磁盘检索实现了一种输入多种输出。

光盘数据库比磁带和磁盘有更大的存储空间,且存储速度更快,如《中国专利检索光盘》、《中国学术期刊全文数据库光盘版》等。

这是计算机检索的第一阶段。

2.3计算机联机检索方式进入20世纪70年代,计算机软、硬件技术不断进步,分组数字通信技术和实时操作技术发展迅速,出现了一台主机带多个终端的系统。

文献信息检索ppt课件

文献信息检索ppt课件

和B的文献,才算命中文献。

3、逻辑“非”
————————————————
AB
用符号“not”或“-”,其逻辑表达式为: A not B 或 A-B
其意义为:检索记录中含有检索词A,但不能 含有检索词B的文献,才算命中文献。

逻辑提问式(布尔逻辑组配):
计算机检索的基本技术,主要通过逻辑运算 符(布尔算符)“与(and,*)”、“或 (or,+)”、 “非(not,-)”等将检索词连接 的提问式。
注意:优先级为not, and, or,用括号保证优 先权;运算符两侧必须各有一个空格(半角)。
实例:
膜法提取甘露醇中的微生物污染控制 (膜法+膜集成)*甘露醇*(细菌污染+微生物污 染)
写出以下检索词,并用上述布尔逻辑符写出检 索式:
固氮和固碳的生化机理或基因机制
(二)、位置算符
在检索词之间使用,规定算符两边的检索词出现 在记录中的的位置,以提高检准率。比如:如果 不用with位置算符,则词组可能被系统识别为逻辑 运算,protein disulfide isomerase(蛋白质二 硫键异构酶)可能被识别成“protein AND disulfide AND isomerase”。尤其是出现数字等 符号时不易识别成词组。
AB
用符号“or”或“+”表示,其逻辑表达式为:
A or B
或 A+B
其意义为检索记录中凡含有检索词A或检索词B,
或同时含有检索词A和B的,均为命中文献。
例:
2、逻辑“与”
————————————————
AB
用符号“and”或“*”表示,其逻辑表达式为:
A*B

文献检索技术

文献检索技术

文献检索技术
文献检索技术是指在众多文献资源中寻找特定信息和文献的过程,是科研和学习过程中必不可少的一环。

文献检索技术的重要性在于,
其可以帮助我们快速、准确地获取所需信息,为我们的研究和学习提
供必要的支持。

文献检索技术的方法包括:关键词检索、分类码检索、题名检索、作者检索、文献类型检索等。

其中最常用的是关键词检索,这种检索
方式可以根据关键字搜索到包含该关键字的文献,并依据不同的搜索
引擎进行优化。

在文献检索过程中,我们需要准确定位我们所需的信息。

一般情
况下,我们可以通过选择合适的文献数据库来指定文献的范围,然后
通过不同的检索方法去搜索我们所需的文献。

同时也要注意关键词的
使用,避免使用太宽泛的关键词,以免搜索结果过多,影响搜索效果。

除了常规的文献检索方法外,我们还可以选择一些高级的文献检
索工具。

例如Endnote、Zotero等软件,这些软件可以根据我们的需
求自动收集文献,并可以对文献进行分类、管理和引用。

总之,文献检索技术对于知识分子来说是至关重要的,只有掌握
了良好的文献检索技术才能更好地开展学术研究和学习。

文献检索-第二章__文献检索基本知识

文献检索-第二章__文献检索基本知识

Z——综合性图书
O 数理科学和化学 (一级类目) O1 数学 (二级类目) O3 力学 O4 物理学 O6 化学 O61 无机化学(三级类目) O611 化学元素与无机化合物 (四级类目)

图书馆图书的排架与查询:

图书是按索书号排列在书架上的 图书查询先确定索书号 索书号:由图书分类号和书次号组成;分类号在上,书 次号在下。


⑶事实检索
事实检索以特定客观事实为检索对象,检索结果是某一具体 的、客观存在的事实。 如:查找“前事不忘、后事之师”最早的出处。

信息检索的类型

按照检索方式的不同,分为手工检索和计算机检索。

手工检索:用人工来处理和查找所需信息的检索过程。主要 依靠印刷型的二次文献,如文摘、目录等。
计算机检索:利用计算机和一定的通信设备查找所需的信息。 如联机检索和网络检索。
(2)主题途径
从文献中抽选出来的,代表文献内容实质词 汇——主题词,包括关键词、标题词、叙词等作 为检索标识,进行文献检索的一种途径。
(3)著者途径
根据已知文献著者(作者)的姓名来查找 文献的途径。
(4)名称途径
根据文献的名称来查找文献的途径。如: “书名目录”、“刊名目录”。
(5)序号途径
以文献的编号为特征编排和检索文献的途 径。如:“专利号索引”、“报告号索引”等。
(6)其他途径
有些检索工具还附有一些特殊索引,可提 供从特殊途径查找所需文献的线索。如《CA 》中的分子式途径、环结构式途径等。
3、文献的检索步骤
(1)分析研究待查课题
检索的目的是什么? 课题属于什么学科专业? 需要什么类型的文献?(中文,外文文献) 所需文献的年代范围等 另外,还需要了解与检索课题相关的专业背景知 识、有关的专业名词、术语等。

文献检索方法与技术3 第三节

文献检索方法与技术3 第三节
检索策略的调整方法: A .减少记录总数以提高查准率 查准率 将检索词的检索范围限定在篇名和叙词字段;利用逻辑非(NOT)去掉与 需求无关的字段;利用逻辑与进一步限定主题概念的相关概念;利用辅助索 引字段限定。 B. 扩大命中文献数量,以提高查全率 查全率 选择文摘字段检索,甚至是全文;在检索式中,将近义词、同义词和相关词 用逻辑或组配;利用截词检索;减少辅助索引字段限定。
检索实例
课题名称:氧化法处理工业废水 目的:了解国内该课题最新动态
1.分析研究课题,明确检索需求
主题: 主题:氧化 处理 废水 检索年代: 检索年代:2004-2007 学科: 学科:化学工程 语种: 语种:中文
关键词: 关键词:直接从文献的篇名或文摘或全文中抽取出来的非规范化检索词 如:《分子农业—— 一个大有发展前途的农业领域》 《分子农业 一个大有发展前途的农业领域》 关键词:分子农业;转基因植物;医用蛋白质;生物多聚体 关键词:分子农业;转基因植物;医用蛋白质;
3、作者检索 、
作者检索是从文献的作者姓名出发来检索其文献。 “作者” 作者检索是从文献的作者姓名出发来检索其文献。 作者” 广义上还应包括:汇编者、编者、主办者、译者等,此外, 广义上还应包括:汇编者、编者、主办者、译者等,此外,还有 代表机构、单位的团体作者,包括作者所在单位。 代表机构、单位的团体作者,包括作者所在单位。
4、名称检索 、 名称检索点是从各种事物的名称出发来检索文献信息。 名称检索点是从各种事物的名称出发来检索文献信息。 这些名称包括:书名、刊名、资料名、出版物名、出版社名、 这些名称包括:书名、刊名、资料名、出版物名、出版社名、会议 物质名称等等,也包括人名和机构名。 名、物质名称等等,也包括人名和机构名。 书名目录、馆藏目录普遍使用书名、 书名目录、馆藏目录普遍使用书名、刊名等出版物名称作为其检索 而论文、文章篇名一般不用作检索点。 点,而论文、文章篇名一般不用作检索点。 而在一些期刊全文数据库中,刊名,文章篇名都是检索点。 而在一些期刊全文数据库中,刊名,文章篇名都是检索点。

常见的信息检索技术与文献检索应用-文献检索论文-图书档案学论文

常见的信息检索技术与文献检索应用-文献检索论文-图书档案学论文

常见的信息检索技术与文献检索应用-文献检索论文-图书档案学论文——文章均为WORD文档,下载后可直接编辑使用亦可打印——引言检索技术的应用是在图书馆建设发展过程中对电子资源查询和整合的重要方式,也是提高学生信息素养和技能的必要手段。

因此,检索技术的应用是教育界十分关注的课题。

1 高校文献检索技术的发展情况从目前来看,我国多数高校图书馆电子资源建设及其文献检索教学处在一个相对基础的阶段,检索技术运用程度还很浅显,并不能全面满足用户的需求。

因此,非常有必要对当前几种重要的检索技术进行分析探讨,以此提升电子资源建设中检索技术运用的程度,从而让用户快速有效查询其所需要的信息,如果高校图书馆想实现这一目标,首先要对图书馆数字资源建设中存在的分布式异构存储问题进行解决。

唯有真正的解决了这个问题,才能够为用户提供一体化服务体验,从而全面满足用户的需求。

2 目前常见的信息检索技术2. 1 SFX 技术SFX 即通常所说的特效。

这是一种新型的数字资源聚合软件系统。

其最早是由比利时的H萨姆堡尔等人提出。

后随着更多学者的加入,才实现了该信息系统建设方面的进一步优化。

这种技术的诞生在行业内备受关注,同时也吸引了诸多数字图书馆的目光。

目前在全球来说,使用这种技术的用户已经达到了将近2 000家。

作为一种相对成熟的聚合技术,SFX 发展基于OpenURL 协议展开。

借助这个协议,可以实现将各种复杂的数据进行整合,从而将数据的检索方式统一化[1]. 用户在进行资源的使用和处理的过程中可以实现对资源的不同转化。

从一种资源转化到另外一种资源。

借助这种OpenURL 协议,用户只需要简单的几步处理就能够实现资源的搜索。

而OpenURL 协议的优势表现在以下几个方面:1)OpenURL 技术通过协议实现数字资源的无限扩大,任何资源都能够能够通过这种方式实现链接聚合;2)在进行检索的过程中,OpenURL 协议的使用可以更好的实现资源间的互补兼容,提升整个信息资源搜索的效率。

文献信息检索的基本原理

文献信息检索的基本原理

文献信息检索的基本原理引言随着信息时代的到来,大量的文献资料被创造和积累,如何高效地获取所需信息成为了一个重要问题。

而文献信息检索作为信息管理领域的重要研究方向,旨在通过系统化的方法,从庞杂的文献数据库中获取所需信息。

本文将介绍文献信息检索的基本原理。

一、文献信息检索的定义和目标文献信息检索是指通过检索系统,根据用户的需求,从文献数据库中获取相关信息的过程。

其目标是提供准确、全面、高效的检索结果,满足用户的信息需求。

二、文献信息检索的过程1. 信息需求分析:用户在进行文献信息检索前,首先需要明确自己的信息需求。

这包括确定检索的主题、关键词和检索条件等。

2. 文献数据库选择:根据用户的信息需求,选择适合的文献数据库进行检索。

常用的文献数据库包括PubMed、Web of Science、Google Scholar等。

3. 检索策略制定:根据用户的信息需求,制定合适的检索策略。

这包括选择合适的检索词、运用逻辑运算符、设定检索限制条件等。

4. 检索系统操作:根据制定的检索策略,在选定的文献数据库中进行检索操作。

这包括输入检索词、设定检索条件、点击检索按钮等。

5. 检索结果评估:根据检索结果的相关性和质量,对检索结果进行评估。

一般来说,相关性越高、质量越好的结果越能满足用户的信息需求。

6. 结果展示和选择:根据评估结果,展示检索结果并供用户选择。

用户可以根据自己的需求选择符合要求的文献进行阅读和引用。

三、文献信息检索的关键技术1. 关键词提取:根据用户的信息需求,从文献数据库中提取关键词。

关键词的选择要准确、全面,能够涵盖主题的各个方面。

2. 逻辑运算符的使用:通过逻辑运算符的组合使用,提高检索结果的准确性。

常用的逻辑运算符包括AND、OR、NOT等。

3. 检索词的扩展:通过使用同义词、近义词等方式,扩展检索词的范围,提高检索结果的覆盖面。

4. 检索限制条件的设定:根据用户的需求,设定检索限制条件,如时间范围、文献类型等,以缩小检索结果的范围。

文献信息检索技术与方法

文献信息检索技术与方法

文献信息检索技术与方法
文献信息检索技术与方法是指利用各种信息资源和技术手段,对特定
的主题进行检索与获取相关文献的过程。

随着互联网的普及和数字化技术
的飞速发展,文献信息检索技术与方法得到了广泛应用。

本文将介绍文献
信息检索的流程、常用的检索工具与技术、以及检索策略的制定等方面。

在文献信息检索中,常用的检索工具包括图书馆的联机公共查阅工具、数据库和互联网上的引擎。

图书馆的联机公共查阅工具是指利用图书馆提
供的检索系统查找馆藏文献的工具,如OPAC(Online Public Access Catalog)系统。

数据库是指将大量的文献数据进行整理和组织,并提供
检索接口的在线资源。

常用的数据库包括学术期刊数据库(如Web of Science、Scopus)、学位论文数据库(如ProQuest Dissertations & Theses)、专利数据库(如Google Patents)等。

互联网上的引擎是通
过互联网对网页进行爬取和索引,用户可以通过输入关键词进行,如谷歌、百度等引擎。

综上所述,文献信息检索技术与方法是研究人员获取相关文献的重要
手段。

合理选择检索词、选择合适的检索工具以及制定恰当的检索策略是
提高文献信息检索效果的关键。

文献信息检索技术与方法的应用,能够为
研究人员提供及时准确的信息支持,促进科学研究的进展与发展。

文献信息的检索原理、方法及技术(不完整)

文献信息的检索原理、方法及技术(不完整)

计算机与通信学院 陈多
检索方法 1.基本方法 ⑴ 常用法:该方法利用现有的各种文献检索工
具查找文献信息,这是文献检索中经常用到的 方法,可细分为: 顺查法倒查法 ③抽查法 ⑵ 追溯法 ⑶ 循环法 2.排检法 ⑴ 字顺法: ⑵ 类序法⑶ 自然顺序法
计算机与通信学院 陈多
3.数据库与网络资源的检索方法 ① 快速检索 ② 专业检索 ③ 期刊导航检索⑥高 级检索 计算机检索技术 利用数据库和网络资源的主要检索技术有:逻辑 组配检索、截词检索、位置运算符检索、限制 检索。
计算机与通信学院 陈多
⑵二次检索:是在上一次检索的文献结果基础上, 改变检索概念或检索标识进行再次检索,缩小 检索范围、筛选文献的方法。二次检索可反复 进行。 ⑶用索引工具:索引是检索工具中的辅助性工具, 常称为检索的入口,检索工具书中各种索引都 是条目式的简捷明了,数据库中的索引体现为 检索途径。
计算机与通信学院 陈多
⑴ 应分析待查项目的目的、意义、背景 ⑵ 明确研究课题的内容、性质,分析已知情报 ⑶ 划定检索的文献类型与时限范围 2.选择检索工具 3. 确定检索途径和检索标识 检索点或叫检索入口
计算机与通信学院 陈多
描述文献外部特征 对应的检索途径 责任者 责任者检索途径 题名(书名、篇名等) 题名途径 文献代码(如标准号、专利号等) 代码途径 引用文献 引文途径 出版日期、出版地 年代途径
第4章 文献信息的检索原理、方法 及技术
信息检索的原理是什么? 信息检索的方法有哪些? 信息检索的基本步骤是什么?
计算机与通信学院 陈多
4.1文献信息检索的原理
“匹配”—— 文献信息的检索原理是将检索提问标识与存 储在检索工具中的标引标识进行比较,当检索 提问标识与标引标识概念相一致,经过检索系 统的运算查检后就会命中相关的信息,输出理 想的文献信息结果。

文献信息检索实用教程 第三版 第4章 文献信息的检索原理、方法及技术

文献信息检索实用教程 第三版 第4章 文献信息的检索原理、方法及技术
谢谢~~
新世纪应用型高等教育基础类课程规划教材
文 献 信 息 检 索 实 用 教 程 (第三版)
目录
CONTENTS
第4章 文献信息的检索原理、方法及技术
4. 1 文献信息的检索原理 4. 2 文献信息的检索方法及技术 4. 3 文献信息检索的步骤 4. 4 文献信息检索的效果分析
第4章 文献信息的检 索原理、方法及技术
间和精力查出与课题相关的资料。
第4章 文献信息的检 索原理、方法及技术
4. 4 文献信息检索的效果分析
衡量检索效果的指标有查全率、查准率、漏检率和误检率,其中查全率、 查准率是两项主要评价指标。
查全率=检出的相关文献量/检索系统中相关文献总量
查准率=检出的相关文献量/检出文献总量
第4章 文献信息的检 索原理、方法及技术
3.数据库检索的方法
01 检索词的确定
02
编制规范合理的检 索式
03
选择检索系统和数 据库
第4章 文献信息的检 索原理、方法及技术
4. 3 文献信息检索的步骤
分析待查项目,明确主题 概念
选择检索工具
确定检索途径,填入检索词 或检索表达式
选择检索方法
调整检索策略,筛选文献 结果
查找文献线索,索取原文
第4章 文献信息的检 索原理、方法及技术
4. 4 文献信息检索的效果分析
4.4.3 提高文献检索效果的途径
(1) 选择好检索工具或检索系统。
(2) (3) (4) (5)
准确使用检索语言。 善于利用各种辅助索引。 通过打一检和缩检.提高查全率和查准率。 提高检索策略的制定水平。
新世纪应用型高等教育基础类课程规划教材
4. 2 文献信息的检索方法及技术

文献检索实用技术第十章 检索策略的编制技术与综合实训

文献检索实用技术第十章  检索策略的编制技术与综合实训
制检索策略,要从检索前、检索 中和检索后 3 个阶段进行全盘规划,还 要预判可能产生的各种问题。
科学地编制检索策略,需要掌握一 定的技巧。
三、检索策略的编制实例
第三节 综合实训·信息的创新和创造
一、科学研究与论文信息检索 二、创新创业与专利信息检索
1.创新与专利检索实例 2.创业与专利检索实例
第十章 检索策略的编制技术与综合实训
第一节 检索策略的编制技术
一、文献检索策略概述
文献检索策略,从广义的角度出发, 是指为实现检索目标而制定的全盘计划和 方案。
从狭义的角度来说,是指检索途径的 选择和检索式的编制。
制定检索策略,主要是选好检索途 径、构造检索式及选择合适的数据库。
一般使用数据库的基本检索方式就 可以完成检索任务。

文献检索名词解释

文献检索名词解释

文献检索名词解释
文献检索名词解释
1.文献检索
文献检索是指在数据库和信息库中搜索特定信息的过程,包括检索文献来源、文献类型、关键词和主题等。

文献检索技术是建立在信息学基础上的,包括信息检索技术、数据库技术和智能化技术等,用于检索学术文献、信息资料等。

2.关键词
关键词是指检索文献时重要的概念性单词,也叫检索词或搜索词,可以帮助搜索数据库中的文献,关键词主要是从文献的主题和内容上抽取的,它通常代表了文献的主题和内容。

3.数据库
数据库是一种以计算机的技术手段,按照数据结构和数据定义的管理方法,对数据进行有组织的存储、管理、检索、访问和使用的系统。

许多文献检索中所使用的数据库,都是由不同的研究机构或者学术机构开发的,它们应用了自己的体系结构、检索语言、检索限定符等等,以满足用户的检索需求。

4.检索语言
检索语言是指检索特定文献信息时使用的特殊语言,它以可识别的措辞组织检索词和检索条件,帮助用户在数据库中完成检索。

常见的检索语言包括Boolean检索语言和拼音检索语言等。

5.检索限定符
检索限定符是一种特殊的检索方法,可以用在某个特定的信息数据库中。

它通过规定检索条件,把检索范围限定在特定的范围内,从而节省检索时间,提高检索效率。

常见的检索限定符有关键词、发表日期、作者、文献类型等。

传统的文献检索技术有哪些

传统的文献检索技术有哪些

传统的文献检索技术有哪些
随着网络的发展,国家数宇图书馆建设的推进,各种信息如学术论文、期刊、杂志等都披上网络的外衣,以电子的形式存储在各处,网络上的信息是益增多。

传统的信息检索技术可以分为基于关键字的检索和概念。

信息检索两类。

基于关键宇的检索技术,利用关键宇匹配的方式来进行检索。

它存在如下一些问题:用户对自己所需的信息无法准确地用关键宇表达,而基于关键宇匹配进行检索的机制无法准确地搜索出用户所需的信息;对于一样的概念,不同的用户可能会有不同的表达方式,关键宇匹配无法解决多词同义,一词多义地问题,导致无法全面准确解析用户需求,漏掉了很多有用信息:关键宇匹配其实是基于宇符形式的匹配,它不考虑语义,导致检索出很多无关信息,大量的无关信息使用户淹没在信息的海洋。

概念信息检索对信息进行语义上的处理并形成一个概念库,然后检索概念库中的相关信息得到检索结果。

它克服的关键宇检索的一些局限性但是它不包含概念间的关系,因此无法进行很好的推理。

传统检索技术缺乏必要的智能,无法满足用户日益增长的检索的需求。

为了能提高搜索的查全率下查准率,从海量的数据中为用户快速检索出所需信息,引入了哲学中本体的概念,对应用领域进行建模,将以前只能为人所理解的知识表示形式改为让计算机也能理解的形式,为网络中存储的知识加上语义,从而使得机器可以对这些知识进行搜集整理,将人们从繁重的搜索任务中解放出来,描述逻辑作为本体语言OWL 的形式化基础,使精确刻画知识的语义成为可能。

学术资源检索-CNKI文献检索技术

学术资源检索-CNKI文献检索技术

上机二学术资源检索1.1上机目的(1)掌握CNKI中文科技文献检索技术;(2)掌握ScienceDirect英文文献检索技术;(3)掌握NoteExpress的基本操作。

1.2上机内容按照上机实施步骤进行搜索引擎使用练习。

1.3上机操作步骤1.3.1CNKI文献检索技术1.3.1.1CNKI简介CNKI是国家知识基础设施(National Knowledge Infrastructure)的简称,其概念由世界银行提出于1998年。

CNKI工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于1999年6月。

在党和国家领导以及教育部、中宣部、科技部、新闻出版总署、国家版权局、国家计委的大力支持下,在全国学术界、教育界、出版界、图书情报界等社会各界的密切配合和清华大学的直接领导下,CNKI工程集团经过多年努力,采用自主开发并具有国际领先水平的数字图书馆技术,建成了世界上全文信息量规模最大的“CNKI数字图书馆”,并正式启动建设《中国知识资源总库》及CNKI网格资源共享平台,通过产业化运作,为全社会知识资源高效共享提供最丰富的知识信息资源和最有效的知识传播与数字化学习平台。

CNKI工程的具体目标,一是大规模集成整合知识信息资源,整体提高资源的综合和增值利用价值;二是建设知识资源互联网传播扩散与增值服务平台,为全社会提供资源共享、数字化学习、知识创新信息化条件;三是建设知识资源的深度开发利用平台,为社会各方面提供知识管理与知识服务的信息化手段;四是为知识资源生产出版部门创造互联网出版发行的市场环境与商业机制,大力促进文化出版事业、产业的现代化建设与跨越式发展。

1.3.1.2专用浏览器CAJViewerCNKI默认的期刊的文件格式为CAJ,学位论文的格式为NH或者KDH,这几类文件属于清华同方自己开发的文件格式,浏览器为CAJViewer,因此在若要阅读从CNKI下载的文献,首先需要安装该浏览器。

第三章 文献检索技巧

第三章 文献检索技巧

(四)其他检索技术:
字段限定:指将检索词限定在某个或某些字段中。可通过下拉菜
单选择检索字段,也可输入检索字段符来限定检索字段。
例如:AU=Smith,表示要查找著者Smith发表的文献。
词组检索:使用
“ ” 双引号将检索词组锁定,进行精确查找。
匹配度选择:“精确匹配”与“模糊匹配”。
第三节 文献检索流程
其扩展为(nN),表示其两侧的检索词之间最多可插入n个词,
位置可颠倒。
例如:“computer (N) network”,其检中记录可包含 “computer network”或“network computer”。
3.字段级位置算符
表示两侧的检索词必须出现在同一字段中,词序不限。
Field:“air(F)pollution”表示air与pollution必须在同一个段落中出现 Same:“Ad=(CAS same Shenzhen ) ”表示CAS 与 Shenzhen 必须同时 出现在地址字段中
摘数据库,掌握国外研究进展。同时,利用Web of science和Ei的分
析功能把握该领域的专家、核心研究机构、重要期刊等信息;并利用 数据库的个性化功能,对信息进行定期跟踪检索,随时了解课题的最
新研究进展,以便在论文写作Link、EBSCO等全文期刊数据 库,一方面补充文摘库的检索,一方面获得全文。
优先算符:用()表示。
在含有多个运算的检索式中,可以用()将需要优
先运算的部分括上,系统会优先运算()中的部分, 然后再按照not, and, or的顺序进行运算。
如: (behaviour or behavior) and human
※逻辑算符的优先级为()>NOT>AND>OR

读秀学术搜索_文献检索实用技术_[共4页]

读秀学术搜索_文献检索实用技术_[共4页]

◆◆_______

____________________________________________

____
◆◆◆第五章 论文检索系统
·77·六、跨库检索
跨库检索是指利用一种检索策略,在多种数据库中同时进行匹配,并一次性输出命中
结果的检索方式。

在万方知识服务平台的期刊全文数据库的学习中,介绍过跨库检索的使用方法。

中国知网的跨库检索的使用方法,同万方的跨库检索的使用方法基本相同。

示例13:利用中国知网的跨库检索功能,查找关于“生物制药”方面的硕博士论文及国内外会议论文信息。

检索步骤如下。

◆通过校园网,登录中国知网主页,点击“文献”后,再点击“跨库选择”。

如图5-52所示。

图5-52 跨库检索界面
◆填选检索策略。

检索途径选择“主题”,检索式输入“生物制药”,跨库选择中选取的数据库包括“博士”、“硕士”、“国内会议”、“国际会议”。

如图5-53所示。

图5-53 填选检索策略
◆点击“检索”键,显示命中文献数量及列表,命中文献615条。

如图5-54所示。

图5-54 命中文献数量及列表。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

6 小结

检索中逻辑算符使用是最频繁的,对逻辑算符使 用的技巧决定检索结果的满意程度。 用布尔逻辑表达检索要求,除要掌握检索课题的 相关因素外,还应在布尔算符对检索结果的影响 方面引起注意。


另外,对同一个布尔逻辑提问式来说,不同的运 算次序会有不同的检索结果。布尔算符使用正确 但不能达到应有检索效果的事情是很多的。
computing,computation,computerisation 等。
(3)后截词主要使用在如下4个方面

词的单复数,如book?,potato??; 年代,如198?(80年代),19??(20世纪); 作者,如用Lancaster*可检出所有姓Lancaster的作 者; 同根词,如用biolog*,可检出biological、 biologist、biology等同根词。
6)“(s)”——同句检索

含义: “(s)”算符中的S含义为“Sentence”。 这个算符表示其两侧的检索词必须在同一自然句 子(子字段)中出现,两词的词序可以颠倒。 放宽了词位置检索的要求,使表达同一概念但不 满足词位置条件的文献也可以被检索出来,从而 提高了查全率。

以上介绍的各种位置算符,按照限制程度的大小, (W)、(nW)最强,(N)、(nN)次之,(S)再次之。 当(nN)的n ≥10时,其作用已经相当于(S)。
physicochemistry、thermochemistry等。
四、字段限定检索

含义:限定检索词在数据库记录中的一个或几个字段范围 内查找的一种检索方法。(规定的字段范围内出现的信息 方为命中信息的一种检索方法。)

适用于在已有一定数量输出记录的基础上,通过指定字段 的方法,减少输出篇数,提高检索结果的查准率。由于字 段限制采用前缀和后缀的形式,又可称为前缀限制和后缀
检索,再与B进行AND运算。
5 注意事项 1)有的检索工具以符号形象地表达布尔检索的功能, 如“+”表示逻辑与,“-”表示逻辑非。有的检索 工具直接把布尔逻辑隐含在菜单中,例如,Lycos以 “match all terms”表示逻辑与,以“match any term”表示逻辑或。绝大多数检索工具的高级检索 完全用表格和文字来表达布尔关系,如,Excite以 “必须包括(MUST contain)”表示逻辑与,用 “一定不含”(MUST NOT contain)表示逻辑非。 有的检索工具部分支持布尔关系,如Yahoo!尚不支 持逻辑非。
三、 截词检索技术

含义:用截断的词(词的片段)的一个局部进行
的检索,并认为凡满足这个词局部中的所有字符 (串)的文献,都为命中的文献。

检索者将检索词在合适的地方截断,然后截出的 片断进行检索。
原因:

由于西文的构词特性,在检索中经常会遇到名词 的单复数形式不一致;同一个意思的词,英美拼 法不一致;词干加上不同性质的前缀和后缀就可 以派生出许多意义相近的词等等。

例如:检索含有检索项A 或检索项B 的文献,可表
3 逻辑“非” 含义:排除含有某些词的记录的,即检出的记录 中只能含有NOT算符前的检索词,但不能同时含 有其后的词。


基本作用:用于从某一检索范围中排除不需要的 概念。这种组配可以缩小检索范围。
用“NOT”或“-”表示,但在检索时建议使用NOT, 以避免与词间的分隔符“-”混淆。
例如:在含有概念A 的文献集合中,排除同时含有
概念B 的文献,可表示为:“A NOT B”或
“A-B”。
4 运算优先级

运算优选级顺序为(),NOT,OR ,AND ; 可以用括号改变它们之间的运算顺序。通常在有 括号的情况下,括号内的逻辑运算先执行,有多 层括号时,先执行最内层的括号。
例如:(A OR D) AND B,表示先执行“A OR D”的
第3讲 文献检索技术
2005.7
一、布尔逻辑检索技术

在检索实际中,检索提问涉及的概念往往不 止一个,而同一个概念又往往涉及多个同义 词或相关词。 为了正确地表达检索提问,系统中采用布尔 逻辑运算符将不同的检索词组配起来,使一 些具有简单概念的检索单元通过组配成为一 个具有复杂概念的检索式,用以表达用户的 信息检索要求。
2)用布尔逻辑表达检索要求,除要掌握检索课题的相关因 素外,还应在布尔算符对检索结果的影响方面引起注意。 布尔算符使用正确但却不能达到应有检索效果的例子很多。 OR逻辑 有些检索词表达的概念,存在整体与部分的关系。在检索 中,这类关系如果处理不好,就不能得到满意的检索效果。 对此,一般原则是,如果检索词涉及到表达整体的概念, 就要针对具体情况分别列出每一个表达部分概念的检索词, 否则将出现漏检。 NOT逻辑 在检索逻辑中使用NOT,能排除含有由NOT指定的检索词的 文献,协助检索出更准确的文献。但是,使用NOT必须慎 重。因为, 如果两个关系紧密的检索词同在一个检索逻 辑中,对其中一个使用NOT逻辑会导致含另一个词的文献 也被排除。

processing of Egyptian cotton
5)“(F)” ——同字段检索 含义:“(F)”算符中F的含义为“Field”。这 个算符表示其两侧的检索词必须在同一个词段中 出现,(例如;同在题目字段或文摘字段)词序不 限,中间可插任意检索词项。 例如: POLLUTION (F) CONTRON 可命中 Contron and management of industrial pollution 同在题目中 (F)邻近算符与AND布尔逻辑主要区别在于:(F)使 两个检索项在同一字段,AND布尔逻辑中两个检索 词会发生在不同字段中。
注意
(1)有限截断比较精确,只检索出用户需要的词汇; (2)使用时无限截断必须注意:词干不要太短,否 则会检出许多无关的文献; (3)应尽量选用不会引起误检的截断词。
2 中间截词(中间屏蔽)

将提问字符串中间的字符用符号代替,主要用于英式美式不同拼法的英文 单词,或单复数不同的单词。 截词符具有“OR”运算符的功能,能够扩大检索范围,而且减少了输入检索 词的时间,节约了机时。
2)“(nw)” “(nW)”中的“W”的含义为“Word”,它允许两词间 插入最多为n个其他词,包括实词和系统禁用词, 词序不变。 例如: communication (2W) satellite 则会检出 communication satellite communication though satellite communication on the satellite

1 逻辑“与”

含义:检出的记录必须同时含有所有的检索词。 基本作用:一种用于交叉概念或限定关系的组配, 可以缩小检索范围,有利于提高检索的专指性。 用and 或*表示 示为:“A and B”或“A*B”

例如:查找同时含有概念A 和概念B 的文献,可表
2 逻辑“或”

含义:检出的记录中,至少含有两个检索词中的 一个。 基本作用:用于具有并列概念关系的组配。这种 组配可以扩大检索范围,提高查全率。可以避免 了命中文献的重复出现。 用OR 或“+”表示 示为:“A OR B”或“A+B”
为了保证查全,就得在检索式中加上这些具有各 种变化形式的相关意义的检索词,这样就会出现 检索式过于冗长,输入检索词方式
(1)按截断的字符数量来分:有限截断和无限截断 有限截断:有具体截去的字符数。 无限截断:不指明具体截去的字符数。 (2)按截断的位置区分:后截断、前截断以及中间截断。 (3)截断常使用截断符号,各检索系统所使用的截断符号 有所不同,常用的符号有 “?”,“$”,“#”以及 “ *” 。以下举例中用“?”来表示有限截断,用“*” 表示无限截断。
3 前截断(后方一致或左截断)

前截断检索常用于复合词。 例如:?computer表示minicomputer, microcomputers等。

前截断与后截断也可以组合起来使用。
例如: *chemi* 可以检出下列词汇 chemical、chemistry、chemist、
eletrochemical、electrochemistry、
(1)词尾的有限截断

例如:用system??可以查出sytem 和systems 的文献。

例如:??表示两个字符,???表示三个字符,以此类推。
(2)词尾的无限截断

相同字符串后可能变化任何字符串时,则在其后 使用一个“?”。这种方法可以查找出含有相同字 符串的所有检索词。
例如: comput? 可查出compute , computer ,
注意:不同的数据库所用的截词符不一样,使用应先查
一下各数据库的帮助加以确认。
1 后方截词(前方一致或右截断)

含义:将截词符放在一串字符的后面,用以表示以 相同字符串开头,而结尾不同的所有词。
相同字符串后可能变化一个字符时,则在其后使用一个“?”、 空格、再加一个“?”,常用来表示检索词的单复数变化。 相同字符串后可能变化两个以上字符时,则在其后连续使用 若干个“?”代替可能变化的字符。
3)“(N)”

含义:“(N)”中的N含义为“Near”。表示其两侧 的检索词必须紧密相连,除开空格和标点符号外, 不得插入其他词或字母,两词的词序可以颠倒。
4)“(nN)”

含义:“(nN)”是“(N)”算符的变形,不同之处为 允许两词间插入最多为n个其他词,包括实词和系 统禁用词。
例如: COTTON (2N) PROCESSING 则命中: Cotton processing; processing of cotton;

例如:“ woman ” 和“ women ” , 可用“ wom?n” 代替; “ defence ” 和“ defense ” 可用“defen?e”代替。 检索时为防止漏检可用中间屏蔽的检索方法: m?n wom?n organi?ation defen?e 当然使用中间屏蔽的方法也要注意是否可能误检其它词汇的 文献。
相关文档
最新文档