检索原理及技术信息检索PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
邻位检索之二
(N)与(nN) : 两词之间不能插入任何词(或可以插
入n个词)但词序可以颠倒。
例如: air ( N ) pollution
网络数据库:NERA 、SAME
特点:限制检索词之间的位置关系,提高查准率。 NERA表示两词之间不得多于9个词,词前后位
置任意;(EI) SAME要求检索词在同一个句子中,检索词在句
查准率
利用检索系统进行某一课题检索时,检 出的相关信息量(w)与检出信息总量(M) 的比率称为查准率(P ),用公式表示如下: P=( 检出的相关信息量W/检出的所有信息量 M )×100%
三、检索步骤
1、明确检索目的。 2、对检索课题进行分析,找出检索词。 3、制定检索策略(包括选检索系统、选检
索途径、编制检索提问式)。 4、区分文献类型。 5、整理信息线索,索取原始文献。
第2节 信息检索技术
一、检索技术 1 布尔检索:见教材 2 近义检索:见教材 3 截词检索:见教材 4 限制检索:见教材
二、检索技术应用 三、如何选用关键词
1 布尔检索
布尔逻辑算符的形式及含义 (1)逻辑与 (2)逻辑或 (3)逻辑非
查准的要求
二.检索技术的应用 ■中文科技期刊全文数据库
传统检索方式
‘逻辑与’检索
逻辑或检索
限制检索
检索技术在CNKI中的应用
布尔检索,限制检索
逻辑与
1、概念:逻辑与是一种具有概念交叉或概念限 定关系的组配。 2、算符:“ * ” 或 “ AND ”,并且 3、特点:增强了专指度,提高了查准率。 4、例:“微波” AND “通信”
逻辑或
1、概念:逻辑或是一种具有概念相同,概念 相关的组配。 2、算符: “ + ” 、 “ OR ”、“或者” 3、特点:扩大检索范围,提高了查全率。 4、举例:“ 废水 ” OR “ 污水
中截词
允许检索词中间有若干变化形式 例如:wom*n wom?n woman woman women women
常用于美英拼写法不同和名词单复数不一样 的情况
4、限制检索技术
概念:限制检索是将检索词限制在特定的范 围内检索。 常用的限制检索有:字段、文献类型、语种 年代。 特点:限制查找的范围,满足课题对查全、
词位检索之一
(W)与(Nw) :
两词之间用“W”,表示其相邻关系。词之 间不允许插入其它词和字母,但允许有一空格 或标点符号。词序不能颠倒。
SICHUAN (W) UNIVERSITY
nW
两词之间用“nW”,词之间允许(非必 需)插入n个其它词和字母,词序不能颠 倒。
例如: laser(1w)printer
第3章 检索原理及检索技术
四川大学图书馆
目录 第1节 信息检索原理 第2节 信息检索技术
第1节 信息检索原理
一、信息检索类型 二、信息检索的效率 三、信息检索步骤
一、信息检索的类型
1、文献信息检索 2、数据信息检索 3、事实信息检索
1、文献信息检索
书目信息检索 全文信息检索
书目信息检索
以标题、作者、原文来源、摘要及 收藏地点为检索对象的一类检索称 之为书目信息检索。
1)有限右截词:主要用于词的单复 数,动词的词尾变化等。
截词符“ ?”—截几个字符,就在词根后加 几个“?”。
Book? ? Book Books
2)无限右截词:主要用于同根词。在词根后加一 个“ ?” 或 “ * ” ,可检出含有该词根的所有 记录。
Computer? Computer Computers Computering Computered Computerization
逻辑非
1、逻辑非是一种具有概念排除关系的组配。 2、算符: “ - ” 、 “ NOT ”、不包含 3、特点:排除不需要的概念,提高查准率,但影 响查全率。 4、举例: “制药废水 NOT 放射废水”
布尔逻辑组配图
(a)逻辑与
A
(b)逻辑或 (c)逻辑非
A=619 B=23290 A AND B=54
A=341 B=76 A OR B=364
A=25283 B=4945 A NOT B=2431
工程索引—EI
返回
中国知识产权局网站——中国专利检索
2、词位检索
词位检索具有限定检索词的词与词之间 位置关系的功能,可弥补布尔逻辑算符 只是定性规定检索词的范围,不确定相 互位置和顺序的缺陷。以提高检准率。
信息检索效率是评价一个检索系统性能优劣的 质量标准,它贯穿于信息的存Baidu Nhomakorabea和检索的全过 程。包括检索系统的可利用性,信息资源的可 利用性和可获得性,检索系统之检索技术的可 利用性和友好性。其评价的具体指标是
查全率 查准率
查全率
利用检索系统进行某一课题检索时,检出的相关 信息量(w)与该系统中存储的相关信息量(X) 的比率称为查全率(R),用公式表示如下: R= ( 检出文献W/系统中存储的文献X ) ×100%
特点:检索结果不直接解答用户 提出的技术问题,只提供有关线索。
例如:查 “我国城市居民奶制品消费习惯 ” 的有关文献信息。
张明立.我国城市居民奶制品消费行为的调 查分析 . 中国乳品工业. 2002(3)
四川大学工学图书馆收藏有原文。
全文信息检索
以论文或专利说明书的全文为检索对象的一类 检索叫做全文信息检索。 特点:检索结果是与课题相关的论文或专利说 明书的全文。 是在书目信息检索基础上更深层次的内容检索。
数据信息检索
以具有数量性质并以数值形式表示的数据为检 索对象的一类检索。
是一种确定性检索。一般常用数据大全、手 册、年鉴进行检索。
事实信息检索
以事项为检索对象,检索结果是有关某一事物 的具体答案。如日本哪些公司在生产等离子电 视机。 也是一种确定性检索。一般常用手册、年鉴、 百科全书进行检索。
二、信息检索效率
子中的顺序任意。 (SCI)
3、截词检索
截词检索是防止漏检,提高查全率的一 种常用检索技术。大多数网站都提供了截 词检索的功能。有的网站也叫做通配符或 词干法。用*或 ?表示。
有左截词、右截词和中截词
右截词
右截词(又称后截词):是一种满足前方一致的检索。 例如: treat* 可检出: treat 和 treatment 两个词。 右截词分为有限和无限右截词两种。