计算机信息检索基本方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“(nW)”算符
“(nN)”算符
“(nW)“ 关系要求它所连接的两个检索词在检索结果中的相互距离不超 过n个词(中文不超过n个字,即大于等于0小于等于n),而且两个词的前 后顺序不能颠倒。(W)也可以简写为()
Wuhan(1Leabharlann Baidu)university
Wuhan Medical University, Wuhan Agricultural University, Wuhan Technology University……
计算机信息检索基本方法
河北金融学院图书馆 张春玲
目录 一 二 三 四
• 布尔逻辑由英国数学家乔治.布尔提出。 • 在检索过程中用于表达词于词之间的逻辑关系的算符就称
为布尔逻辑运算符。 • 布尔逻辑检索最常用的运算符有三种:
逻辑与(AND , *) 逻辑或(OR,+) 逻辑非(NOT,AND NOT,-)
(1)前截词:又称为后方一致,它允许检索词前端有一定形式 的 变 化 , 如 “ * ism ” 表 示 可 以 检 索 出 “ ambulism ” 、 “phagism”、“anthropism”等形式的记录。
(2)中间截词:它允许检索词中间有若干形式的变化,如 “wom?n”表示将检索出包含有“woman”、“women” 的记录。
“(nN)”关系也要求它所连接的两个检索词在检索结果中的相互距离不 超过n个词(中文不超过n个字),但两个词的前后顺序可以变换。
Wuhan (1N) university 不仅可检索出 Wuhan Medical University, Wuhan Agricultural University, Wuhan Technology University…… 还可检出university of wuhan, university in wuhan……
(3)后截词:又称为前方一致:它允许检索词的尾部有若干形 式 的 变 化 , 如 “ comput*” 表 示 可 以 检 索 到 包 括 “computer”、“computers”、“computerize”等形式 的记录。
复杂截词:*toxic*
概念:指定系统在哪个字段或哪几个字段范围内对输入的 词进行检索
例:检索式:“大气污染 and 控制”,有关“大气污染控制”方面的中 文资料都会被检索出。 逻辑与 检索式可以缩小检索范围,有利于提高查准率。
例: “大气污染 or 控制”,有关“大气污染”和“控制”方面的中文 资料都会被检索出。 逻辑或 检索式可以扩大检索范围,防止漏检,有利于提高查全率。
例:检索式:“能源 not 核能”,检索出的是“不包括核能的能源”方 面的资料。
几乎所有的网络信息检索系统都支持布尔逻辑运算检索,但不同的检
索工具又有差别: (1)表示布尔关系的方式不同。有的检索工具检索词之间的默认关系
是AND,有的默认是OR。不同的检索工具表示布尔关系的符号也不同。 (2)支持布尔逻辑的程度有差别。如Yahoo就不支持NOT关系。
位置限定检索又成临近检索,是用来表示两个检索词 (短语)之间的距离和关系的检索方式。 目前运用较为广泛的是:
PY= 限查特定年代 DT=限查文献类型 CS=限查作者所在机构 后缀限制符例如: /TI 限在题目中查 /AB 限在文摘中查 /DE 限在叙词标引中 查
多个字段进行组配
(AU=WangLi) AND (CS=Wu han Univ) 检索武汉大学的王力先生的的资料
可限定的字段: 篇名、作者、出版年、文摘、全文、等等,
20不14同的数据库可限定字段不同,系统默认格式不同。
目的:缩小检索范围,提高查准率。
检索限制可针对特定年代、特定类别、特定检索点等作限制 ,包括前缀限制符和后缀限制符,对DIALOG系统而言,
前缀限制符例如:
20A1U4= 限查特定作者 JN= 限查特定刊名 LA= 限查特定语种
概念:截词检索就是在检索当中保留相同的部分,而把可以 变化的部分用一个截词符去代替
截词符(通配符):* 、? *代表0-n个字符;? 代表 1个字符。
作用:扩大检索范围 应用:西文数据库较常用
Biology、geology、psychology、sociology…… *ology
截词检索按截断位置分为前截词、中间截词、后截词三种形式。