网络文献信息检索基础

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

检索技术
截词检索:
用截词符号“?”、“*”或“$”加在检索词的前后或中间, 以检索一组概念相关或同一词根的词。这种检索方式 可以扩大检索范围,提高查全率,主要用于西文数据 库检索。中文数据库通常不使用这种技术。
截词检索类型
截词方式根据截词的位置不同,分为前截断、后截断、 中截断;根据截断的数量不同,分为有限截断和无限 截断。
截词检索(truncation)
后截断:是前方一致检索,又称右截断,截词符放在被截词 的右边,是最常用的截词检索技术。后截断主要用于下列检 索:词的单复数检索,如company与companies;年代检索, 如199?(九十年代);词根检索,如socio*,可以检索 sociobiology,socioecology,sociology等20多个词汇。 前截断:截词符放在被截词的左边,可与后截断一同使用。 例如输入*magnetic,可检electro-magnetic、 electromagnetic、thermo-magnetic等。目前这种检索技术 应用已经极少。 中截断:把截词符放在词的中间。如organi?ation,可检索 organisation、organization。这种方式查找英美不同拼法 的概念最有效。
inSpirs
网上各类型信息资源查询
数字图书馆:中国数字图书馆、书生之家数字图 书馆、超星数字图书馆、北大方正的Apabi系统 。 报刊资料:中国学术期刊网、中文科技期刊数据 库、中国财经报刊数据库。 会议文献:中国科学院学术会公告、学界动态、 IEEE学术会议数据库、万方学术会议文献数据库、 中国重要会议论文集全文数据库、国内专业会议 资料数据库、OCLC的会议文献数据库、美国科学 信息研究所( ISI )会议数据库。
常用的位置算符有
算符 wk.baidu.com能 表达式 检索结果
Education school Education schools (school of education schools of education) Education school Education schools Education and music school School of continued education Education school Education schools W, W/N with 两词相邻,按输 Education(W)school, 入时顺序排列 或 within (也有数据库允 Education with 许顺序颠倒) school nW 同上,两词中间 Education (1W) 允许插入n个词 school
词根检索
有些检索系统不支持使用截词符的截词检索技术,系 统默认的是词根检索,即输入一个词,系统会自动检 索出同一词根的一组词,例如输入gene,可以检索出 gene,genic,genome等。这是一种智能检索方式, 但要求系统内必须预先配置词根表。 IEE/IEEE全文数据库默认词根检索 有些数据库需要加入词根运算符如“$”才进行词根检 索
检索结果
Education school Education schools School of education Education school School of education Education and music school 例如同时出现在题名 或文摘字段中 同时出现在一个段落 中
截词举例
符号:*,?,$ 后截断:librar* → library, libraries, librarian,… 前截断:*magnetic → magnetic, electromagnetic, electromagnetic, thermo-magnetic, … 中截断:organi?ation → organization, organisation
学位论文:中国学术期刊网和万方数据资源系 统的学位论文数据库、高校学位论文数据库、 PQDD数据库(美国)。 专利文献:中国专利信息网、国家知识产权局、 DILAOG系统、世界知识产权组织专利数据库、 美国专利商标局专利检索数据库。 标准类:中国标准咨询网、万方数据资源系统 标准数据库、国际标准化组织、美国国家标准 委员会。
截词检索类型
根据截断的数量不同,分为有限截断和无限 截断。
无限截断:不限制被截断的字符数量,例如输入 educat?,可以检索educator,educators,educated, educating,education,educational,等等。 有限截断:限制被截断的字符数量,例如输入 educat**,表示被截断的字符只有两个,可以检索 educator,educated两个词。
字段前缀符:其作用与限制符一样,都是表示文 献的外部标志,不反映文献的内容,对检索式的 命中文献从非主题方面加以限制。 截词符:其作用是在保证关键词检索的前提下, 扩大检索范围。 除了以上5种符号外,构造检索式还常常用到 括号。括号可以规定运算的优先次序。 一般说来,使用布尔算符、括号、截词符和 位置算符,就可以构造出一个比较完善、切题的 检索式了。
数字信息资源概述:检索技术
布尔逻辑检索
布尔逻辑检索
布尔逻辑检索:运用布 尔逻辑算符(Boolean operators)对检索词 进行逻辑组配,表达两 个概念之间的逻辑关系。
逻辑“与”(and):检索时,命中信息同时含有两个概念,专指性强; 逻辑“或”(or):检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索 范围比and扩大。 逻辑“非”(not):命中信息只包括逻辑A,不包括逻辑B或同时有A和B的,排除了不需 要的检索词。 逻辑“异或”(xor):命中信息包含逻辑A,也包含逻辑B,但不包含同时含有A和B的信 息。
网络数字资源检索基础
2005年3月
数字信息资源概述
参考数据库 全文数据库 事实数据库 电子图书 电子期刊 电子报纸 搜索引擎/分类指南 网络学术资源学科导航 FTP资源 其他:网站、BBS、新闻组等
检索提问式的定义及类型
概括地说,检索式是检索策略的逻辑表达式,是指 计算机信息检索中用来表达用户检索提问的逻辑表 达式,由检索词和各种布尔逻辑算符、位置算符以 及系统规定的其他组配连接符号组成。 布尔逻辑检索式是目前使用最普遍的检索式,即用 布尔算符(and、or、not)将检索词组合起来。 位置算符检索式是对布尔逻辑检索式的一种改进, 式中不仅有布尔算符,而且有位置算符,用以指明 检索词之间的位置关系,从而解决了布尔算符组配 检索词时没有词序的问题,进而提高了查准率。
检索技术
位置算符检索:
即运用位置算符(position operators)表示两个检索词 间的位置邻近关系,又叫邻接检索(proximity)。这 种检索技术通常只出现在西文数据库中,在全文检索 中应用较多。如果说布尔逻辑算符是表示两个概念之 间的逻辑关系的话,位置算符表示的是两个概念在信 息中的实际物理位置关系 。
注意:
在不同的检索系统里,布尔逻辑的运算次序是不同的,因此会 导致检索结果的不同。通常运算次序有这样几种形式: 一是按算符出现的顺序,如果是and、or、not,就按and、or、 not的顺序运算;如果是or、not、and,就按or、not、and的 顺序运算; 二是默认and优先运算,其次是or、not; 三是默认or优先运算,然后是and、not。一般来讲,检索系 统的“帮助”文件中都会有这类说明,只要注意查看即可。 在中文数据库里,布尔逻辑运算符有时用and、or、not下拉菜单 形式表示,供用户选择;有时用“*”号表示逻辑“与”,用“+”表 示逻辑“或”,用“-”表示逻辑“非”。
nN
F
两个词同在一个标引 字段中 两个词同在一个段落 (paragraph)中
Education (F) school
Same
Education Same school
注意:
不是每一个检索系统都使用上述位置算符, 不同的系统使用的位置算符不同,不同的算 符在不同的系统中有时可能含义不同。例如 “W”算符,在Dialog检索系统表示两词相邻, 输入顺序不变;在ProQuest系统中,“W”算符 表示输入的两个词相邻,但顺序可变,如顺 序要求不变,则使用“Pre”算符。用户可以查 阅help帮助文档说明。
位置算符检索
位置算符(position)
With(field): same field or same sequence Near: same sentence Pre (precede): library pre science → library science, library with science, ... w/n (Within): library w/n science → library science, science library, … Field: same field Same: same paragraph
构成检索提问式的5种符号
位置算符:表示所连接的各个单元词词间位置关 系的符号,在不同的系统中往往以不同的符号表 示。 字段后缀符:限制检索词在数据记录中出现的字 段位置,主要是题名、文摘、叙词和标识词字段, 分别缩写为TI、AB、DE和ID。通常是在检出的 文献量较多的情况下才考虑使用。 限制符:挑选命中文献的文种、文献类型、出版 时间和重要文章,约束检索结果。其形式和用法 同上。
Pre
两词相邻,按输 入顺序排列
Education Pre school
常用的位置算符有
算符
N, near, adj
功能
两词相邻,顺序可以 颠倒 同上,两词中间可以 插入n个词
表达式
Education (N) school, 或 Education near school Education (1N) school
相关文档
最新文档