网络信息资源检索的一般方法与技巧
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
网络信息检索中要注意的方面
• • • • • • • • 注意利用系统提供的介绍文件 充分运用各种逻辑检索规则,准确表达检索要求 充分利用各种检索条件或检索限制 进行多次试检 缩小检索的范围 扩大检索结果 提高检索效率 恰当选用数据库
事先规范化的检索语言,主题词表、叙词表、分 类表等。检索效率高,一旦选定宽度适当的概念 ,系统就能检出这一概念的全部内容,而且由于 标引人员已事先解决了自然语言中的同义、近义 关系,使检索相对容易,但由于其先组性质,受 控词不能及时反映新事物的发展,概念数量有限 ,不能适应数量众多、要求各异的信息用户,也 不易为非专业人员掌握。
• 字段限制检索符
可以限定检索词在数据库中出现的范围,对命中 太多的记录再进行筛选。 TI=(business information) and PY=2007 一般在数据库的高级检索界面,都提供字段限制 的检索功能。
• 在网络信息检索中,通过使用”url:”、 ”title:”、”link:”可以把检索网络信息的范 围限制在标题(title)、URL、链接(link)中,控 制检索结果的相关性,提高检索效率。
• 机构名录
– 一种系统编排的、有关组织机构概况的工具书,可提 供诸如某个人或公司的地址、联系方法、组织名称、 业务概况等信息。
• 百科全书
– 荟萃一切门类或某一门类知识、以概要方式提供有关 信息的多功能工具书。
• 表谱
– 用表格或类似表格形式汇集的某一方面资料,多用来 查考历史年代、历史大事、数据等信息的检索工具。
• 传记工具书
– 专门查阅人物以获得简明的事实数据或详细的 评述性资料的工具书。
• 地理资料
– 包括地名词典、地名索引、地名译名手册、地 理学词典和百科全书、地图集等,是专门用于 查找地名、各地地理情况、地图等信息的检索 工具。
• 统计资料
– 包括统计数据集、统计年鉴、统计手册、统计 书目和索引(不提供数据本身)等专门用于查 找统计数字或查阅统计知识的工具书。
• 类书、政书
– 辑录文献中的史实典故、名物制度、诗赋文章 等,按类或按韵编排,以便寻检和征引的工具 书。
确定检索入口
• 根据“已知”信息特征确定检索入口,一般 来说,所有文献的特征可分两大类:
– 外表特征:题名、著者、刊名、出版年代等 – 内容特征:主题、关键词、分类等
确定检索词
• 受控词
–逻辑或(OR,+/|) A OR B(A + B,A | B)数据库中凡有检索词A或 者B,或同时有A和B的记录均为命中记录。 连接多个同义、近义、相关词,扩大检索范围 例:robot or android sensor + detector
–逻辑非(NOT,-/!) A NOT B(A – B,A ! B)数据库中凡有检索词A 而不含检索词B的记录才为命中记录。 排除不希望出现的概念,增强检索的准确性 例:airplane not helicopter energy - nuclear
也叫截词符,在进行信息检索时,可在检索词的 后面加一通配符来进行截词检索,以代替任意的 字母组合,从而把包含某一词根的不同形式的资 料同时检到。 通配符大多为“*”、“?”或“$”等等,但不同的 数据库可能有其特定的通配符号。
例:econom* economy、economic、economics、 economical、economist、economize
• 双引号的使用
主要是将引号中的词作为一个整体进行检索。 以digital library为例,在Web of Science中进 行检索。
+、-号的使用
源自文库
实施检索并修改检索策略
• 检索策略就是在分析信息需求的基础上, 明确检索范围,选择检索途径,确定检索 词和逻辑组配方法,通过试检或反馈进行 调整,使整个检索计划体现用户的目标。
• Near符号的使用
符号记为(N)或(nN) (N)表示此算符两边的检索词必须紧密相连,此间 不允许插入其他单词或字母,但词序可以颠倒。 例:library(N)digital digital library或library digital
(nN)表示在两个检索词之间最多可以插入n个单词 ,且词序可以颠倒。 例:econom*(2N)recovery economic recovery、recovery of the economy 、recovery from economic troubles等
• 书目:
– 指一批相关文献的记录,其基本功能是反映某 一地区、某一时期在某一领域中出版物的信息 。
• 索引
– 揭示文献内容出处、提供文献查考线索的检索 工具,包括篇目索引和内容索引。
• 文摘
– 是一种既揭示文献外部特征、又通过摘录文献 要点报道文献内容的检索工具。
• 引语工具书和重要语词索引
– 是一类广泛汇集名言佳句的工具书,给出引语 的上下文和出处
• 非受控词
非规范化的自然语言词汇,又称自由词。非受控 词可以在一定程度上弥补受控词的缺陷,具有可 任意选词、专指性强、不需要熟悉词表、能使用 新产生的名词术语及时检索与新概念有关的文献 ,但主要缺点是不能提供概念的等级结构、检索 宽泛概念和解决同义词、近义词、相关词的结合 或连接问题。
检索途径
选择检索工具
书目、馆藏目录 索引 提供线索的指示型 检索工具 文摘 工具书指南 检索工具
词典 引语工具书 百科全书、类书、政书
提供具体信息的参 考型检索工具
传记资料 手册 机构名录 地理资料 统计资料 年鉴、表谱图册 政府文献
• 馆藏目录
– 查找文献应首先考虑的检索工具。 – 读者目录、公务目录 – 题名目录、责任者目录、分类目录、主题目录 – 图书目录、报刊目录、专利目录、视听资料目 录、档案文号目录等 – 中文目录、西文目录、日文目录、少数民族文 字目录等
• 字典、词典
– 按编撰目的可分为语文词典、专科词典和综合 性词典(百科词典)
• 年鉴
– 以描述和统计的方式逐年提供某年度、某一领 域信息的工具书,或者说是相应年度内信息的 汇编。
• 手册
– 汇集某一学科领域或业务部门专门知识的工具 书,多是针对当前实践中的需要,以简明扼要 的方式提供具体、实用的资料,供随时翻检查 阅。
受控词索引 链接
受控词查询 结果
使用受控词 检索的结果
受控词
检索途径
使用关键 词检索的 结果
受控词查询 界面
受控词查 询结果
受控词
分类表检 索界面
构造检索表达式
• 布尔算符
–逻辑与(AND,*/&) A AND B(A * B,A & B)数据库中同时有检索词 A和B的记录才算命中。 增强检索的专指性,缩小检索范围。 例:library and copyright color * television
网络信息资源检索的一般方 法与技巧
李琳 南京大学 信息管理系
网络信息资源检索的一般方法与 技巧
• • • • • • 分析问题 选择检索工具 确定检索入口 确定检索词 构造检索表达式 实施检索并修改检索策略
分析问题
• 首先,将问题分类有助于确定相应的检索 工具 • 其次,要分析“已知”和“欲知”信息 • 第三,分析需求的主题内容,即所需信息 的学科性质、特点和水平层次 • 第四,广泛利用文献类型 • 最后,选择合适的文献检索时间范围。
–基本布尔逻辑运算的执行顺序:NOT、AND、OR ,但可用括号改变执行顺序。 例: (library or digital library) and copyright
(financial OR monetary) AND bond NOT (chemical OR atomic)
• 通配符的使用