3 信息检索与利用 第3章 数据库检索通论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 专业检索正确写法:
题名=玻璃建筑 and (主题=基础理论 or 主题=设计方法)
• 容易出错的情况:
• 1.每个检索词都须与对应字段连接
题名=玻璃建筑 and 主题= (基础理论 or 设计方法)
• 2.布尔逻辑算符两边须有空格
题名=玻璃建筑and(主题=基础理论or主题=设计方法)
• 3.括号“()”须是英文半角输入
检 检索 索作 作者 者“ “陈 陈英 英”” “ “模 模糊 糊””匹匹配配
错错误误结结果果
其它小设置(4): “精确”匹配
检 检索 索作 作者 者“ “陈 陈英 英”” “ “精 精确 确””匹匹配配
第三层次小结
• 其它小设置:不同数据库设置略有差异
。重要性次于检索项,在一定情况下可 忽略不计。
• 我们将利用CNKI(旧平台)的中国期刊
全文数据库,以检索“点支式玻璃建筑的 基础理论与设计方法研究 ”课题为案例, 分四个层次由浅入深介绍数据库通行的检 索方法。 n 只所以选择CNKI数据库(旧平台),因为其界
面简洁、易用,适合初学者学习、使用。
n CNKI数据库(旧平台)网址:
http://www.dlib.cnki.net/kns50/index.aspx
题名=玻璃建筑 and (主题=基础理论 or 主题=设计方法)
• 4.括号“()”须对称
题名=玻璃建筑 and (主题=基础理论 or 主题=设计方法
期刊导航(1)
选 选择择“ “建 建筑 筑科科 学 学” ”学 学科 科
期刊导航(2)
选 选择 择“ “土 土木 木建 建筑 筑 与 与环 环境 境工 工程 程” ”
第三章 数据库检索通论
内容提纲
• 数据库检索相关说明 • 数据库检索第一层次 • 数据库检索第二层次 • 数据库检索第三层次 • 数据库检索第四层次 • 检索结果的显示与处理 • 英文数据库的检索方法
数据库检索相关说明
信息检索的概念
信息检索(Information Retrieval)是 指将信息按一定的方式组织起来,并根 据信息用户的需要找出有关信息的过程 和技术。狭义的信息检索就是信息检索 过程的后半部分,即从信息集合中找出 所需信息的过程,也就是我们常说的信 息查寻(Information Search 或Information Seek)。
第一层次小结
• 入门级:傻瓜式操作,将数据库当成搜
索引擎来用 n 步骤1:进入数据库检索界面。 n 步骤2:找到检索框,输入检索词(调整检索
词),点击检索即出结果。
数据库检索第二层次
同一检索词在不同“检索项”检索(1)
检检索索项项为为 ““篇篇名名”” 检 检索 索结 结果 果 有 有1166条 条
二氧化碳 and 超临界 not 皮革
布尔逻辑算符的运算次序
• 在大多数的检索系统中,用布尔逻辑算
符组配检索词构成的检索提问式,逻辑 算符AND、OR、NOT的运算优先次序为 NOT→AND→OR。在有括号(包括多重 括号)的情况下,括号内的逻辑运算先 执行。
截词检索
• 所谓“截词检索”是指在检索式中用专
数据库检索第一层次
第一层次步骤1:进入数据库检索 界面(1)
非非机机构构用 用户 户须 须 注注册册后 后登 登陆 陆
第一层次步骤1:进入数据库检索 界面(2)
已已登登陆陆
选 选择 择子 子库 库“ “中中国国期期 刊 刊全 全文 文数 数据据库库””
第一层次步骤1:进入数据库检索 界面(3)
用 用高 高级 级检 检索 索实 实现 现 同 同样 样的 的检 检索 索式 式
专专业业检检索索
专业检索(2)
高高级 级检 检索 索选选择择““精精确确”” 匹 匹配 配也 也是是22条条结结果果
“ “精 精确 确” ”匹 匹配 配
专业检索(3)
33条条结结果果
检 检索 索项 项由 由“ “篇 篇名 名” ”修 修 改 改为 为“ “主 主题 题” ”
44条条结结果果
再 再检 检索 索主 主题 题“ “基 基础础理理 论 论 oorr 设 设计 计方 方法法””
高级检索
44条条结结果果
用 用高 高级 级检 检索 索实 实现现 同 同样 样的 的检 检索索式式
高高级级检检索索
专业检索(1)
22条 条结 结果 果, ,因 因专专业业检检索索 默 默认 认“ “精精确确””匹匹配配
• 查准率
是检测检索系统拒绝非相关文献能力的 一种尺度。利用检索系统进行某一课题检索 时,检出的相关信息量(w)与检出信息总 量(M)的比率再乘以100%,称为查准率 (P ),用公式表示如下:
P=( W/M )×100%
信息检索技术
• 布尔检索 • 截词检索 • 邻近检索(短语检索)
布尔检索
系系统统默默认认的的初初 级级检检索索界界面面
第一层次步骤2:找到检索框,输入检索词
在在检检索索框框中中直直接接输输入入课课 题题名名称称,,检检索索结结果果为为00
第一层次步骤2:调整检索词
调 调整 整检 检索 索词 词为为课课题题的的核核 心 心词 词“ “点 点支 支式式玻玻璃璃建建 筑 筑” ”, ,结 结果 果为为1166条条。。
期刊导航(3)
选选择择““22001111 年年66期期””
期刊导航(4)
第四层次小结
• 高级检索功能:二次检索,高级检索,专业检索,
期刊导航 n 二次检索:在检索结果范围内再次进行限定检索。 n 高级检索:适合于有一定检索经验的熟练用户或构建较为复
同一检索词在不同“检索项”检索(2)
检检索索项项为为““关 关 键键词词””
检 检索 索结 结果 果 有 有5544条 条
同一检索词在不同“检索项”检索(3)
检检索索项项为为 ““摘摘要要”” 检 检索 索结 结果 果 有 有5511条 条
同一检索词在不同“检索项”检索(4)
检检索索项项为为 ““主主题题”” 检 检索 索结 结果 果 有 有111100条 条
信息检索的类型
• 书目信息检索 • 全文信息检索 • 数据信息检索 • 事实信息检索
信息检索的作用
• 信息检索有利于减少课题的重复研究、
提高科研成功率。
• 信息检索有助于节约时间、提高科研效
率。
• 信息检索是科学决策的必要前提。
信息检索效率
• 信息检索效率是研究信息检索原理的
核心,是评价一个检索系统性能优劣的 质量标准,它始终贯穿信息存储和检索 的全过程。
以著名的Dialog联机检索系统为例,其常 用的位置逻辑算符
(nW) (nN)
• (nW)关系
词序不能颠倒。要求它所连接的两个 检索词在检索结果相互距离不超过n个 词。
例如:carbon(w)dioxide shortwave(w)communication software(w)radio
• (nN)关系 词序可以颠倒。要求它所连接的两个
• 中截词:允许检索词中间有若干变化形
式
例如:wom?n woman
women
• 右截词:又称后端截词、前端一致。允
许检索词尾部有若干变化形式。 例如:tan*
tan tannage tanner tannin tanning
位置算符(短语检索)
用于限定两个检索词之间的邻近位置关 系。这种检索技术可弥补布尔检索技术只是 定性规定参加运算的检索词在检索中的出现 规律满足检索逻辑即为命中结果,不考虑检 索词词间关系是否符合需求,而易造成误检 的不足。
• 所谓“布尔检索”是指通过标准的布尔
逻辑关系词来表达检索词与检索词之间 逻辑关系的检索方法。
主要的布尔逻辑关系词有: AND或* OR或+ NOT或-
• AND关系
称为逻辑与(逻辑乘),用关系词 AND表示。表示它所连接的两个检索词 必须同时出现在结果中才满足条件。
A AND B
• 例如:
二氧化碳超临界在皮革、食品行业中的运 用。 二氧化碳 and 超临界 and 皮革
门符号(截词符号)表示检索词的某一 部分允许有一定的词形变化。
检索词的不变部分加上由截词符号所 代表的任何变化形式所构成的词汇都是 合法检索词。
目的:提高文献信息的查全率
• 左截词:又称前端截词、后端一致。允
许检索词的前端有若干变化形式。 例如:*physics
physics astrophysics biophysics chemophysics geophysics
n 几个主要的检索项其范围大小大致为:
篇名<关键词≈摘要<主题<全文
n 选择哪一个检索项要根据具体情况而定,灵活
掌握。
数据库检索第三层次
其它小设置(1):词频;时间范围
时 时间 间范 范围 围
词词频频
其它小设置(2):期刊范围;排序;学科导航
期 期刊 刊范 范围 围
其它小设置(3):“模糊”匹配
A OR B
• 例如:
二氧化碳超临界在皮革和食品行业中的运 用。
二氧化碳 and 超临界 and (皮革 or 食品)
• NOT关系
称为逻辑非(逻辑减),用关系词 NOT表示。表示它所连接的两个检索词 中应从第一个概念中排除第二个概念。
A NOT B
• 例如:
二氧化碳超临界在皮革以外行业中的运 用。
• 衡量检索效率的指标有查全率、查准
率、漏检率、误检率、响应时间等。
• 查全率
是测量检索系统检出相关文献能力的一 种尺度。利用检索系统进行某一课题检索 时,检出的相关信息量(w)与该系统中存 储的相关信息量(X)的比率再乘以100 %,称为查全率(R),用公式表示如下:
R= ( W/X ) ×100%
பைடு நூலகம்
关于数据库的检索方法(1)
• 随着现代信息技术的发展,各种类型的
网络数据库日益丰富,用户需要面对的 检索系统也日渐多样化,但由于所有数 据库的检索原理、方法及功能有其共通 性,所以只要掌握好其基本规律,即可 起到举一反三的效果
• 若在数据库检索中遇到困难,不要忘记
每个数据库都提供相应的“帮助”。
关于数据库的检索方法(2)
网络数据库的种类
• 两种分类方式
n 中文数据库;外文数据库
n 文摘型数据库;全文型数据库
ü 文摘型数据库如工程索引(Ei Compendex)、科学引
文索引(ISI Web of Science)、化学文摘(SciFinder Scholar )等。
ü 全文型数据库如中国期刊全文数据库(CNKI)、中
carbon and dioxide and supercritical and leather 二氧化碳 and 超临界 and 食品
carbon and dioxide and supercritical and food
• OR 关系
称为逻辑或(逻辑加),用关系词 OR表示。表示它所连接的两个检索词中 任意一个出现在结果中就满足检索条 件。
• 其它小设置主要包括:
n 期刊范围 n 年限(更新) n 学科范围导航 n 模糊、精确匹配; n 词频 n 排序
数据库检索第四层次
二次检索(1)
1166条条结结果果
先 先检 检索 索篇 篇名 名“ “点 点支支 式 式玻 玻璃 璃建 建筑 筑” ”
初初级级检检索索
二次检索(2)
选 选中 中“ “在 在结 结果 果中 中检 检索 索””
文科技期刊全文数据库 (维普)、Elsevier SDOL 、 EBSCOhost、SpringerLink等。
数据库的使用限制
• 机构购买的资源(网络数据库)通常都
设有IP限制,机构以外的用户是无法正 常登陆使用的。
• 某些全文型数据库,如Elsevier SDOL、
SpringerLink 、CNKI(须免费注册)等 ,允许免费用户访问并免费检索获取该 数据库的文摘题录信息。
检索词在结果相互距离不超过n个词。 例如:检索式:
environment(2N)protection
environment protection protection of the environment protection of water environment protection of forest environment
同一检索词在不同“检索项”检索(5)
检检索索项项为为 ““全全文文” ”
检 检索 索结 结果 果有 有 1133442222条 条
第二层次小结
• 关注检索项(检索字段):这是除了检
索框之外数据库最重要的一个设置 n 要注意检索词应与检索项一一对应。 n 不同的检索项表示不同的检索范围,所以同样
的检索词在不同的检索项中进行检索得出的结 果不同,范围越大的检索项检索结果越多,但 相关性(准确性)越低;反之亦然。