第二讲_计算机信息检索基础知识

合集下载

计算机基础信息检索

计算机基础信息检索

多媒体信息检索技术应用
图像检索:通过图像内容进行 检索如图像识别、图像分类等
音频检索:通过音频内容进行 检索如语音识别、音乐识别等
视频检索:通过视频内容进行 检索如人脸识别、场景识别等
文本检索:通过文本内容进行 检索如关键词搜索、文本分类

多媒体融合检索:结合多种媒 体进行检索如跨媒体检索、多
媒体内容分析等
和准确性
移动化:适应 移动设备的发 展趋势提供更 便捷的检索服

社交化:结合 社交网络提高 信息传播和检
索的互动性
专业化:针对 特定领域提供 更专业的检索 服务满足不同
用户的需求
数据库信息检索 技术
数据库信息检索原理
检索方法:包括全文检索、 关键词检索、布尔检索等
数据库检索:通过数据库管理 系统(DBMS)进行数据查询 和检索
多媒体信息检索原理
多媒体信息检索技术分类
基于内容的检索:通过分析多媒体内容的特征进行检索 基于文本的检索:通过分析多媒体内容的文本信息进行检索 基于视觉的检索:通过分析多媒体内容的视觉特征进行检索 基于音频的检索:通过分析多媒体内容的音频特征进行检索 基于视频的检索:通过分析多媒体内容的视频特征进行检索 基于多模态的检索:综合利用多种特征进行检索
数据库信息检索技术发展趋势
智能化:利用人工智能技 术提高检索效率和准确性
集成化:将多种数据库技 术集成实现跨平台检索
安全性:加强数据加密和 访问控制保障数据安全
实时性:提高数据更新速 度实现实时检索
移动化:适应移动设备的 需求提供移动检索服务
云化:利用云计算技术实 现数据库资源的共享和优 化
多媒体信息检索 技术
信息检索技术:包 括文本检索、图像 检索、音频检索等

第二讲 信息检索基础知识

第二讲 信息检索基础知识

1.1 信息检索的概念
广义信息检索
是将信息按一定的 方式进行加工、组 织并贮存起来,再 根据信息用户的需 要找出有关的信息 过程。它的全过程 又叫信息存储与检 索。
信息检索
狭义信息检索
指用户根据需要 ,借助于检索工 具,从信息集合 中找出所需要信 息的过程。本书 所介绍的信息检 索就是狭义信息 检索 。
1.2 信息检索的原理

储 一次 分析 信息
过 信息
特征

检 索 信息 过 需求 程
分析 检索 提问
标引 信息特征 输入 检
检 索
标识
(检索项)
索检
工 具 输出


和结
言 标引
检索提问 检索 系
标识


(检索词)
1.3 信息检索的类型
按信息检索的内容划分
▪ 数据信息检索(Data information Retrieval) ▪ 事实信息检索 (Fact information Retrieval) ▪ 文献信息检索 (Document information Retrieval)
青岛工学院图书馆http://10.10.58.103/
三、信息检索技术
检索技术,是指利用光盘数据库、联机 数据库、网络数据库、搜索引擎等进行信息 检索,采用的相关技术,主要包括布尔检索、 截词检索、字段检索、词位置检索、加权检 索等
检索方式
▪ 1、命令式检索:用逻辑运算符、位置算符及其他检索 符号,把不同的检索词连接起来进行检索的一个种方式。 适用于专业人员。
主题语言又分为标题词语言、单元词语言、叙词
语言和关键词语言,前两种语言目前使用较少。 1)叙词语言:叙词是为了适应计算机检索的需

信息检索基础知识 - 第二讲信息检索系统、工具及语言

信息检索基础知识 - 第二讲信息检索系统、工具及语言

二、按加工层次分:
一次文献(Primary Document):
通常是指原始制作,即作 者以本人的研究成果为基本素材而创作(或撰写)的文献。 检索的目标 如期刊论文、科技报告、会议论文、专利说明书
二次文献(Secondary Document):是指文献情报工作者对
一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文 献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。二次文 献的重要性在于可以帮助人们查找一次文献。 检索的手段
光盘检索
用光盘作为信息存储介质的数据库。 分为单机检索和局域网内的联机光盘检索。
网络信息检索
用户在自己的客户端上,通过互联网和浏览器界面对网络 信息进行检索。 特点
数据库分布式存储,数量多,信息量大;由于超文本语传输 协议,提供了大量相关链接; 内容向多媒体发展,不仅有文本,还有图像、声音等; 数据库更新速度快; 检索功能强,索引多,易学易懂;但目前各数据库检索界面 和检索技巧不尽相同,给使用者造成不必要的麻烦; 检索环境宽松,检索费用比联机检索低很多。 (网络信息检索也包括通过网络进行的数据库检索)

国 hggghgh5454545454
风 光 好 官 方 官 方 共 和
知识的存在形式
1、存在于人脑记忆中 2、存在于实物中 3、用文字、图形、符号、代码、声频、视频 等技术手段记录在一定载体上的知识。 其中第三种形式称作文献
文献(literature、document)的概念
《中华人民共和国国家标准· 文献著录总则》给文献 下的定义是:“文献是记录有知识的一切载体”。
俴蔑曱檻椚怒盽盢餚罗孎榢巫萶絃筢 湵誕秠櫆憸诺啂奥込穚篣癑蓐潇醹歟 栉鷰鄹眙

第二讲信息检索基础

第二讲信息检索基础

回 顾

本讲主要内容
● ●
信息检索概念 信息检索意义 信息检索原理 信息检索类型 信息检索途径 信息检索方法

信息检索技术 信息检索策略 信息检索步骤

● ●

Hale Waihona Puke 信息检索语言信息检索利用



有一种能力与生俱来
有一种能力终身受用------信息检索
信息检索概念
南航学生事务服务中心:【名家讲坛】4月8 日19:00在一号楼四楼报告厅,延参法师邀 请你一起《快乐看人生》!本次讲座将凭票 入场,但入场券只提供入场资格,现场座位 先到先得!入场券将在本周日(3月31日) 16:00在学生事务服务中心办公室免费领取, 领完为止,同样先到先得哦!邀你的同学一 起聆听大师的教诲吧!
信息检索途径
是由提取信息源的外部与内部特征形成 的,又称为检索点或检索入口
题名 责任者 号码 (专利号、标准号等) 出版信息 丛编 装帧 责任者单位
分类 主题
外部特征 信息(文献)
内部特征
文献外部特征主要检索途径:题名 责任者 号码 文献内部特征主要检索途径:分类 主题
信息检索方法
德国柏林图书馆门前有这样一段话:“这里是知识的宝库, 你若掌握了它的钥匙,这里的全部知识都是属于你的。”
信息检索类型
信息检索类型
按检索对象性质: 文献检索:凡是以文献(包括文献线索、文摘、题录 和 全文)为检索对象的一种检索。检索结果是特定文献线索。 移动通信病毒文献有哪些? 数据检索:凡是以数据(包括计算公式、化学分子式、数 值、图表(参考工具书) )为检索对象的叫数据检索。 检索结果是数值性数据。今日人民币对美元汇率 事实检索:统计资料、百科知识、人物传记、案例等世界 上最长的斜拉桥是哪座,该桥位于什么地方,何时建成? 按检索方式:手工检索 计算机检索

《信息检索》 第2讲 信息检索的基本知识2

《信息检索》 第2讲 信息检索的基本知识2

19
2013-8-1
(2)自然语言和受控语言的一体化发展趋势
在网络环境下自然语言和受控语言的融合或称一体化是检索
语言未来发展的必然趋势。这方面比较前沿的、有代表性的 理论研究和实践是国内张琪玉先生提出的学科——事物概念 组配型检索语言和美国国家医学图书馆所创建的UMLS系统 。 学科——事物概念组配型检索语言具有的特点是:通过学 科聚类和事物聚类的结合、号码标识和词语标识的结合以及 系统序列和字顺序列的结合,实现分类系统和主题系统的完 全一体化。用户从自然语言词汇、分类号和主题词任一途径 入口检索,都能获得相应的文献。这种检索语言具有开放性 ,可不断增补新概念。目前该模式正处于理论研究阶段。 UMLS模式即一体化医学语言系统。UMLS由超级叙词表、语 义网络、情报源图谱和专家词典四个相互联系的部分组成。
13
2013-8-1

用主题法查找文献,要注意以下几点:
注意利用词表
选择主题词要把握概念的含义 要利用概念之间的属种关系和相关关系增加检索线索
14
2013-8-1
注意利用词表
主题词是检索系统使用的专门的规范化语言,用这
种语言表述的概念,只有一种解释,不允许一词多 义、多词一义,这是规范化检索语言的单义性所规 定的。而一般用户的提问用的是自然语言,自然语 言并不遵守特定事物具有特定概念用特定语言表达 这一原则。
10
2.2 关键词语言
关键词语言是适应目录索引编制过程自动化的需要而产
生的。关键词是文献的篇名、摘要、正文中出现的具有 实质意义并能表达文献主题内容的词语。以关键词作为 标识的检索系统就叫做关键词语言。 由于关键词是未经规范的自然语言,一个概念可以用几 个词义相同或相近的词来表达,因此关键词语言没有固 定的词表,只有一个停用词词表,用以识别词语的词性 ,方便计算机自动抽取实质性语词。 关键词语言十分适于计算机编制索引,检索入口多,编 制速度快,但缺点是容易造成漏检。 例如:“国际联机检索概论”中的“国际联机检索”、 “国际联机”、“联机”、“检索”都是能描述这篇文 献主题的关键词,都可以作为检索词。

计算机信息检索基础知识

计算机信息检索基础知识

• 支气管扩张剂对肺的作用
– 分类标引:R974 呼吸系统药物 – 主题标引:肺/药物作用 支气管扩张剂/药理学
计算机信息检索系统组成
• 硬件:运算器、控制器、存储器、输入输出装置等 • 软件:系统操作程序、数据库管理程序、联机控制
程序、应用程序等。 • 通讯线路:电话通讯网、数据通讯网、卫星通讯网 等。 • 检索终端:信息用户与检索系统主机进行人机对话, 实现联机检索的设备。包括上网设备、调制解调器 等。 • 数据库:是计算机检索的对象。是由一个或数个文 档构成,并能够满足某一特定目的或某一特定数据 处理系统需要的一种数据集合。
光盘数据库检索
• 光盘 是80年代发展起来的激光存储载体,继 纸张感光材料、磁性载体之后问世的又一种 新型的信息存储介质。能存储数据、文字、 图形、图像、声音、动画等各种信息。一张 普通的光盘、信息存储量约为550兆。 • 光盘的分类:按存储方式分为
(1)只读型光盘:CD-ROM (2)写读光盘:WORM (3)可擦写型光盘:ERM
光盘检索的定义和特点
• 定义:
是一种用激光技术在特制圆盘上记录信息 的检索方式。 • 特点: (1)投资成本低; (2)价格低; (3)运行速度快; (4)检索效果好; (5)下载方便; (6)安全性能高。
光盘检索的系统组成
• 单机光盘检索系统组成: (1)数据库:光盘 (2)软件:系统软件和检索软件 (3)硬件:计算机、光盘驱动器、显示屏、打印 机等 • 网络光盘检索系统组成: (1)光盘塔 (2)光盘组网软件 (3)光盘塔服务器
NOT > AND > OR ( )号里的部分运算优先
截词检索
截词检索就是把检索词截断,取其中的一 部分,在加上截词符号一起进行检索。主要 用于检索词的单复数、词性的词尾变化、词 根相同的一类词,以及同一词的拼法变异等。 通用的截词符有:?和* ?代表一个字母;*代表两个或两个以上字母

信息检索 第二讲 信息检索概述

信息检索 第二讲 信息检索概述

通过分析信息存储和检索的全过程可以看出检索语言
大致有以下四个主要的功能:

对文献的情报信息内容及其外表特征加以规范化的标引;
对内容相同及相关的文献信息加以集中或揭示其相关性;
可使文献信息的存储集中化、系统化、组织化,便于检
索者按一定的排列秩序进行有序化检索;

便于将标引用语和检索用语进行相符性比较。
科性质进行分类和系统排列 。

特点:能集中体现学科的系统性,反映事物的
从属、源生关系,便于按学科门类进行族姓检
索。
(1)分类语言

按照分类方式的不同:
混合分类语言 体系分类语言 分类语言
体系分类法是基于概念
的划分和概括,以学科 分类为基础,把概括文
献内容与事物的各种类
目组成一层层隶属、详 细列举的等级结构体系。
文献检索
事实检索
数据检索
7
3.信息检索的类型

文献检索。以文献或其索引、文摘为检索对象, 目的是核实已知文献的不确切项目,如著者名、 年代、出处等,或查检某课题原始文献的线索 及它们的具有收藏情况。

文献检索是相关性检索,不直接回答用户所提 技术问题本身,只提供有关的文献供参考。
举例: “关于自动控制系统有些什么参考文献”
CALIS公共目录检索系统检索界面
读秀知识库检索界面
三、信息检索语言

1.检索语言的概念
2.信息检索语言的功能与作用
3.信息检索语言的类型
1.信息检索语言的概念

信息检索语言是一种专门的人工语言,又 称标引语言和索引语言,是信息系统中用 以描述信息的内容及外表特征和检索者表 达检索提问的语言,是两者相互沟通的共 同依据,是用于信息标引和检索提问的约 定语言。

计算机信息检索基础知识

计算机信息检索基础知识

信息检索的步骤
研究课题 用户
主题分析
选择检索系统或 数据库
选择检索途径:主题 词、作者、机构等
检索操作
制定检索策略和 检索方式
初始检索 结果输出 不满意
用户结果评价
满意
检索结果
索取原文
三、网络信息资源及其特点
网络信息资源又称为虚拟资源、数字资源、 电子信息资源、联机信息资源、万维网资源 等,是互联网上电子信息资源的统称,是以 数字化形式记录的,利用计算机技术、通信 技术及多媒体技术在网络上发布、查询与存 取利用的信息资源的总和。
追溯法:这是利用已有的文献后面的参考文 献进行追溯查找的方法,是在没有检索工具 或检索工具不全的情况下使用的一种方法。 但用这种方法查找的文献不全,有片面性, 文章漏检率高,知识陈旧的占多数,目前已 很少有人使用。
分段法(循环法):这是将常用法与追溯法 交替使用的一种方法,即利用工具书检索文 献,又利用文献后面的参考文献进行追溯, 两种方法交替使用,直到满足读者需要为止。 这种方法可根据文献和本单位工具书收藏的 情况分期分段交叉运用不同的查找方法,既 能获得一定时期内的文献,还可节约查找时 间。
(3)专门从事数据库制作和销售的数据库商 如EBSCO公司、ProQuest公司等;自己没有出 版物,但他们买出版公司的产品,然后建立检索 平台供读者检索,例如iGroup公司建立了 Scitation平台,在上面可以看到AIP(美国物理 学会)、ASME(美国机械工程师协会)等几十 个专业学协会的电子期刊。
2信息检索技术
布尔逻辑检索 截词检索 位置检索 字段限定检索
布尔逻辑检索
逻辑与AND(*)。 逻辑或OR(+)。 逻辑非NOT(-)。

第二讲 计算机信息检索基础

第二讲 计算机信息检索基础

questions
铁(痕量元素);李铁(人名);铁道医学杂志(刊 名);上海铁道医学院,铁路医院(作者地址)…… 查找作者“黎明” 的文章,结果包括了“…黎明”及“黎 明…”的文章
英语单复数的变异 、英美拼法的不同、同义不同性词 (词干相同后缀不同);音译外来词中文取词的不同
1.
布尔逻辑运算符 Boolean Operators
《中国大百科全书》 Marriam Webster Dictionary 提供的《大不列颠百科全书》 免费查询
多媒体/超文本数据库 multimedia/hypertext database
同时存储声音、图像、文字等的超文本信息。
检索者如何让计算机实现自己的 检索意图?
四、检索提问表达式
检索提问表达式=检索词+运算符
以Dialog Medline 数据库为例: ⑴ With 运算符为“()” 表示检索词紧密相连,中间不能插入任何字母或 词,但允许有“ ” 或“_”,前后顺序不能 颠倒。 如 X()ray 表示 X ray 或 X-ray
(2)word 运算符为(nW)(n为自然数) 表示两词之间最多可插入0-n个词 前后顺序不能颠倒。 如:control(1w)system可以检索出“control system” “control in system”等的信息。
计算机信息检索特点
检索速度快 效率高
检索方便 实现资源共享
检索内容新 数量大
手段灵活 途径多样
快速 准确地 获得结果
缺点:收费、有时间限制、回溯性差,无法查久远的或最 新的文献。
二、检索软件类型
检索软件即用户与系统对话的界面, 可分为以下两种:
指令型
通过直接输

信息检索-检索基本知识

信息检索-检索基本知识
·凡带有“-”,应排在该类0之前,同级号码之后。
19.6.22
排列举例:
1. H1、H12、H、H134、H2、H219、H0、 H-44、 H 2-44 2. TP311.1、F0、G624、F2、O-44、I2457 、 TN912、TP319、
F 181、O13-43 、O-62 3. I247.5/J3、 I247.5/G5、F0/L21、FO/L12
1:H、H-44、H0、H1、H12、H134、H2、H 2-44、H219、 2:F0、F 181、F2、G624、I2457 、O-44、O-62、O13-
43、 TN912、TP311.1、 TP319 3:F0/L12、F0/L21、 I247.5/G5、 I247.5/J3
19.6.22
《科图法》
早,只好用倒查法,新兴学科,起始年代不远,可 用顺查法,波浪发展的学科,可选择发展高峰,用 循环法
19.6.22
检索语言
信息检索要克服的三个语言障碍: ★自然语言障碍 ★学科专业语言障碍 ★检索语言障碍
19.6.22
又称文献存储和检索语言,是根据文献信 息存储与检索的需要而创制的一种人工语言, 是汇集、组织、存储、检索文献信息的工具和 手段。
19.6.22
★00 马列、毛泽东思想 ★10 哲学 ★20 社会科学
21 历史、历史学 … 48 艺术 49 无神论、宗教学 ★50 自然科学 51 数学 … 54 化学 65 农业科学 71 技术科学 ★90 综合性图书
以字符构建主题语言:
1.关键词:直接从文献信息的标题、摘要或内 容本身抽取出来的用于揭示信息主题内容的自 由词。
磁盘式
19.6.22
19.6.22

信息检索第2讲

信息检索第2讲
第二章
信息检索原理及方法
信息检索概述
第一节
一、信息检索的含义 信息检索通常是信息用户为处理解决各种 问题而查找、识别获取相关的事实、数据、 知识的活动及过程。完整的信息检索,还包括 信息的存储。由此可知,信息检索的全过程 应包括两个主要的方面:
1)信息的标引和存储过程 对大量无序的信息资源进行标引处理, 使之有序化,并按科学的方法存储,组 成检索工具或检索文档,即检索系统的 组织过程。 2)信息的需求分析和检索过程 分析用户的信息需求,利用已组织好 的检索系统,按照系统提供的方法与途 径检索有关信息,即检索系统的应用过 程。
• 二、信息检索效率 • 信息检索效率是研究信息检索原理的是评 价一个检索系统性能优劣的质量标准,它始终 贯穿信息检索和信息存储的全过程。衡量检索 效率的指标有查全率、查准率、漏检率、误检 率、响应时间等。目前,人们通常主要以查全 率和查准率这两个指标来衡量。
1、查全率 利用检索系统进行某一课题检索时,检索出的相 关信息量(w)与该系统信息库中存储的相关信息量(x) 的比率称为查全率(R),用公式可表示为: R=
2、为人们更新知识、实现终生学习提供路 径 在当代社会,人们需要终生学习,不断 更新知识,才能适应社会发展的需求。
掌握信息检索的方法与技能,是形成合理知 识和更新知识的重要手段,是做到无师自通、 不断进取的主要途径。
2.1.2 信息检索类型
信 息 检 索 类 型
文献信息检索
依检索内容划分
数据信息检索 事实信息检索

• •
2、计算机检索系统
计算机检索系统又称现代化检索系统,是用计 算机技术、电子技术、远程通信技术、光盘技术、 网络技术等构成的存储和检索信息的检索系统。 • 按使用的设备和采用的通信手段,可分为联机 检索系统、光盘检索系统和网络检索系统。

第二讲信息检索概述

第二讲信息检索概述

4.限制符检索(Range)
限制符检索是通过限制检索范围,达到优化检索结 果的方法。不能完全确定检索词(关键词、主题词) 在数据库记录中出现的字段位置,特别在使用自由 词进行全文检索时,需要用字段限制检索的范围。 常用的字段代码有标题(TI)、文摘(AB)、叙词 (DE)、识别词或自由词(ID)、作者(AU)、语 种(LA)、刊名(JN)、文献类型(DT)、年代 (PY)等。这些限制符在不同的数据库系统有不同 的表达形式和使用规则。
4
信息检索步骤示意图



确定检索途径
分析检索课题

选择检索工具
1.分类途径
1.主题内容 2.时间范围

1.索引、文摘
2.主题途径
3.题名途径
3.信息类型

2. 全文数据库
4.著者途径
4.检索语种

5.其它途径
获 取 息一 次 信
选择检索工具 1.馆藏目录 2.图书馆
信息检索系统

确定一次信息出处 1.缩写还原为全称 2.音译转换成原名 3.信息类型
过程 课题
提问
标引
信息特征 标识
输入
信 息




索 工
输出





标引
系 检索提问 检索 统
(

标识

3
2.2 信息检索的一般方法
顺查法:时间上,远近 查全率高 到查法:时间上,近远 查准率高 抽查法:研究的高级阶段 检索效率高 追溯法(引文法) :
A.一次文献参考文献一次信息参考文献 …… 近远 B.一次文献引用该一次信息的文献新的一次 文献…… 实际是由“远近 ”越查文献越新 交替法(综合法)

第二章 信息检索基础知识

第二章 信息检索基础知识

返回
第二章 信息检索基础知识
文摘:通过描述文献的外部特征和简明深入地 文摘 通过描述文献的外部特征和简明深入地 摘录文献内容要点来报道文献的一种检索 工具。
【题 名】变电站开关操作对屏蔽电缆电磁干扰的预测 【作 者】齐磊 崔翔 华北电力大学高电压与电磁兼容,北京市昌平区 北京市昌平区102206 【机 构】华北电力大学高电压与电磁兼容 北京市昌平区 中国电机工程学报.2007,27(9).-46-51 【刊 名】中国电机工程学报 【ISSN号】0258-8013 号 【C N 号】11-2107 研究变电站瞬态电磁场对屏蔽电缆的电磁耦合问题, 【文 摘】研究变电站瞬态电磁场对屏蔽电缆的电磁耦合问题,对于提高变电站 内二次设备的抗电磁干扰能力具有极为重要的意义。 内二次设备的抗电磁干扰能力具有极为重要的意义。文中将矩量法与传输 线理论相结合, 线理论相结合,应用场线耦合理论计算变电站开关操作产生的空间电磁场 对站内屏蔽电缆的电磁干扰。通过与国际上通用的电磁暂态计算程序EMTP 对站内屏蔽电缆的电磁干扰。通过与国际上通用的电磁暂态计算程序 的计算结果进行比较,验证了计算方法的正确性,同时克服了EMTP只能处 的计算结果进行比较,验证了计算方法的正确性,同时克服了 只能处 理屏蔽电缆与母线平行放置的不足。最后,将该计算方法应用于500kV变电 理屏蔽电缆与母线平行放置的不足。最后,将该计算方法应用于 变电 站开关操作时, 站开关操作时,在屏蔽层不同接地方式的屏蔽电缆上产生的电磁干扰的数 值预测,获得了一些有益的结论,可为工程应用提供一定的理论依据。 值预测,获得了一些有益的结论,可为工程应用提供一定的理论依据。 返回
第二章 信息检索基础知识
第二章 信息检索基础知识 2.1 信息检索的基本原理 2.2 信息检索语言 2.3 信息检索工具与数据库 2.4 计算机检索技术 2.5 信息检索的方法和途径 2.6 计算机信息检索的基本过程 2.7. 检索效果的评价 2.8 文献传递与原始文献的获取

信息检索与利用第二课

信息检索与利用第二课

可以检出含有“ 可以检出含有“Heat pipe”的文献 的文献
(nW)算符
(nW)算符是(W)的复数形式,其中的 算符是( )的复数形式,其中的W 算符是 既表示With,也表示 既表示 ,也表示Words。在两词之间 。 使用( ), ),表示算符两侧的检索词的 使用(nW),表示算符两侧的检索词的 词序不可颠倒,但两词之间允许插入最 词序不可颠倒, 个词。 多n个词。 个词 – 例: Wear(1W)materials
截词算符
是指用给定的词干做检索词, 是指用给定的词干做检索词,查找含有 该词干的全部检索词的记录, 该词干的全部检索词的记录,也称词干 检索或字符屏蔽检索。 检索或字符屏蔽检索。
– – – – – 右截断(前方一致): 右截断(前方一致):comput* 前方一致 左截断(后方一致): ):*magnetic 左截断(后方一致): 中间截断(前后方一致): ):organi?ation 中间截断(前后方一致): 有限截断: 有限截断:fib? ? 无限截断 : comput* 等
续 上
列出Web的同义词: 的同义词: ③ 列出 的同义词 3W、万维网、环球网、环球信息网 、万维网、环球网、 的检索词为: 例1的检索词为: Web、3W、万维网、环球网、环球信息网分 、 、万维网、环球网、 布式、 布式、协同工作 构建检索式: 构建检索式:用检索算符连接上述检索词后 的检索式为: 的检索式为:
1.4计算机信息检索步骤 计算机信息检索步骤
1分析检索课题 分析检索课题 首先应了解该检索课题属于什么学科范围, 首先应了解该检索课题属于什么学科范围,以 便选择数据库; 便选择数据库;其次应了解国内外采用什么技 术术语,以便拟定检索词; 术术语,以便拟定检索词;再其次要了解检索 目的是广泛地调研发展现状(要查全), ),还是 目的是广泛地调研发展现状(要查全),还是 要解决什么具体技术问题(要查准); );是基础 要解决什么具体技术问题(要查准);是基础 理论研究(要查学术性期刊、会议论文、 理论研究(要查学术性期刊、会议论文、学位 论文),还是产品开发、 ),还是产品开发 论文),还是产品开发、工艺改造的应用性研 要查报告、专利、标准)。总之, )。总之 究(要查报告、专利、标准)。总之,只有先 对技术课题的性质、 对技术课题的性质、学科范围和检索目的等充 分了解后,才能顺利进行后续工作。 分了解后,才能顺利进行后续工作。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 数据库(文档)
由若干数量的记录构成的数据的集合。大型的 数据库检索系统中称为文档。
可检索字段
中国期刊网字段示例
命中记录列表
详 细 记 录
四 计算机检索技术
1 布尔逻辑运算符 2 截词算符 3 字段限制
4 范围限制 5.短语检索 6.括号检索
1、布尔逻辑运算符
①逻辑与: “*”或“and” ②逻辑或: “+”或“or” ③逻辑非: “-”或“not”
第二讲 计算机信息检索基础知识
主要内容
计算机检索的概念 数据库及其类型 数据库的结构 计算机检索技术 计算机检索的步骤、方法、途径
一 计算机信息检索的定义
指利用计算机存储和检索信息。
具体地说,就是指人们在计算机或计算 机检索网络的终端机上,使用特定的检 索指令、检索词和检索策略,从计算机 检索系统的数据库中检索出所需的信息 的过程。
“吸烟与心脏病的关系”
(smok* OR tobacco) AND (cardiopathy OR heart disease OR heart trouble OR heart attack)
4 进行检索
可利用数据库提供的不同级别 的检索界 面进行检索
--初级检索 --高级检索
5 分析检索结果 调整检索策略
检索点 即检索途径或检索入口、检 索字段。检索点正确与否,决定着 检索结果的数量与质量。
确定检索词
如:“吸烟与心脏病的关系” 可以表达为 connection between somking and heart disease 通过分析发现,其中,只有somking和heart disease两个概念词,而“connection between” 则不属于概念词。
检全率递增
题名 关键词( 文摘 )
检准率递增
全文
命中31篇 命中80篇
命中44篇 命中410篇
4 范围限制
指对检索词的范围(如时间、国别、语 种、信息类型等)进行约束或压缩的方 法,它大多通过检索系统的限制指令或 菜单选择来实现。
工程索引检索界面
5.短语检索
用“”表示,检索出与“”内容完 全相同的短语,提高检索的精度和 准确度。
1) 根据词表或数据库中的索引选词
2) 从专业词典、百科全书等参考工具中 选词
3) 利用中文全文数据库选择英文检索词
编制检索式
使用逻辑算符(AND, OR, NOT) 、截词、 位置算符, 限制检索条件至作者, 刊物 或年代 .
调整其他设定
选定检索结果的显示方式– 日期, 相关度等排序

Knowledge、CSAIDS、EBSCOHost、ProQuestordjne等多个著名 检索平台综合分析布尔逻辑、位置逻辑、模糊检索技术、网络叙 词表构建技术在网络数据库的应用,研究表明信息检索技术已深 深植入网络信息资源管理之中,深入剖析信息检索技术,可以清 晰揭示提问表达式的构建机理,掌握网络数据库的原理及使用方 法,为网络信息资源评价和建设提供依据。
数值型数据库 提供各类数值型数据
图象数据库 以图形、图象为记录单位
返回
返回
返回
返回
返回
数据库类型—按收录专业范围划分
综合性数据库
收录多个学科或专业的信息资料。如中国期刊网
专业性数据库
收录单一学科或专业的信息资料。
专题性数据库
收录某一特定专题的信息资料
综合型数据库
返回
举例:
【题 名】信息检索技术在网络数据库中的应用研究 【作 者】邹小筑[1] 缪红梅[2] 【机 构】[1]南京大学信息管理系,南京210093 [2]南京航空航天
大学,南京210016 【刊 名】图书情报工作.2007,51(2).-104-106,131 【ISSN号】0252-3116 【关键词】信息检索技术 网络数据库 检索平台 【文 摘】以信息检索技术为脉络,结合Ei Village2、ISI Web of
dam* dam dams
wom?n woman women
3、字段限制
指将检索词限定在特定的字段中进行。 • 同样的检索词,选择在不同字段中进行检索,
得到的结果是不同的。
• 检索系统通常都会设置默认的检索字段,如 “所有字段”。如果想指定在特定的字段中 查找检索词,就需要调整检索字段,进行字 段限制。
概念1:somking 概念2:heart disease
针对每一个概念,选择与之相 关的同义词或相关词
与somking相关的词有: smoker,smokers,tobacco等;
heart disease的同义词有cardiopathy,heart trouble, heart attack.
2.选择信息资源
是否与检索课题相关的资源都要检索 选择哪些学科的信息资源 选择哪些语种的信息资源 信息资源覆盖的年限是否符合需求 信息资源的特点及其针对性如何
3、构造检索式 选择检索点
检索式 是表达用户检索提问的逻辑 表达式,由基于检索概念产生的检 索词和各种组配算符构成。
作用:
缩小检索范围, 提高检准率
②“或”算符 or OR +
“或”算符可描述概念间的并列关系和相关 关系,用来组配同义词或相关词等。
含义:检出文献中包含有被其连接的任 意一个词或词组。
作用:扩大检索范围,提高查全率。 例如:自行车 + 脚踏车
CAD or computer aided design
缺省字段 为“篇名”
缺省字段为 “关键词”
缺省字段为 “All fields”
如果从文献的内容特征出发查找文献, 可选的检索字段有“篇(题)名 title”、 “关键词 keyword”、“文摘 abstract” 以及“全文 fulltext”。
一般,如果使用相同的检索词分别在这 几个字段中检索,那么检到的文献数会 依次递增,而命中的准确率则依次递减。
专业数据库 :
返回
专题数据库
三 数据库的结构—字段、记录和
文档
• 字段:文献著录的基本单元,反映文献
外部特征和内容特征的每一项目,在数 据库中就称为字段。
如:关键词KW、题名TI、文摘AB、作者AU、 刊名JN、出版时间PY、语种LA等
• 记录
由若干不同字段组成的文献单元,一条记录在 数据库中代表一篇文献。
同义词及相关词 增加被检索的数据库 – 确定其他数据库是否
覆盖你所要的主题
满意
是否已全部获取所需?
打印、电邮 或 存档
需否获取与题录相关的全文 ?
查找图书馆馆馆藏书目系统(OPAC),确定是否有纸本馆藏 查找图书馆订购的全文数据库 通过搜索引擎查找互联网开放获取(Open Access)的免费全文信息 通过馆际互借/文献传递从其他图书馆获取文献原文
课堂练习:
例1:课题名称:汽车导航系统的研究 例2. 课题名称:手持式心电图机 例3. 课题名称: 酸奶机
给出以上课题的检索词和检索式
例1:课题名称:汽车导航系统
的研究
关键词1. 汽车 机动车
关键词2. 导航系统 全球定位系统 GPS
关键词3. 研究 设计
调查
检索式的构造:
①“与”算符 and AND *
“与”算符用于描述概念间的交叉关系和限 定关系。
含义:检出文献中必须同时包含被其连 接的所有词或词组。
作用:缩小检索范围,提高查准率。 例如: 儿童 * 心理学
computer AND virus
与运算示意图
A
B
computer
virus
A and B 计算机 *病毒
1. 分析课题的内容
⑴明确检索目的
• 需要关于某一课题的系统详尽的信息 • 需要关于某一课题的最新信息 • 了解一些片断信息,解决一些具体问题
⑵明确课题的主题或主要内 容
要形成若干个既代表信息需求又有检索意义 的主题概念,包括所涉及的主题概念有几个, 哪些是主要的,哪些是次要的,概念之间关 系如何等
⑶课题涉及的学科范围:搞清楚课题所 涉及的学科领域、是否跨学科研究
⑷所需信息的数量、语种、年代范围、 类型等具体化指标
例:检索课题--不锈钢焊接
检索目的
查找范围
了解最新的技术 利用期刊、会议录类的
动态
数据库查找
了解焊缝强度的 利用技术标准类的数据 测试方法和有关 库查找 规格
申请专利
利用专利类数据库查找
知识回顾 Knowledge
(汽车+机动车)*(导航系统+全球定位 系统+GPS)*(研究+调查+设计)
例2. 课题名称:手持式心电图机
关键词1:手持 便携 微型 小型 袖珍 迷 你
关键词2:心电图机 检索式
(手持+便携+微型+小型+袖珍+迷你) *心电 图机
例3. 课题名称: 酸奶机
关键词1:酸奶 酸乳 发酵乳 关键词2:机 罐 装置 设备 检索式 (酸奶+酸乳+发酵乳) * (机+罐+装置+设备)
“international space station”
6.括号检索
用于改变运算的先后顺序,括号内的运 算优先进行。
(university or college) and education
五 计算机检索步骤、方法、途径
大体可分为五个步骤: 1.分析课题的内容; 2.选择信息资源; 3.构造检索式,选择检索途径; 4.上机检索; 5.分析检索结果,调整检索策略。
或运算示意图
B
A
pipe
相关文档
最新文档