第二讲 信息检索基础知识

合集下载

信息检索与利用

信息检索与利用
May 16, 2011
2-6
2 信息需求类型及特点
信息需求可以简单地理解为人们为了了解某类事 物的属性以达到某种特定目的, 物的属性以达到某种特定目的,由此而产生的了解相关 信息的一种需要。因为目的不同,信息需求不同, 信息的一种需要。因为目的不同,信息需求不同,而导 致检索行为的不同。 致检索行为的不同。
May 16, 2011
2-13
中国图书馆图书分类法
基本部类: 基本部类:
基本大类: 基本大类: (22个) 个 A 马列主义毛泽东思想邓小平理论 N 自然科学总论 O 数理化科学 B 哲学 1、马克思主义、列宁主义、毛泽东思 、马克思主义、列宁主义、 C 社会科学总论 想、邓小平理论 D 政治、法律 政治、 2、哲学 、 E 军事 3、社会科学 、 F 经济 4、自然科学 、 G 文化、科学、教育、体育 文化、科学、教育、 5、综合性图书 、 H 语言、文字 语言、 I J 文学 艺术
科学分类语言
学科分类语言是以知识分类为基本,按照学科性质及从属、 学科分类语言是以知识分类为基本,按照学科性质及从属、层次关系 以知识分类为基本 类目排序以字顺为标准。 来组织资 源,类目排序以字顺为标准。 优势:类目容量大,内容针对性、学术性更强, 优势:类目容量大,内容针对性、学术性更强,符合族性检索的要求。
3.科学研究需要的文献信息 3.科学研究需要的文献信息
要求能全面、系统地掌握某一阶段内相关的全部文 要求能全面、 献信息。检索上允许一定的误检,不允许漏检。 献信息。检索上允许一定的误检,不允许漏检。
4.解决某种具体问题需要的文献信息 4.解决某种具体问题需要的文献信息
要求文献种能提供相同或相似情况下的解决方法。 要求文献种能提供相同或相似情况下的解决方法。 检索上强调准确性,只求对解决问题的帮助, 检索上强调准确性,只求对解决问题的帮助,没有量上 的要求。 的要求。

第二讲 信息检索基础知识

第二讲 信息检索基础知识

1.1 信息检索的概念
广义信息检索
是将信息按一定的 方式进行加工、组 织并贮存起来,再 根据信息用户的需 要找出有关的信息 过程。它的全过程 又叫信息存储与检 索。
信息检索
狭义信息检索
指用户根据需要 ,借助于检索工 具,从信息集合 中找出所需要信 息的过程。本书 所介绍的信息检 索就是狭义信息 检索 。
1.2 信息检索的原理

储 一次 分析 信息
过 信息
特征

检 索 信息 过 需求 程
分析 检索 提问
标引 信息特征 输入 检
检 索
标识
(检索项)
索检
工 具 输出


和结
言 标引
检索提问 检索 系
标识


(检索词)
1.3 信息检索的类型
按信息检索的内容划分
▪ 数据信息检索(Data information Retrieval) ▪ 事实信息检索 (Fact information Retrieval) ▪ 文献信息检索 (Document information Retrieval)
青岛工学院图书馆http://10.10.58.103/
三、信息检索技术
检索技术,是指利用光盘数据库、联机 数据库、网络数据库、搜索引擎等进行信息 检索,采用的相关技术,主要包括布尔检索、 截词检索、字段检索、词位置检索、加权检 索等
检索方式
▪ 1、命令式检索:用逻辑运算符、位置算符及其他检索 符号,把不同的检索词连接起来进行检索的一个种方式。 适用于专业人员。
主题语言又分为标题词语言、单元词语言、叙词
语言和关键词语言,前两种语言目前使用较少。 1)叙词语言:叙词是为了适应计算机检索的需

第二讲信息检索基础

第二讲信息检索基础

回 顾

本讲主要内容
● ●
信息检索概念 信息检索意义 信息检索原理 信息检索类型 信息检索途径 信息检索方法

信息检索技术 信息检索策略 信息检索步骤

● ●

Hale Waihona Puke 信息检索语言信息检索利用



有一种能力与生俱来
有一种能力终身受用------信息检索
信息检索概念
南航学生事务服务中心:【名家讲坛】4月8 日19:00在一号楼四楼报告厅,延参法师邀 请你一起《快乐看人生》!本次讲座将凭票 入场,但入场券只提供入场资格,现场座位 先到先得!入场券将在本周日(3月31日) 16:00在学生事务服务中心办公室免费领取, 领完为止,同样先到先得哦!邀你的同学一 起聆听大师的教诲吧!
信息检索途径
是由提取信息源的外部与内部特征形成 的,又称为检索点或检索入口
题名 责任者 号码 (专利号、标准号等) 出版信息 丛编 装帧 责任者单位
分类 主题
外部特征 信息(文献)
内部特征
文献外部特征主要检索途径:题名 责任者 号码 文献内部特征主要检索途径:分类 主题
信息检索方法
德国柏林图书馆门前有这样一段话:“这里是知识的宝库, 你若掌握了它的钥匙,这里的全部知识都是属于你的。”
信息检索类型
信息检索类型
按检索对象性质: 文献检索:凡是以文献(包括文献线索、文摘、题录 和 全文)为检索对象的一种检索。检索结果是特定文献线索。 移动通信病毒文献有哪些? 数据检索:凡是以数据(包括计算公式、化学分子式、数 值、图表(参考工具书) )为检索对象的叫数据检索。 检索结果是数值性数据。今日人民币对美元汇率 事实检索:统计资料、百科知识、人物传记、案例等世界 上最长的斜拉桥是哪座,该桥位于什么地方,何时建成? 按检索方式:手工检索 计算机检索

第二讲计算机信息检索基础知识

第二讲计算机信息检索基础知识

举例:
【题 名】信息检索技术在网络数据库中的应用研究 【作 者】邹小筑[1] 缪红梅[2] 【机 构】[1]南京大学信息管理系,南京210093 [2]南京航空航天
大学,南京210016 【刊 名】图书情报工作.2007,51(2).-104-106,131 【ISSN号】0252-3116 【关键词】信息检索技术 网络数据库 检索平台 【文 摘】以信息检索技术为脉络,结合Ei Village2、ISI Web of
Knowledge、CSAIDS、EBSCOHost、ProQuestordjne等多个著名 检索平台综合分析布尔逻辑、位置逻辑、模糊检索技术、网络叙 词表构建技术在网络数据库的应用,研究表明信息检索技术已深 深植入网络信息资源管理之中,深入剖析信息检索技术,可以清 晰揭示提问表达式的构建机理,掌握网络数据库的原理及使用方 法,为网络信息资源评价和建设提供依据。
2.选择信息资源
是否与检索课题相关的资源都要检索 选择哪些学科的信息资源 选择哪些语种的信息资源 信息资源覆盖的年限是否符合需求 信息资源的特点及其针对性如何
3、构造检索式 选择检索点
检索式 是表达用户检索提问的逻辑 表达式,由基于检索概念产生的检 索词和各种组配算符构成。
检索点 即检索途径或检索入口、检 索字段。检索点正确与否,决定着 检索结果的数量与质量。
3、字段限制
▪ 指将检索词限定在特定的字段中进行。
• 同样的检索词,选择在不同字段中进行检索, 得到的结果是不同的。
• 检索系统通常都会设置默认的检索字段,如 “所有字段”。如果想指定在特定的字段中 查找检索词,就需要调整检索字段,进行字 段限制。
缺省字段 为“篇名”
缺省字段为 “关键词”
缺省字段为 “All fields”

第2讲 信息检索的基本知识

第2讲 信息检索的基本知识

!提高 信息查找能力的意义
节省研究人员的时间
信 息 检 索 基 础
是获取新知识的捷径
德国柏林图书馆门前有这样一段话:“ 这里是知识的宝库,你若掌握了它的钥 匙,这里的全部知识都是属于你的。” 这里所说的“钥匙”即是指信息检索的 方法。
本讲内容
信 息 检 索 基 础 1.1 信息、信息资源 1.2 文献信息及分类
摧毁的房屋、炸断的桥梁、向目标俯冲的飞机、穿梭不断的 子弹等等,通过自身的变化不断地显示着战争的状况。
感知、识别、记忆、记录:
参战者、战地记者、目睹者通过对战事的感知、识别、记忆、 记录手段等反映和报道伊拉克的战况。
传递:
媒体借助各种渠道传递着有关伊拉克的事件变化。
接受端:
人们通过报纸、广播、电视、Internet等渠道了解伊拉克战事 的动态。
通过发出信息、传递信息和接收信息,使世界各地及时 了解和研究伊拉克的战争。
2015-5-25 12
1.1 信息、信息资源
信 息 检 索 基 础 信息的含义 信息的简单理解:
信息不是事物本身,而是由事物发出的消 息、指令、数据等包含的内容。
——如“这是一个苹果”,“每天吃一个 苹果有益于健康”
2015-5-25
2015-5-25 23
1.2 文献信息及分类
信 息 检 索 基 础
学位论文——高等院校或者研究机构的学生为 取得各级学位,在导师指导下完成的科学研究、 科学试验、调查分析、软件开发等成果的书面 报告。 政府出版物——由政府机构制作出版、或者由 政府机构编辑并授权指定出版商出版的文献, 如政府法规文件、经济决议、调查统计分析资 料等。 标准文献——按照程序制定、经公认的权威机 构批准的一整套在特定范围(领域)内须执行 的规格、规则、技术要求等规范性文献,也包 括与标准工作有关的一切档案、推广宣传资料 等。

信息检索 第二讲 信息检索概述

信息检索 第二讲 信息检索概述

通过分析信息存储和检索的全过程可以看出检索语言
大致有以下四个主要的功能:

对文献的情报信息内容及其外表特征加以规范化的标引;
对内容相同及相关的文献信息加以集中或揭示其相关性;
可使文献信息的存储集中化、系统化、组织化,便于检
索者按一定的排列秩序进行有序化检索;

便于将标引用语和检索用语进行相符性比较。
科性质进行分类和系统排列 。

特点:能集中体现学科的系统性,反映事物的
从属、源生关系,便于按学科门类进行族姓检
索。
(1)分类语言

按照分类方式的不同:
混合分类语言 体系分类语言 分类语言
体系分类法是基于概念
的划分和概括,以学科 分类为基础,把概括文
献内容与事物的各种类
目组成一层层隶属、详 细列举的等级结构体系。
文献检索
事实检索
数据检索
7
3.信息检索的类型

文献检索。以文献或其索引、文摘为检索对象, 目的是核实已知文献的不确切项目,如著者名、 年代、出处等,或查检某课题原始文献的线索 及它们的具有收藏情况。

文献检索是相关性检索,不直接回答用户所提 技术问题本身,只提供有关的文献供参考。
举例: “关于自动控制系统有些什么参考文献”
CALIS公共目录检索系统检索界面
读秀知识库检索界面
三、信息检索语言

1.检索语言的概念
2.信息检索语言的功能与作用
3.信息检索语言的类型
1.信息检索语言的概念

信息检索语言是一种专门的人工语言,又 称标引语言和索引语言,是信息系统中用 以描述信息的内容及外表特征和检索者表 达检索提问的语言,是两者相互沟通的共 同依据,是用于信息标引和检索提问的约 定语言。

第二节 信息检索的基础知识

第二节 信息检索的基础知识

TV 水利工程
分类语言
简表:又称为基本类目表,是分别对每个基 本大类,依据它的某些属性,作进一步划分 后而形成的二、三级类目表 。
如:O 数理科学和化学 一度划分: O1 数学 O3 力学 O4 物理学 O6 化学
O1 数学,二度划分:
O11 古典数学 O12 初等数学 O13 高等数学 O14 数理逻辑、数学基础 O15 代数、数论、组合理论 O17 数学分析 O18 几何、拓扑 O19 动力系统理论 ……
外表特征:题名、著者、出版事项等 内容特征:分类号、主题词等 信息检索:指运用编制好的检索工具或系统,从信息集合中查 找并获取与用户提问相关的信息的过程 。——狭义

储 过
信息源

筛选信息
概念分析
概念转换成检索语言-标引
信息检索原理
信息检索系统
检索结果



信息用户

概念转换成检索语言-提问



根据课题所属学科研究发展的某一高峰时期,抽出一个时间 段,进行集中查找。
文献检索方法
(3) 综合法(循环法或分段法)
常用法+追溯法。即利用常用法检索出一批有用文献,然后 利用这些文献所附的参考文献由近及远,或这些文献被引用情 况由远及近地查找。如此分段交替循环进行,从而可得到大量 相关文献。
2.6 文献检索的途径 指利用文献的各种特征——检索标识,通过检索工具查找所
第二节 信息检索的基础知识
2.1 信息检索的概念 广义:指将信息按一定的方式组织和存储起来,并根据用户的 需要检出所需信息的过程。包括信息存储和信息检索两个过程。
信息存储:将大量无序的信息集中起来,根据其外表特征和内 容特征,经过加工,使其系统化、有序化,并按一定的技术要 求建成一个具有检索功能的工具或系统。

信息检索.ppt

信息检索.ppt

AB
A not B;A-B;
information retrial and utilization
LOGO
检索要求
逻辑检索
课题
表达式 检索结果
概念相交、 限定
概念平行、 并列
概念删除 (排除部分 主题)
与 AND *
或 OR +
非 NOT
矿渣 AND 矿渣用于制 生态水泥
缩小检索范 围
备生态水泥
矿渣*生态水 泥
实施检索
评价检 索结果
不满意
满意 获取检索结果
图2 信息检索基本步骤流程图
LOGO
课题检索基本步骤
▪ 1、课题分析。把握知识点,确定检索词,界 定检索范围;
▪ 2、选择相关信息资源(数据库或检索工具); ▪ 3、制定检索策略。编写检索式,选择检索途
径或检索入口; ▪ 4、检索。获取检索结果,分析; ▪ 5、调整检索策略再检索。查看检索结果或信
information retrial and utilization
LOGO
2. 位置检索
➢(W) • 词序不许颠倒 • 两词之间不许插词,只允许出现空格或连字符号
示例: solar(w)energy 检出 solar energy
correlation(w)matrix 检 出 correlation matrix 、 correlation-matrix
LOGO
信息检索的基本原理
信息处理者
信息存储
信息采集 信息加工 信息存储
信息源
信息检索
数据库 信息集合
匹配运算
信息需求 需求特征 特征组配
结果处理 结果展示
图1 信息检索基本原理图

最新第2章信息检索基本知识ppt课件

最新第2章信息检索基本知识ppt课件

布尔逻辑运算符优先级
• 布尔运算符优先级比较
–有括号时:括号内的先执行; –无括号时:NOT > AND > OR
• 例:检索“唐宋诗歌”的有关信息。 – 关键词:唐、宋、诗歌; – 检索表达式:
• (唐 OR 宋)AND 诗歌; • 唐 AND 诗歌 OR 宋 AND 诗歌; – 错误表达式: • 唐 OR 宋AND诗歌; • 唐 AND 宋AND诗歌; • 唐 OR 宋OR诗歌; • 唐AND 宋OR诗歌;
3、事实检索
是以具体事项为检索内容的信息检索。
(二)按是否使用检索工具划分 1、直接检索
就是指利用一次文献进行检索,这是以前比较常用的一 种查找方法。所花时间多和精力大,检出文献少。
2、间接检索
就是指利用各种检索工具获得文献线索,再根据线索去 查找原始文献线索的方法。
(三)按信息检索手段划分 1、传统信息检索
一、检索工具的功能
1、报道功能 2、存储功能 3、检索功能
二、检索工具的特点
1、详细而又完整地记录了文献的外部特征和内部特征。 2、对所著录的文献,标引了可供检索的检索标识。 3、提供必要的检索手段,配备各种体系的索引。
三、检索工具的类录 2、文摘 3、索引
目索文录引摘:::是把是按一一照种种某或著种多录明种文白文献 题易献录懂中和的具内顺有容序检摘编索要排意的义检文的索献特 工清征具单分。或别清著册录,、通排常序以并一注 如个明:完出人大整处复的以印资出供料版查单检位的或工收具 藏书单。位索为引著的录基的本组基织本单单 元位是。条目,每个条目一般 如由:序《全号国、新书标目识》或索引词、 注释《社、科出新书处目等》 若干环节
2、三者提供的资料不同: 目录提供某一方面较成熟系统的知识,索引、文摘提供相对分散 的资料线索。

第二讲信息检索概述

第二讲信息检索概述

4.限制符检索(Range)
限制符检索是通过限制检索范围,达到优化检索结 果的方法。不能完全确定检索词(关键词、主题词) 在数据库记录中出现的字段位置,特别在使用自由 词进行全文检索时,需要用字段限制检索的范围。 常用的字段代码有标题(TI)、文摘(AB)、叙词 (DE)、识别词或自由词(ID)、作者(AU)、语 种(LA)、刊名(JN)、文献类型(DT)、年代 (PY)等。这些限制符在不同的数据库系统有不同 的表达形式和使用规则。
4
信息检索步骤示意图



确定检索途径
分析检索课题

选择检索工具
1.分类途径
1.主题内容 2.时间范围

1.索引、文摘
2.主题途径
3.题名途径
3.信息类型

2. 全文数据库
4.著者途径
4.检索语种

5.其它途径
获 取 息一 次 信
选择检索工具 1.馆藏目录 2.图书馆
信息检索系统

确定一次信息出处 1.缩写还原为全称 2.音译转换成原名 3.信息类型
过程 课题
提问
标引
信息特征 标识
输入
信 息




索 工
输出





标引
系 检索提问 检索 统
(

标识

3
2.2 信息检索的一般方法
顺查法:时间上,远近 查全率高 到查法:时间上,近远 查准率高 抽查法:研究的高级阶段 检索效率高 追溯法(引文法) :
A.一次文献参考文献一次信息参考文献 …… 近远 B.一次文献引用该一次信息的文献新的一次 文献…… 实际是由“远近 ”越查文献越新 交替法(综合法)

第二章 信息检索基础知识

第二章 信息检索基础知识

返回
第二章 信息检索基础知识
文摘:通过描述文献的外部特征和简明深入地 文摘 通过描述文献的外部特征和简明深入地 摘录文献内容要点来报道文献的一种检索 工具。
【题 名】变电站开关操作对屏蔽电缆电磁干扰的预测 【作 者】齐磊 崔翔 华北电力大学高电压与电磁兼容,北京市昌平区 北京市昌平区102206 【机 构】华北电力大学高电压与电磁兼容 北京市昌平区 中国电机工程学报.2007,27(9).-46-51 【刊 名】中国电机工程学报 【ISSN号】0258-8013 号 【C N 号】11-2107 研究变电站瞬态电磁场对屏蔽电缆的电磁耦合问题, 【文 摘】研究变电站瞬态电磁场对屏蔽电缆的电磁耦合问题,对于提高变电站 内二次设备的抗电磁干扰能力具有极为重要的意义。 内二次设备的抗电磁干扰能力具有极为重要的意义。文中将矩量法与传输 线理论相结合, 线理论相结合,应用场线耦合理论计算变电站开关操作产生的空间电磁场 对站内屏蔽电缆的电磁干扰。通过与国际上通用的电磁暂态计算程序EMTP 对站内屏蔽电缆的电磁干扰。通过与国际上通用的电磁暂态计算程序 的计算结果进行比较,验证了计算方法的正确性,同时克服了EMTP只能处 的计算结果进行比较,验证了计算方法的正确性,同时克服了 只能处 理屏蔽电缆与母线平行放置的不足。最后,将该计算方法应用于500kV变电 理屏蔽电缆与母线平行放置的不足。最后,将该计算方法应用于 变电 站开关操作时, 站开关操作时,在屏蔽层不同接地方式的屏蔽电缆上产生的电磁干扰的数 值预测,获得了一些有益的结论,可为工程应用提供一定的理论依据。 值预测,获得了一些有益的结论,可为工程应用提供一定的理论依据。 返回
第二章 信息检索基础知识
第二章 信息检索基础知识 2.1 信息检索的基本原理 2.2 信息检索语言 2.3 信息检索工具与数据库 2.4 计算机检索技术 2.5 信息检索的方法和途径 2.6 计算机信息检索的基本过程 2.7. 检索效果的评价 2.8 文献传递与原始文献的获取
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.2 截词检索
截词检索,是指用给定的词干做检索词,用以检索出含 有该词干的全部检索词的记录。
它可以起到扩大检索范围、提高查全率、减少检索词的 输入量、节省检索时间等作用。
检索时,若遇到名词的单复数形式、词的不同拼写法、 词的前缀或后缀变化时均可采用此方法。
截词符一般使用“?”和“*”表示
第二讲 信息检索基础知识
主讲:刘晓红
信息检索基础知识
▪ 一、 信息检索概念与原理 ▪ 二、 信息检索语言 ▪ 三、 信息检索技术 ▪ 四、 信息检索的过程和步骤 ▪ 五、 结果评价
一、信息检索概念与原理
▪ 1.1 信息检索的概念 ▪ 1.2 信息检索的原理 ▪ 1.3 信息检索的类型 ▪ 1.4 信息检索方法
1805
▪ “逻辑或” 用得越多,检中的文献会越来越多。
逻辑非 NOT
用于从原来的检索范围中排除不需要的概念,或影 响检索结果的概念。
可使用“-”来表示,其检索表达式为:“A NOT B”或“A-B”,即检索记录中包含A词但不含有B词。
例:自由分配方面的文献(排除海南大学师生的著作) 提问式: (关键词=‘自由分配’) not (单位=‘海南大学')
如:经济 *( WTO + 世界贸易组织) * 企业 * 发展 2、菜单式检索:一种通过窗口菜单进行检索的简单、易
操作的检索方式。适用于一般读者检索。如图:
3.1 布尔逻辑检索
逻辑算符是表达检索提问的各概念之间的逻辑关系。 逻辑算符有三种: AND (与)、OR(或)、NOT(非)。三 种算符可同时在一个检索式中使用,也可单独使用。 使用逻辑算符时应注意的事项: ①逻辑算符的优先级为:NOT、AND、OR,可用括 号来改变优先顺序。 ②在逻辑组配时,算符的两侧必须各留有一个空格。
超星数字图书馆
杜威十进分类法:
所有知识体系分为十个基本大类,每个基本大类下又分为十类,
每类又分为十小类
300 社会科学总论
000 总类 100 哲学类 200 宗教类 300 社会科学类 400 语言类 500 纯科学类 600 应用科学类 700 艺术类 800 文学类
310 普通统计学 320 政治学 330 经济学 340 法律 350 公共行政管理 360 社会机构社会团体 370 教育 380 贸易、通讯、运输 390 习俗、礼仪、民俗
1.1 信息检索的概念
广义信息检索
是将信息按一定的 方式进行加工、组 织并贮存起来,再 根据信息用户的需 要找出有关的信息 过程。它的全过程 又叫信息存储与检 索。
信息检索
狭义信息检索
指用户根据需要 ,借助于检索工 具,从信息集合 中找出所需要信 息的过程。本书 所介绍的信息检 索就是狭义信息 检索 。
Z 综合性图书
分类号和索书号
▪ 读者实际利用图书馆时,往往需要知道书刊的 分类号和索书号(又称索取号)。
▪ 索书号是图书馆赋予每一种馆藏图书的号码, 是读者查找图书非常必要的代码信息。它的第 一部分是分类号,第二部分是书次号。
▪ 索书号的两部分之间有一个空格或一条斜线 “/”。书次号或者是按照图书作者姓名所编排 的著者号码,或者是按照图书进入馆藏时间的 先后所取用的顺序号码。
分类号和索书号
▪ ——不同的索书号确定排列先后顺序的步骤是,
先比较分类号码;如分类号码相同再比较著者 号码或顺序号码。 ▪ 分类号比较:先英文字母排,后阿拉伯数字按 小数制排。分类号中“-”排在0之前,例如:先 排F-43再排F0。 ▪ 分类号的数字排列比较采用对位比较法,字符 序列以ASCII字符集为依据。比如:B11、B111、 B112、B12,书次号的数字排列比较采用自然顺 序排列方法,即1,2,3,...,9,10,11,..., 99,100,101,…。
检索语言类型
2.1 分类语言
分类语言(classification retrieval language)
是以知识的学科体系为基础,以符号(数字、 字母)为概念标识进行文献内容特征揭示的一 种检索语言。它以学科类目名称作为基本词汇, 通过类目的从属关系来表达复杂的概念。
分类法:以知识属性来描述和表达文献内 容特征的方法称为分类法。常用于图书资料的 分类和排架。
青岛工学院图书馆http://10.10.58.103/
三、信息检索技术
检索技术,是指利用光盘数据库、联机 数据库、网络数据库、搜索引擎等进行信息 检索,采用的相关技术,主要包括布尔检索、 截词检索、字段检索、词位置检索、加权检 索等
检索方式
▪ 1、命令式检索:用逻辑运算符、位置算符及其他检索 符号,把不同的检索词连接起来进行检索的一个种方式。 适用于专业人员。
1.2 信息检索的原理

储 一次 分析 信息
过 信息
特征

检 索 信息 过 需求 程
分析 检索 提问
标引 信息特征 输入 检
检 索
标识
(检索项)
索检
工 具 输出


和结
言 标引
检索提问 检索 系
标识


(检索词)
1.3 信息检索的类型
按信息检索的内容划分
▪ 数据信息检索(Data information Retrieval) ▪ 事实信息检索 (Fact information Retrieval) ▪ 文献信息检索 (Document information Retrieval)
交替进行,直到满意为止。
二、信息检索语言
检索语言(retrieval language)是文献信息标引和
检索提问而约定的人工语言。
检索语言是为沟通文献标引与文献检索而编制的人
工语言,也是连接信息存储和检索两个过程中标引 人员与检索人员双方思路的渠道。 ——在存储的过程中用于标引信息称为标引语言; ——用于编制索引就称为索引语言; ——用于信息检索则称为检索语言。
900 地理历史类
2.2主题语言
主题语言是一种描述性语言,它用语词直接表达信息
的主题,这些语词就是表达主题概念的标识,将这些作 标识的语词按字顺排列并使用参照系统来间接表达各种 概念之间的关系。
【什么是主题】 主题“是一组具有共性事物的总称,用以表达文献所论述和研 究的具体对象和问题”,即文献的“中心内容”。 【什么是主题词】 表达主题概念的词汇就是主题词。 狭义的主题词仅指叙词 ; 广义主题词可以分为规范词汇和自由词汇,包括关键词、主题 词、标题词、叙词。
按截词位置分:前截断、后截断、中间截断 按截词的字符数量分:有限截断(?)、无限截断(*)
后方截断:又称右截词、前方一致,允许检索词尾部有若干 变化形式。主要用在词的单复数、年代、作者、查同根词等 情况。
如:检索式“Comput?”将检出包含Computer、Computing、 Computed、Computerization等词汇的结果。
汉语主题词表中正式主题是太阳能利用、太阳能 加热等代替。
2)关键词语言 关键词是指直接从文献的标题、正文或摘要
中直接提取未经规范化具有实质意义的词或词组, 一般由著者给出。关键词语言就是将文献中的一 些主要关键词抽出作为检索标识,并以字顺排列 组成的查找文献用的语言。
一般通用词(技术、理论、应用等)以及无实质意义 的词(冠、接词、连词等)不作关键词使用。
▪ 中图法分为5大部(马列主义毛泽东思想、哲学、 社会科学、自然科学、综合性学科 )
▪ 22个大类,除工业技术类外,其余各大类均用一个 大写字母表示一级类目名,分别用22个大写字母表 示(其中除掉L、M、W、Y)。再根据学科的内容 在大类下以数字表示各级类目。
中国图书馆图书分类法
▪ 基本部类: 基本大类: (22个)
一、中国图书馆分类法 二、中国人民大学图书馆分类法 三、中国科学院图书馆图书分类法 四、 杜威十进分类法 (DDC) 五、国际十进分类法 (UDC) 六、美国国会图书馆图书分类法 (LCC)
中国图书馆分类法
▪ 中图法是由政府部门编制的一部综合性图书分类法, 于1974年出版,经过多次修订,目前使用的是第四 版, “中图法”是国家推荐统一使用的分类法,被许 多检索工具采用或改编。
▪ 检索式(关键词) 命中文献篇数

数字
27305
▪ 图书馆
18759
▪ 数字and图书馆
2420
▪ 高校and数字and图书馆
233
▪ 检索时,“逻辑与”组配越多,检索命中文献的结果就越 少。
逻辑或OR 用于并列概念的组配,可以扩大检索范围,
提高查全率,可使用“+”或“|”来表示。 其检索表达式为:“A or B”或“A+B”,
即检索记录中含有A词或者B词中的任何一词即 可。
例:数据挖掘在信息检索与信息分析中的应用 提问式:数据挖掘 * (信息检索 + 信息分析)
▪ 检索举例:
▪ “研究杜甫”方面的有关文献。以中国知网1999-2007 为统计数据。
▪ 检索式(关键词)

杜甫
▪ 杜甫or杜诗or李杜
命中文献篇名数 1357
1.4.2 回溯检索法
回溯检索法又称追溯法、引文法、引证法,是一 种跟踪查找的方法。这种检索方法不是利用确定的 检索工具,而是利用已知文献的某种指引(如文献 附的参考文献、有关注释、辅助索引、附录等)追 踪查找文献。
用追溯法检索文献,最好利用与研究课题相关 的专著与综述。
在检索工具不全或文献线索很少的情况下,可 采用此法。
主题语言又分为标题词语言、单元词语言、叙词
语言和关键词语言,前两种语言目前使用较少。 1)叙词语言:叙词是为了适应计算机检索的需
要产生的。它对自然语言中的“多词一义”的词汇 进行规范,保证一个叙词只对应一个概念。它是从 文献题目、正文或摘要中抽取出来的,经过规范化 的基本概念单元词。 如:课题: 太阳能热水器研究
相关文档
最新文档