第二章 信息检索概述

合集下载

信息检索基础知识

信息检索基础知识

TP 自动化技术、计算技术
3 计算技术、计算机
31
计算机软件
316
操作系统
.1
分时操作系统
.2
实时操作系统
.7
Windows操作系统
39
计算机的应用
… F25 物资经济 F250 物资经济理论 F252 物资流通
… F5 交通运输经济 F50 交通运输经济理论
… F53 铁路运输经济 F54 陆路、公路运输经济
匹配有其匹配标准,这里涉及到两者一致性、 相关度等问题,按一定的标准筛选出符合要求的 信息。
精选ppt
3
信息检索一般过程
信息源
信息分析、 著录、标引
信息的表示
用户
检索语言
用户需求分析
数据库 匹配过程
输出检索结果 精选ppt
检索表达式
4
信息检索的过程往往需要一个评价反馈途径,多次比较匹配, 以获得最终的检索结果。其图示如下:
9
责任者 及其单位
中图分类号 文献标示码
关键词
正文
精选ppt
题名 摘要
10
分类语言
也属于主题语言。分类语言是按学科范畴划分而构成的一 种语言体系,它集中反映学科的系统性、反映它们的相关、 从属、派生等关系,从总体到局部分层、分面展开,形成 分类体系。由类目号码及名称作为检索语言,构成分类类 目表,如前述图书分类表、专利分类表用的都是分类语言 。
13
……
主题语言
包括:关键词语言、单元词语言、标题词语言、叙词语言等,它们有不同 的主题词表。主题词表达概念本身,在主题词表中通过参照系统来指示词 汇之间的关系。如”交通运输”、“国际物流”。主题语言分为规范主题语

信息检索课件第2章

信息检索课件第2章
学术评价与评估
信息检索还可以用于学术评价与评估,通过对学术论文的 发表数量、被引次数等指标进行统计和分析,评价研究者 的学术水平和影响力。
信息检索在商业领域的应用
市场调研与竞争情报
企业通过信息检索技术收集市场和竞争对手的信息,了解市场需求、 竞争态势和行业趋势,为制定营销策略和产品开发提供支持。
品牌监测与管理
信息检索课件第2章
contents
目录
• 信息检索概述 • 信息检索技术 • 信息检索系统 • 信息检索的实践应用 • 信息检索的伦理与法律问题
01 信息检索概述
信息检索的定义
信息检索是利用计算机和人工 手段,从大量信息中查找和获 取特定信息的过程。
信息检索涉及对信息资源的组 织、标识、评价和检索等方面。
信息检索的目的是为用户提供 准确、及时和有用的信息。
信息检索的原理
信息检索基于信息需求, 通过特定的检索方式,从 信息源中获取相关信息。
信息检索的原理包括信息 标引、信息存储和信息检 索三个主要环节。
信息标引是对信息进行分 类、主题分析等处理,以 便于信息存储和检索。
信息检索是根据用户的信息需 求,利用特定的检索工具和策 略,从信息源中获取相关信息 。
网络搜索引擎、学术搜索引擎、特定领域搜索引擎等。
基于检索技术的分类
基于关键词的检索、基于内容的检索、基于知识的检索等。
信息检索系统的评价
查全率
检索系统返回的相关结果数量 与总相关结果数量的比值。
查准率
检索系统返回的相关结果中, 真正相关的结果数量与返回的 相关结果数量的比值。
响应时间
检索系统对用户查询的响应时间 ,即从用户提交查询请求到检索 系统返回结果所需的时间。

第二章 文献信息检索概述讲义(教学用)

第二章 文献信息检索概述讲义(教学用)

第二章文献信息检索概述导入:面对以下问题怎么办?知识更新的速度越来越快,当代大学生如何应对挑战?将来从事的工作与所学专业完全不相关,你如何应对?信息检索的重要性:有效、快速地获取所需信息☐为什么要进行文献信息检索(know why)?☐什么是文献信息检索(know what)?☐怎么去做文献信息检索(know how)?第一节文献信息检索的基本原理第二节文献信息检索途径与策略第三节文献信息检索的方法与步骤第一节文献信息检索的基本原理一、信息检索(Information Retrieval)1、检索:所谓检索是指查找、寻求、获取的意思。

2、信息检索:指将信息按一定的方式组织和存储起来,根据信息用户的需求,找出信息的过程。

广义的检索包括信息存储与检索两个过程。

狭义的信息检索指后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查询。

3、信息检索原理:原始文献——加工整理——数据库(存储)提问——检索——输出(检索)简而言之:文献信息检索是指从信息集合中找出所需要的信息的过程,仅指检索一个过程。

二、文献检索的分类按其检索对象分为:1、文献检索:凡是以文献为检索对象的称为文献检索。

它不直接解答用户所提出的技术问题本身,只是提供相关的文献供用户参考。

2、数据检索:凡是以数据作为检索对象的称为数据检索,它直接回答用户提出的技术问题,即直接提供用户所需要的确切的数据或事实3、事实检索:凡是以事实为检索对象的成为事实检索,直接查询事实性答案,提供用户所需要的确切事实,是一种确定性检索。

例:同类产品中,哪个品牌销售量最大?4、概念检索:就是查找特定概念的含义、作用、原理或使用范围等解释性内容或说明。

数据、事实、概念检索得到的是能够确切解答问题的信息,或者说是文献中的具体信息。

文献线索检索则是检索出包含所需要信息的文献,其结果是与某一课题有关的若干篇论文。

文献检索是最典型、最重要和最常用的文献信息检索。

信息检索的基本知识_OK

信息检索的基本知识_OK
7
计算机检索系统的主要特点
检索速度快,能大大提高检索 效率,节省人力和时间。 采用灵活的逻辑运算和后组式 配方式 便于进行了多元概念检 索。 能远程检索。
8
⑵信息检索系统的类型
(续)
按著录和标引方式划分
①目录型检索系统:包括国家书目,联 合目录,馆藏目录
②题录型检索系统:它的著录对象是单 篇文献,因此具有加容易、报道量大、 出版迅速等特点,是查找最新文献线 索的重要工具。
2
一、信息检索原理(续)
1、信息的存储与检索
信息检索是指将信息按照一定的方式组织 和存储起来,并根据用户的需要,找出所
需信息的过程。广义的信息检索包括信息的 存储和检索两个过程,而狭义的信息检索 只包括后一个过程,即为处理解决各种问 题而查找
信息的存储过程就是按照主题词表或分类 表及使用原则对原始信息资源进行处理, 形成信息特征标识,为检索提供经过整序 的信息集合的过程。
第二章 信息检索的基本知识 本章主要内容:信息检索原理、 信息检索语言 、信息检索的基 本程序与信息检索的基本方法 询和文摘索引工作.从19世纪下半叶开 始发展,至20世纪40年代.索引和检索已 成为图书馆独立的工具和用户服务项 目。20世纪中叶以前,信息存储和传 播主要以纸质介质为载体,信息检索 活动也围绕着文献的获取和控制展开。
5
一、信息检索原理(续)
⑵信息检索系统的类型
按信息处理手段划分有 ①手工检索系统。又称传统检索系统 是使用人工来查找信息的检索系统。 其主要类型有各种书本式的目录、题 录、文摘和各种参考工具书等。优点: 方便、灵活、 断准确。缺点:检索速 度太慢
6
按信息处理手段划分有 (续)
②计算机检索系统。以称现代化 检索 系统,是用计算机技术、电子技 术、远程通讯技术、光盘技术、网络 技术等构成的存储 和检索信息的检索 系统。存储时,将大量的各种信息以 一定的格式输玉到系统中,加工处理 成可供检索的数据库。检索时,将符 合检索需求的提问式输入计算机,在 选项定的数据库中进行匹配运算,然 后将符合提问式的检索 结果按要求的 格式输出。

《信息检索教案》课件

《信息检索教案》课件

《信息检索教案》PPT课件第一章:信息检索概述1.1 信息检索的定义解释信息检索的概念和意义强调信息检索在学术研究和日常生活的重要性1.2 信息检索的类型介绍不同类型的信息检索方法,如手工检索、计算机检索等解释各种检索方法的优缺点和适用场景1.3 信息检索的流程介绍信息检索的基本步骤,如确定检索需求、选择检索工具等提供实用的检索技巧和策略,帮助学生更有效地获取信息第二章:检索工具与数据库2.1 检索工具的类型介绍不同类型的检索工具,如目录、索引、文摘等强调各种检索工具的特点和适用场景2.2 数据库的类型介绍不同类型的数据库,如文献数据库、全文数据库等解释各种数据库的优缺点和适用场景2.3 检索工具与数据库的选择提供选择检索工具和数据库的依据和方法强调选择合适的工具和数据库对信息检索的重要性第三章:网络信息检索3.1 搜索引擎的使用介绍搜索引擎的概念和原理讲解如何有效地使用搜索引擎进行信息检索3.2 学术搜索引擎的使用介绍学术搜索引擎的概念和特点讲解如何利用学术搜索引擎获取学术信息3.3 社交媒体与网络信息检索介绍社交媒体在信息检索中的应用强调社交媒体在获取实时信息和社交网络分析中的价值第四章:信息检索技巧与策略4.1 检索关键词的选择讲解如何选择合适的检索关键词提供关键词选择的方法和技巧4.2 布尔逻辑检索介绍布尔逻辑检索的概念和原理讲解如何运用布尔逻辑提高检索效果4.3 短语检索与位置算符介绍短语检索和位置算符的概念和用法强调短语检索和位置算符在精确检索中的重要性第五章:信息检索实践与应用5.1 学术研究中的应用讲解信息检索在学术研究中的重要性演示如何利用信息检索进行文献综述和实证研究5.2 日常生活中的应用讲解信息检索在日常生活中的应用案例强调信息检索对提高生活质量的重要性5.3 信息检索的道德与法律问题介绍信息检索中的道德和法律问题,如版权、隐私等强调信息检索时应注意的道德和法律规范第六章:特定信息类型的检索6.1 图像和多媒体信息的检索介绍如何检索图像和多媒体信息演示使用图像搜索引擎和多媒体数据库的技巧6.2 统计数据的检索讲解如何检索统计数据介绍使用政府统计网站和专业统计数据库的方法6.3 专利信息的检索介绍如何检索专利信息演示使用专利数据库进行检索的步骤和技巧第七章:信息评估与批判性思维7.1 信息评估的标准讲解评估信息质量的标准和原则强调批判性思维在信息评估中的重要性7.2 识别信息源的可靠性介绍如何识别和评估信息源的可靠性分析不同类型信息源的可信度和偏见7.3 信息批判性思维的实践讲解如何运用批判性思维分析信息演示通过信息检索进行批判性思维实践的案例第八章:信息素养与终身学习8.1 信息素养的概念解释信息素养的内涵和外延强调信息素养在现代社会的重要性8.2 培养信息素养的策略介绍培养个人信息素养的策略和方法强调终身学习在维持和提升信息素养中的作用8.3 信息素养的实践应用讲解信息素养在个人和专业生活中的应用演示如何利用信息素养解决实际问题第九章:信息检索的未来趋势9.1 与信息检索介绍在信息检索中的应用探讨如何改变信息检索的方式9.2 大数据与信息检索讲解大数据对信息检索的影响探讨大数据时代信息检索的新挑战和新机遇9.3 未来信息检索技术的发展趋势预测未来信息检索技术的发展方向强调终身学习的重要性以适应不断变化的技术环境第十章:综合实践与案例分析10.1 综合实践项目设计设计一个综合实践项目,要求学生应用所学信息检索技能提供项目实施步骤和评估标准10.2 案例分析与讨论提供几个案例分析,要求学生应用信息检索技能解决问题鼓励学生进行讨论,分享他们的思考和经验10.3 课程总结与展望总结整个课程的重点和难点展望信息检索领域的发展前景,鼓励学生持续学习和探索重点解析本文教案主要涵盖了信息检索的概述、检索工具与数据库的选择、网络信息检索、信息检索技巧与策略、信息检索实践与应用、特定信息类型的检索、信息评估与批判性思维、信息素养与终身学习、信息检索的未来趋势以及综合实践与案例分析等十个章节。

文献检索,信息检索(2)第二章 信息检索原理

文献检索,信息检索(2)第二章  信息检索原理

数据库
检索提问
匹配过程
输出检索结果
二、信息检索的类型
按检索内容划分 1、文献检索
是以文献为检索对象的信息检索。
2、数据检索
是以数据为检索内容的信息检索,要求
从检索系统存储的大量原实检索
是以具体事项为检索内容的信息检索, 要求从检索系统存储的各种原始信息资源中查出专门的 事实材料。
三、检索工具的结构
(一)计算机检索工具结构 1、检索软件 (二)手工检索工具结构
1、使用说明(凡例)
2、目次表 3、正文 4、辅助索引 5、附录
2、数据库
(1)字段 (2)记录
(3)文档(顺排、倒排)
(4)帮助文件
工具书的类型
类型 概念 内容 举例 提供可资参考的知 根据特定的社会需要, 识 内 容 , 如 数 据 、 字典、词典、百科 广泛汇释一定范围内 史实、观点、结论、 全书、类书、政书、 比较成熟的知识,按 定 义 、 公 式 、 分 子 年鉴、手册、名录、 一定的规则编排组织 式 、 人 物 简 介 等 数 表谱、图录等 的工具书。 据和事实信息。 又称线索性工具书 提供查找文献线索 书目、索引、文摘
分类途径 信息内部特征 检索途径 信息外部特征 主题途径 关键词途径 题名途径 著者途径 其它途径
一、根据信息内容特征的检索途径 二、根据信息外部特征的检索途径
第四节
检索工具
检索工具:是在不同学科范围内对 一、检索工具的功能 某阶段出版的有关文献进行收集、整理 二、检索工具的类型 或对新文献加以及时报道的二次文献。
一、检索算符 逻辑与
(一)布尔逻辑算符
布尔逻辑组配运算是采用布尔代数中的 逻辑“与”逻辑“或”、逻辑“非”等算符,

第二章 信息检索的基本知识

第二章 信息检索的基本知识

应用举例:
利用《中图法》在《全国报刊索引》中查找 有关“建筑抗震设计”方面的相关文献。 第一步:分析课题,按学科属性属于“T工业技术” 中的“TU建筑科学”大类。 第二步:查《中图法》确定分类号为:T工业技 术—TU建筑科学—TU3建筑结构—TU352.11抗震结 构。 第三步:根据《全国报刊索引》(科技版)的分 类目录给出的TU3建筑结构的页次,得到相关文献。 第四步:根据的出处索取原始文献。
第二章 信息检索的基本知识
主要内容
1.信息检索概述 2.信息检索原理及检索语言 3.信息检索系统与检索工具 4.信息检索的一般程序
2.1 信息检索概述
2.1.1信息检索的含义
信息检索(Information Retrieval)是指 将信息按一定的方式组织和存储起来,并根据用 户的需要找出有关信息的过程,又叫信息储存与 检索(Information storage and Retrieval), 这是广义的信息检索,如图2-1所示。狭义的信息 检索则是仅指该过程的后半部分,即从信息集合 中找出所需信息的过程。
内容特征 标题词 主题语言 关键词 叙词 描述文献外表特征的检索语言,例如篇名、著者姓名、文 献号等作为文献标识与检索依据直接明了,使用时较为简单。 而文献内容特征的语言,也就是分类语言和主题语言的原理和 使用方法是下面主要介绍的内容。
一条中文书目记录:
题名: 信息检索 作者: 徐天秀 出版项:北京:科学出版社,2006 页码: 320页 价格: CNY23.00 主题: 情报检索 索取号: G252.7/101 内容提要:本书是一本工具型书籍,提供的信息检索学科 范围广,内容尽量以最新版本为主,是一本适用性强的学 习信息检索方法和技巧的专著,尤其是本书配制的多媒体 光盘,为本课程的学习提供了便捷。 分类: G252.7

第2章--信息检索PPT课件

第2章--信息检索PPT课件

信息(information)
是物质存在的一种方式,一般指数据、消息中
所包 含的意义。
普遍性、差异性、特征性 可传递性、可存储性
医学文献信息的作用
记录、保存、传递医学信息 科研和临床实践借鉴、交流的重要载体 评价科研水平与成果的主要依据 推动促进科研发展的资源动力
第一节 信息检索基础
信息 存储 收集 选择 著录 加工 标引 加工 存储 标识
存储与检 索系统进 行匹配
检索 语言
信息 检索 分析 需求 检索 提高 提供 标识
输出
检索 标识
信息检索原理示意图
信息的检索过程
用户利用检索工具获取所需信息的过程。
用户在分析待检内容范围的基础上,将检索需求
转换成检索提问标识,利用相应的检索系统,查
文献检索特殊意义
一是确定有无类似的研究成果,是否要立项?
二是参考其他文献,理清思路,搞清楚要做的研
究是什么?
三是取长补短,推陈出新,设立新论题,取得新
成果。
文献检索在课程设计、毕业设计、开题立项、成
果查新方面都具有重要作用。
第一节 信息检索基础
二、信息检索原理
信息检索系统由文献的存储和检索两个部分组成。
LOGO
第二章 信息检索
掌握信息检索的概念;
掌握信息检索的原理; 了解信息检索的类型,以及信息检索类型的几种 划分方法; 掌握检索语言的种类,及检索语言的作用; 掌握信息检索的方法、途径与步骤。
第一节 信息检索基础 一、信息检索概念
二、信息检索原理 三、信息检索的类型 第二节 信息检索语言 一、检索语言的定义和作用 二、检索语言的种类 第三节 信息检索的方法、途径与步骤 一、信息检索方法 二、信息检索途径 三、信息检索步骤与策略 四、检索效果的评价

第二章信息检索基础知识

第二章信息检索基础知识

字段检索
限定提问关键词在数据库记录中出现的区域, 以控制检索结果的相关性。搜索引擎 中常用字段有: Title(或t); URL(或u); Link; Host(主机); Text。
自然语言检索 Please find for me something about automobile sale in New York State. 系统会检索出“New York State”和 “ automobile sale” 方面的信息。 概念检索 检索: “automobile”能同时检索出包含: “automobile”、“car”、“truck”、“bus”I21 I211 I212 I213 I22 I221 I222 I223 I23 I231 ……. I3 I31 I311 …… I4 ……
文学作品
中国文学作品
中国诗歌作品 中国古代诗歌 中国近代诗歌 中国现代诗歌 中国戏剧作品 中国古代戏剧 中国近代戏剧 中国现代戏剧 中国小说作品 中国古代小说 ………
按网络信息传播范围分:光盘信息源、联机 检索信息源、Internet信息源 按网络信息加工层次分:网络资源指南、搜 索引擎
2.2 信息检索语言及信息检索技术
2.2.1 . 信息检索语言:把信息的存储和检索联 系起来,把标引人员与检索人员联系起来以便取 得共同理解的语言,称为检索语言。类型: 按描述文献信息的特征划分:描述文献信息外表特
(2)图书馆的电子信息服务
图书馆提供的上网服务 图书馆的检索服务 图书馆提供的电子信息服务 图书馆提供的电子信息服务 图书馆提供的书籍全文在线阅读 图书馆举办的用户培训
(3)图书馆的信息资源借阅与查找
图书借阅 古籍善本书、线装书的阅览 期刊查阅 个人发表论文的查找 快速借阅所需图书 图书馆的图书逾期罚款制度 借阅查询 代书牌的使用

信息检索教程(第二章)

信息检索教程(第二章)

4
(b)按收录文献出版形式分
●图书目录 ●期刊目录 ●会议论文目录 ●标准目录等。
(c)按物质形式划分
●卡片目录 ●书本目录 ●机读目录 ●联机公共检索目录等。
5
(2)图书馆目录、OPAC和联合目录概述
①图书馆目录
定义:它主要提供馆藏资源的检索,又叫馆藏目录,它反映
了一个图书馆的文献收藏情况,是一种重要的检索工具。
26
常用法示例
27
追溯法示例
28
2.3.2检索途径
29
30
1.分类途径
图书期刊分类法
世界三大图书分类法
《杜威十进分类法》(DDC)(Dewey decimal Classification ) 《国际十进分类法》(UDC)(Universal Decimal Classification) 《国会图书馆图书分类法》(LCC)(Library congress classification)
定义:所谓文献检索的方法,即查找文献的方法。有以下三种: 常用法:直接利用文献检索工具或检索系统来查找文献的方法,是 一种常规的科学检索方法。又称工具法或直接法。分为顺查法 、倒查法和抽查法。 追溯法:是一种跟踪查找法。它不利用检索工具只是利用文献(尤其 是评述性论文或专著) 后面所附的参考文献进行逐一地追踪查 找原文。又称引文法。 综合法:是常用法和追溯法的综合。利用检索工具或检索系统进行 常规检索,再利用文献后所附参考文献进行追溯检索,分期分 段交替使用这两种方法,直到满足要求为止。可以查得较全面 较准确,尤其适用于那些过去年代内文献较少的课题。称循环 法、分段法或交替法。
22
2.2.2检索工具的鉴别与评价
1.信息收录范围与信息质量

第二章:信息检索基础

第二章:信息检索基础
文献检索是信息检索的核心部分。
从性质上说: 文献检索是一种相关性检索,检索的结果 是与课题相关的文献或文献线索,而不直 接解答用户所提出的技术问题本身; 事实检索与数据检索则是确定性检索,检 索的结果是用户所需的确切的数据或事实。
2.1.3 信息检索的发展简要历程
手工检索阶段
世界四大检索工具(SCI\EI\ISTP\ISR),1665年《学者周刊》
补充
补充同义词或相关词 补充原词或缩略语
例:基于DSP芯片的虹膜识别系统
补充DSP的全称:数字信号处理(digital signal processing)
毫米波,补充MMW
补充
补充同一词的不同拼写
例1:虹膜识别:iris recognition 或 iris
identification 例2:3维、3D
一定要彻底,必Leabharlann 到词为止,同时也要适度,不能因 切分而改变语义。
例:基于DSP芯片TMS320DM642开发的虹 膜识别系统
基于| DSP |芯片| TMS320DM642 |开发|的|虹 膜|识别|系统
删除
删除虚词 删除过分宽泛和过分具体的限定词 删除存在蕴涵关系的可合并词
例:基于DSP芯片TMS320DM642开发的虹膜识别 系统 DSP |芯片| 虹膜|识别|
题名途径 著者途径 机构途径 代码/序号途径 其他途径
信息外部特征
检索途径
信息内部特征
分类途径 主题途径 关键词途径
分类途径
以学科性质和内容的相应类目、类号为 特征标识的检索方法。分类途经检索与分 类法是相对应的。
目前,我国通用的分类法主要有三种: A《中国图书馆图书分类法》(简称《中图 法》) B《中国科学院图书馆图书分类法》(简称 《科图法》) C《中国人民大学图书馆图书分类法》(简 称《人大法》)

信息检索2章 PPT课件.ppt

信息检索2章 PPT课件.ppt
检索工具是人们用来存储和查找各类信息的工具。 1.按所收信息的学科内容划分: 综合性、专科和专题 2.按著录信息的特征划分 1)目录型检索工具 2)题录型检索工具 3)文摘型检索工具 4)索引型检索工具
• 目录型检索工具 • 一般以整本的图书、期刊等作为报道单元,仅著
录出版物的外表特征,不著录具体篇章。仅提供检 索线索,主要用于了解出版物的出版或收藏单位。
2.2.3.2检索工具的选择
4.考虑检索工具的检索功能 5.检索工具的检索费用 返回目次
2.3 检索方法及检索途径
2.3.1 检索方法 2.3.2 检索途径
2.3.1检索方法
1.常规法 利用常规检索工具查找有关文献。 分为顺查法、倒查法、时间抽样法
• 顺查法
• 以所检索课题研究的发生时间为检索起点,按 事件发生、发展的时序,由远及近,由旧到新的 顺序查找。
• 特点:所查得的文献较为系统全面,基本上可反 映某学科专业或某课题发展的全貌;缺点是费时 费力,工作量较大。一般在申请专利的查新调查 和新开课题时采用这种方法。
• 逆查法
• 与顺查法相反,由近及远,由新到旧的查找。
• 多用于查找新课题,在基本上获得所需信息时 即可终止检索。可保证文献信息的新颖性,也可 提高查准率。但由于这种方法不太关注历史渊源 和全面系统性,影响检索的全面性。
• 报道内容:文献篇名.著者.刊名.出版年,月 (卷,期),页码
• 实例:下
【实例】 在《中文科技期刊数据库》的期刊论文著录格式如下: 【题 名】 辽宁老工业基地振兴与发展中的生态产业研究 【作 者】 张军涛 【机 构】 东北财经大学公共管理学院,辽宁大连116025 【刊 名】 社会科学辑刊.2004(1).-74-78 【ISSN号】 1001-6198 【C N 号】 21-1012 【馆藏号】 80414X 【关键词】 生态产业 循环经济 环境—经济协调发展

最新第2章信息检索基本知识ppt课件

最新第2章信息检索基本知识ppt课件

布尔逻辑运算符优先级
• 布尔运算符优先级比较
–有括号时:括号内的先执行; –无括号时:NOT > AND > OR
• 例:检索“唐宋诗歌”的有关信息。 – 关键词:唐、宋、诗歌; – 检索表达式:
• (唐 OR 宋)AND 诗歌; • 唐 AND 诗歌 OR 宋 AND 诗歌; – 错误表达式: • 唐 OR 宋AND诗歌; • 唐 AND 宋AND诗歌; • 唐 OR 宋OR诗歌; • 唐AND 宋OR诗歌;
3、事实检索
是以具体事项为检索内容的信息检索。
(二)按是否使用检索工具划分 1、直接检索
就是指利用一次文献进行检索,这是以前比较常用的一 种查找方法。所花时间多和精力大,检出文献少。
2、间接检索
就是指利用各种检索工具获得文献线索,再根据线索去 查找原始文献线索的方法。
(三)按信息检索手段划分 1、传统信息检索
一、检索工具的功能
1、报道功能 2、存储功能 3、检索功能
二、检索工具的特点
1、详细而又完整地记录了文献的外部特征和内部特征。 2、对所著录的文献,标引了可供检索的检索标识。 3、提供必要的检索手段,配备各种体系的索引。
三、检索工具的类录 2、文摘 3、索引
目索文录引摘:::是把是按一一照种种某或著种多录明种文白文献 题易献录懂中和的具内顺有容序检摘编索要排意的义检文的索献特 工清征具单分。或别清著册录,、通排常序以并一注 如个明:完出人大整处复的以印资出供料版查单检位的或工收具 藏书单。位索为引著的录基的本组基织本单单 元位是。条目,每个条目一般 如由:序《全号国、新书标目识》或索引词、 注释《社、科出新书处目等》 若干环节
2、三者提供的资料不同: 目录提供某一方面较成熟系统的知识,索引、文摘提供相对分散 的资料线索。

信息检索概述

信息检索概述

目前,我国各大文献数据库《中国 科学引文数据库》、《中国学术期刊 综合评价数据库》以及数字化图书馆、 中国期刊网等都要求学术论文按《中 图法》标注中图分类号。
(2) 主题语言
主题语言是指以自然语言的字符为字 符,以名词术语为基本词汇,用一组名 词术语作为检索标识的一类检索语言。 主题语言表达的概念比较准确,具有较 好的直观性、灵活性和专指性,满足用 户从主题概念角度检索新兴专业学科、 交叉学科文献信息的要求。
本校图书馆主页——可查中图分类号
TM 电工技术 TM0 一般性问题 TM1 电工基础理论 TM2 电工材料 TM3 电机 TM4 变压器、变流器及电抗器 TM5 电器
TM6 发电、发电厂 TM7 输配电工程、电力网及电力 系统 TM8 高电压技术 TM91 独立电源技术(直接发电) TM92 电气化、电能应用 TM93 电气测量技术及仪器
第二章信息检索概述
2.1信息检索的涵义
信息检索的概念有狭义和广义之分。
狭义的信息检索(Information Retrieval) 是指依据一定的方法,从已经组织好的大量有关文 献集合中,查找并获取特定的相关文献的过程。这 里的文献集合,不是通常所指的文献本身,而是关 于文献的信息或文献的线索。如果真正要获取文献 中所记录的信息,那么还要依据检索所取得的文献 线索索取原文。
以知识属性来描述和表达信息内容的信 息处理方法称为分类法。《国际专利分 类表》、《中国图书馆分类法》等。
中国图书馆分类法简表(第四版)
A
马克思主义、列宁主义、 毛泽东思想、邓小平理论
B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 TB 一般工业技术
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 信息检索概述
一 信息与信息源
1、信息 信息的含义:信息原指消息的传递,现指应用文字、
数据或信号等形式通过一定的传递和处理,来表现 各种相互联系的客观事物在运动中所具有的特征性 内容的总称。信息不是指事物本身,而是事物存在 的方式和运动状态的表现形式,是客观事物经过感 知或认识后的再现。
信息的特征
信息。 信息是知识的基础,知识是信息的核心。
情报:是人们在一定时间内为一定目的而传递的有 使用价值的知识或信息,它有明确的接受对象,属 于人工知识或信息的范畴,它来源于信息与知识, 是激活了的知识、动态的信息。
文献:是记录知识或信息的一切载体。即用文字、 图形、符号、声频、视频等技术手段记录人类知识 的一种载体。实际上文献是由知识内容、信息符号 和载体材料三个不可分割的基本要素构成。知识是 文献的实质内容,符号、文字、声音是人体感觉信 息的媒介,载体是文献的外在形式。
非文献信息源可分为实物信息、口头信息和 实情信息
实物信息就是现实存在的物化了的各种物质 形态的信息。包括实物、样品或展览会的展 品。
口头信息是指存在于人脑记忆中,通过交谈、 谈论、报告等方式交流传播的信息
实情信息是现实存在的自然现象和社会现象的信息。 它的表现形式不是实物,而是自然现象或者社会现 象的状态及其发展过程。
它们之间的逻辑关系和范畴关系
思考题
偶尔从别人那里听到一个未经证实的事,是不是信 息?为什么?
农谚是直接关系农业的耕种、收获和其他农事的谚 语,它们是长期以来劳动人民农业生产知识、经验 的总结。下面看几条有关气象的农谚:
朝霞不出门,晚霞走千里/蜘蛛结网,雨必晴;蚂蚁 搬家,雨必下/天上钩钩云,地下雨淋淋/天上鲤鱼 斑,明天晒谷不用翻/云往东,刮阵风;云往西,披 蓑衣
时效性:由于事物是在不断变化着的,因此表征事物存在方 式和运动状态的信息也必然会随之改变
共享性:信息可以多次传播,不失其内容,与实物交易不同。
信息 知识 情报与文献 知识:人类在改造世界的过程中所获得的认识和经
验的总和。 信息被人类所感知并被提炼加工即成为知识。 知识是信息升华的结果,是一种浓缩的系统化的
二、信息检索的基本内容
1、概念: 1)信息检索(information retrieval) 是指将信息按一 定的方式组织和存储起来,并根据信息用户的需要 找出有关信息的过程。所以,它的全称又叫信息存 储与检索(information storage and retrieval), 这是 广义的信息检索。狭义的信息检索则仅指该过程的 后一步,即从信息集合中找出所需要信息的过程。 相当于我们所说的信息查询(information search)。
(3)国际联机检索:70年代中后期 国际联机检索是指用户利用终端设 备,通过通信网与地球上任何地方 的大型计算机信息检索系统的主机 进行直接人机对话式的计算机检索 。
国际联机检索系统一般由通信网络、国 际联机检索中心、用户终端等三部分组 成。
国际联机检索系统的服务方式有:回溯 检索、定题服务、联机订购原文、电子 邮件服务以及光盘服务五种方式。
客观性:信息不是虚无飘渺的事物,它的存在可以被人们感 知、获取、传递和利用
依附性:信息必须依附于一定的载体(如声波、纸张、化学 材料、磁性材料等)才能流通和传递。
可传递性:不同载体的信息可以通过计算机、人际交流、文 献交流或大众传媒等手段传递给信息用户,最大化的利用信 息
可塑性:信息在流通和使用过程中,人们借助于先进的技术, 可以对其进行综合、分析及加工处理
速度快、多道程序和分时功能,内存容量大,多样 化的输入输出设备。
通讯系统是指终端设备与主机系统进行通信的 设备。通信线路分为两种:专用的直达线路;通过 拨号选择对方的交换线路。前者是特定通信线路, 后者使用电话网和用户电报网,联机系统使用的通 信线路就属于后一种。
终端系统是人与系统的接口设备。它能将字符、 声音以及人类的信息表现形式转换成系统的机器代 码。反之,将系统的结果还原成字符、声音等形式, 传送给终端用户。
3C:Computer(计算机)、Communication(通 讯)、Control(控制)
3A:Factory Automation(工厂自动化)、Office Automation(办公自动化) Home Automation(家庭自动化)
3R:Material Revolution(材料革命)、Energy Revolution(能源革命)、 Information Revolution(信息革命)
ORBIT
ORBIT的全称为online retrieval of bibliographic information timeshared即文献目 录信息分时联机检索。是第二大国际联机检索系统, 拥有200多个数据库。以化工、石油、生物、化学、 环境科学、医学、运动科学和安全科学等深入文献 比较齐全而著称。其特色数据库有SAE(汽车、飞 机等交通工具)TULSA(石油、天然气开采与勘探) 等30多个数据库,为该系统独有。
检索策略: 所谓检索策略,就是在分析课题内容具有哪
些概念单元的基础上,确定检索系统、学科领域、 检索文档、检索途径和检索词,并科学安排各检 索词之间的位置关系和逻辑关系以及查找步骤等。 也就是为满足信息需求所制定的一系列检索方案。
5)检中结果、查全率、查准率(第四章详细介绍) 检中结果又称检索结果集,是数据库中满足(检索式 (即符合检索条件)的那些记录的集合 查全率:是指检出文献中合乎需要的文献数量占数 据库中存在的合乎该需要的所有文献的比例 查准率:是指检出文献中合乎需要的文献数量占检 出文献全部数量的比例
数据型信息检索(Data Retrieval):以数值 或数据为对象的一种检索,包括文献中的某一 数据、公式、图表,以及某一物质的化学分子 式等,数据检索分为数值型与非数值型。完成 数据型信息检索主要借助于各种数值数据库和 统计数据库。
事实型信息检索(Fact Retrieval):以某一 客观事实为检索对象,查找某一事物发生的时 间、地点及过程的检索,其检索结果主要是客 观事实或为说明事实而提供的相关资料。如: 2001年7月通过的奥运会主办城市的结果与过 程。完成事实型信息检索主要借助于各种指南 数据库和全文数据库。
3、信息检索的发展历程 3.1基本方向:手工检索向计算机检索(如 穿孔、缩微、自动化)发展,但是手工检 索与计算机检索将长期并存。因为计算 机检索有其缺陷:(1)硬件条件不足:没 有计算机,不能上网,(2)数据库不完善, (3)网络慢或网络故障等等。
3.2计算机信息检索的的产生和发展,分 为五个阶段: (1)脱机批处理检索:1954一64。定期由 专职检索人员把许多用户课题汇总,批量 处理提问要求,并把结果提供给用户。直 接在计算机旁检索,不需要远程终端设备 及通信网络。用户在计算机处理成批检索 课题之后才知道检索结果,不能直接、及 时修改检索策略,查全率和查准率受到一 定限制。
1)通过以上案例你得到什么启示? 2)例子中日本从世界各地带回来的摩托车是否属 于信息?如果不是请说明理由,如果是请说明属于 什么类型的信息?
3)如果你是试验小组成员,除了摩托车你还会搜 集哪些信息?为什么?
3、信息社会的基本内容:3I、3C、3A、3R
3I: Information(信息)、Intelligence(智能)、 Integration(集成、综合)
(2)联机情报检索:20世纪70年代投入商业 运营。用户在计算机检索系统的终端上,通 过通信网络,使用特定的指令和算符,以人 机对话方式,查询远程计算机检索系统核心 的数据库,从中获取所需信息的计算机检索 系统。
联机检索系统由三个部分组成:主机系统、通讯系统 和终端设备
主机系统是联机检索系统的核心,它具备处理
案例分析:
为了在极短的时间内尽快开发出一系列驰骋全球的名牌 摩托车产品,1968年日本集中了全国各摩托车修理厂200名 具有丰富专业知识和研究能力的工程技术人员和情报人员, 分成12个小组,用了一年的时间,走遍世界上所有重要的摩 托车生产厂家,对世界摩托车工业进行了有史以来最广泛的 全球性调查。在订货、帮助建厂的幌子下,他们搜集了大量 的信息,并带回170多部样机。他们每种样机购回两部,一 部解剖,一部做运行试验,并结合搜集到的信息,对全部厂 家各种型号的摩托车及其零部件的质量、优缺点等进行比较、 分析和综合,博采众家之长,最后设计出一种轻便耐用、性 能优良、价格便宜的摩托车,并迅速占领国内市场。
我国气象专家根据多种信息,预测出2008年可能出现像 1998年那样的大洪水,结果该年自6月中旬以来,浙江、福 建、江西、湖南、广东、广西等地部分地区遭受强暴雨袭击, 造成严重洪涝、山体滑坡和泥石流灾害,预言变成现实。请 问专家预测可能会用到哪些信息?分别属于什么信息类型?
“信息分析与预测”是竞争情报领域一项很重要的手 段。例如:通过检索竞争对手在某一技术领域的专利 申请,并对其信息内容进行深入分析,便可以判断出 竞争对手的R&D(研究与发展)方向、经营策略、产 品和技术优势。请问专利属于什么类型的信息源?为 什么可以通过搜集和分析所掌握的信息预测出竞争对 手的发展状态和趋势?
自然现象(气候、水文、物理、化学、生物等的演 进和反应的状态和过程)
社会现象(政治法律事务、军事行动、企业、商业 和事业机构运行状态、工程现象、演出现场、经济 交易的实时交互过程、人机运动过程等)
思考题
以下词条可代表不同类型的信息源,请按文献信息源和非文 献信息源为他们分类
汽车、敦煌石窟、四库全书、一年内的天气变化数据、上市 公司年报、经济新闻、地震仪测得的数据、图书缩微胶片、 甲骨文、古时候的陶片、记录片、古籍
2)检索语言:检索语言是把信息的存储与检 索联系起来,把标引人员与用户联系起来,以 便取得共同的理解、实现交流的语言。有人工 语言(主题语言和分类语言)、自然语言之分。 (第三章详细介绍) 3)检索方法:常用法、追溯法和循环法 (第四章详细介绍)
相关文档
最新文档