信息检索概述PPT课件
合集下载
第一讲 信息检索 PPT课件
第一节 信息 知识 情报 文献
2.知识 知识是人类认识的成果或结晶,是系
统化信息的集合. 知识的属性:
意识性 信息性 实践性 规律性 继承性 渗透性
第一节 信息 知识 情报 文献
3.文献 知识借助于一定的语言形式或物化为某
种劳动产品的形式,就成为可以交流的 文献。 文献的三要素:知识、载体、纪录方式。 文献的属性:知识信息性、客观物质性、 人工纪录性、动态发展性等。 文字形式的文献变成数据形式即称之 为电子文献。
信息的重要性(二)
从知识层面上理解
知识经济建立在知识 材料、 消耗 不可 不可 利用与创新的基础上, 能源 性 共享 再生 知识创新需要大量的
信息做原料。
信息与材料、能源 被称为当今社会的三 大资源
信息
非消 耗性
可共 享
可再 生
二、信息意识和信息素质
信息意识:是人们对各种信息的自觉 心理反应。
第一节 信息 知识 情报 文献
4.情报 在英汉词典中,“information”可译
为“信息”,也可译为“情报”. 情报:人们在一定的时间内为了一定
的目的而传递的有使用价值的知识. 情报的属性:知识性、传递性、效用性。 情报交流:直接交流和间接交流
第一节 信息 知识 情报 文献
信息的重要性 从情报的层面上理解 1.信息决定战争的胜负 2.信息决定企业的兴衰 3.信息是领导决策的依据。
二、文献的出版类型
按出版类型文献划分以下十大类:
(1)图书 (2)期刊(3)会议文献 (4)科技报告 (5)专利文献 (6)学位论文(7)标准文献 (8)政府出版物(9)产品资料 (10)技术档案
二、文献的出版类型
1.科技图书(Sci-Tech book) 阅读类:科普读物、专著、文集等 工具类:百科全书、年鉴、手册、词典等。
第2章--信息检索PPT课件
经济
文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
S
T U V X Z
农业科学
工业技术 交通运输 航空、航天 环境科学、安全科学 综合性图书
《中国图书馆分类法》
中国图书馆分类法分类表共分22个大类,再分17个 二级目录,医药卫生属于R大类。 《中图法》采用汉语拼音字母和阿拉伯数字组成的 混合制号码作类目标识,用一个字母标记一个基本
的问题;
另一方面是特定原始文献的查找,即在查找特定
的文献线索后,找出原始文献的过程。
第一节 信息检索基础
一、信息检索概念
(二)信息检索的意义和作用 信息检索 有助于知识更新 ,有助于同学们扩大视野 ,了解和把握有关学科中出现的新思想、新观点与 新知识。掌握信息检索技术是快速、准确地获取和 利用最新信息的有效途径。 信息检索有助于科学研究,了解和把握有关学科的 起源和发展过程。 有助于独立自主地解决自己在学习、生活和工作中 所遇到的疑难问题。 是接受终身教育的必要手段。 节省时间,提高效率。
第二节 信息检索语言
二、检索语言的种类
(一)分类检索语言 分类检索语言又称分类法,是用分类号(字母、数 字或它们的组合)来表达各种概念的,并将各种概 念按学科性质进行分类和系统排列的信息检索语言。 它以树状结构的形式,按知识门类的逻辑次序反映事物 的从属、派生关系,构成具有上位类和下位类隶属、同 位类并列的概念等级体系。 能较好体现概念的族性关系,从学科专业的角度检索资 料,比较方便,扩大、缩小检索范围方便。
(一)按信息检索的对象划分
数据信息检索 利用数据库、工具书等以数值或数据为对象的检 索,也称为数值检索。检索包含分子式、分子量 、公式 、图表等特定数据的信息。
信息检索概述PPT课件
信息的时效是指从信息源发送信息,经过接收、加工、传递、利用的时间 间隔及其效率。
管理信息是经过加工并对生产经营活动产生影响的数据,使劳动创造的, 是一种资源,因而是由价值的。
9
1.2 信息概述
1.2.2 信息的特征(二)
层次性 相关性 简单性
可传输性
管理系统在客观上是有层次的(如公司级、工厂级、车间级等)。
1.2 信息概述
1.2.2 信息的特征(一)
客观性
信息反映客观事物的属性,必须真实、准确、如实反映客观实际。
主观性
对于信息和信息处理的任何研究和讨论,都离不开主体的目的或目标。
抽象性
整体性 不完全性 共享性
时效性 价值性
必须区分信息的载体和内容,是信息有可能在不同的载体之间转化与传递。 需要强调的是,人们往往把注意力集中在信息的载体(如计算机网络的建 设)或技术手段上,而忽视了信息本身的内容,这种本末倒置现象的产生 就远远对信息的抽象性缺乏明确的认识。
1.1.2 信息素养教育及其意义 ➢ 个人终身学习的需要 ➢ 人们生活的必备技能
1.2 信息概述
1.2.1 信息的概念 我国汉语中很早就有“信息”这个词。 早在一千多年前,唐朝诗人李中在《碧云 集·暮春怀故人》一诗中就留下了“梦断美 人沉信息,目穿长路倚楼台”的佳句。当 时,“信息”指的是音信、消息。
第一章 信息与信息素养
1.1 信息社会与信息素养 1.2 信息概述 1.3 信息源
1.1 信息社会与信息素养
1.1.1 信息社会及其特征 1.1.2 信息素养教育及其意义
1.1 信息社会与信息素养
1.1.1 信息社会及其特征 ➢ 信息成为宝贵的资源 ➢ 人们的信息意识空前强化
1.1 信息社会与信息素养
管理信息是经过加工并对生产经营活动产生影响的数据,使劳动创造的, 是一种资源,因而是由价值的。
9
1.2 信息概述
1.2.2 信息的特征(二)
层次性 相关性 简单性
可传输性
管理系统在客观上是有层次的(如公司级、工厂级、车间级等)。
1.2 信息概述
1.2.2 信息的特征(一)
客观性
信息反映客观事物的属性,必须真实、准确、如实反映客观实际。
主观性
对于信息和信息处理的任何研究和讨论,都离不开主体的目的或目标。
抽象性
整体性 不完全性 共享性
时效性 价值性
必须区分信息的载体和内容,是信息有可能在不同的载体之间转化与传递。 需要强调的是,人们往往把注意力集中在信息的载体(如计算机网络的建 设)或技术手段上,而忽视了信息本身的内容,这种本末倒置现象的产生 就远远对信息的抽象性缺乏明确的认识。
1.1.2 信息素养教育及其意义 ➢ 个人终身学习的需要 ➢ 人们生活的必备技能
1.2 信息概述
1.2.1 信息的概念 我国汉语中很早就有“信息”这个词。 早在一千多年前,唐朝诗人李中在《碧云 集·暮春怀故人》一诗中就留下了“梦断美 人沉信息,目穿长路倚楼台”的佳句。当 时,“信息”指的是音信、消息。
第一章 信息与信息素养
1.1 信息社会与信息素养 1.2 信息概述 1.3 信息源
1.1 信息社会与信息素养
1.1.1 信息社会及其特征 1.1.2 信息素养教育及其意义
1.1 信息社会与信息素养
1.1.1 信息社会及其特征 ➢ 信息成为宝贵的资源 ➢ 人们的信息意识空前强化
1.1 信息社会与信息素养
信息检索技术基础知识讲义PPT(97张)
信息检索与利用
信息检索技术基础
1
主要内容
2.1 信息检索语言 2.2 信息检索技术 2.3 检索效果评价 2.4 检索词的确定 2.5 信息检索策略及策略式 2.6 信息检索步骤 2.7 科技查新
2
2.1 信息检索语言
• 检索语言:在信息的存储和检索过程中, 为使信息在用户和系统间有效传递,各 种检索工具使用专门的语言体系来描述 信息的内部特征和外部特征,同时要求 用户依此构造检索提问式来进行信息检 索,这种专门的语言体系成为检索语言。
2.2.1 布尔逻辑
• 布尔逻辑检索:在进行信息检索时,检索项
之间概念有相交关系、同义关系或相关关系, 这时采用布尔逻辑进行检索项之间的逻辑组配。 • 布尔逻辑算符有三种: 逻辑与、逻辑或、逻辑非
用“与”(AND)、“或”(OR)、“非” (NOT)来表达。
14
逻辑“与”
• 在计算机信息检索时,“与”用于表示概念的交 叉、限定关系 • 逻辑符号:and、﹡、还可用空格表示 A • 表达形式:A and B、 A * B 、或 A B • 具有缩小检索范围和提高专指性的功能。
22
截词的分类
• 按位置分类: 前截词 中间截词 后截词 • 按取代数量分: 有限截词 无限截词
运输 飞机 设计
•
飞机设计 运输飞机 通常使用的叙词表有: 国内《汉语主题词表》, 英国《科学文摘》使用的《INSPEC Thesaurus》,
美国《工程索引》使用的《Ei Thesaurus》等。
7
EI(Thesaurus)
8
2.1 信息检索语言
作用 • 检索词用来组织信息(信息工作者)
• 对文献信息内容进行标引; • 对内容相同或相关的信息加以集中或揭示其相关性; • 对信息进行系统化、有序化;
信息检索技术基础
1
主要内容
2.1 信息检索语言 2.2 信息检索技术 2.3 检索效果评价 2.4 检索词的确定 2.5 信息检索策略及策略式 2.6 信息检索步骤 2.7 科技查新
2
2.1 信息检索语言
• 检索语言:在信息的存储和检索过程中, 为使信息在用户和系统间有效传递,各 种检索工具使用专门的语言体系来描述 信息的内部特征和外部特征,同时要求 用户依此构造检索提问式来进行信息检 索,这种专门的语言体系成为检索语言。
2.2.1 布尔逻辑
• 布尔逻辑检索:在进行信息检索时,检索项
之间概念有相交关系、同义关系或相关关系, 这时采用布尔逻辑进行检索项之间的逻辑组配。 • 布尔逻辑算符有三种: 逻辑与、逻辑或、逻辑非
用“与”(AND)、“或”(OR)、“非” (NOT)来表达。
14
逻辑“与”
• 在计算机信息检索时,“与”用于表示概念的交 叉、限定关系 • 逻辑符号:and、﹡、还可用空格表示 A • 表达形式:A and B、 A * B 、或 A B • 具有缩小检索范围和提高专指性的功能。
22
截词的分类
• 按位置分类: 前截词 中间截词 后截词 • 按取代数量分: 有限截词 无限截词
运输 飞机 设计
•
飞机设计 运输飞机 通常使用的叙词表有: 国内《汉语主题词表》, 英国《科学文摘》使用的《INSPEC Thesaurus》,
美国《工程索引》使用的《Ei Thesaurus》等。
7
EI(Thesaurus)
8
2.1 信息检索语言
作用 • 检索词用来组织信息(信息工作者)
• 对文献信息内容进行标引; • 对内容相同或相关的信息加以集中或揭示其相关性; • 对信息进行系统化、有序化;
信息检索ppt课件
19
信息检索技术
❖ 一、布尔逻辑检索(not>and>or) ❖ 二、截词检索 ❖ 三、位置检索(常用的关系符号是(W)、(N)、
(F)、(S))
(四)限定字段检索
20
信息检索策略
❖ 1.分析检索课题,明确目的和要求 ❖ 2.选择合适的检索工具 ❖ 3.选择检索途径,确定检索标识 ❖ 4.编制检索表达式,调整检索策略 ❖ 5.浏览检索结果,获取原始文献。
具有广泛影响的定义
信息是事物存在方式、运动状态及其特 征的反映,是事物发出的信号、消息。
1 1信息的特征载体依来自性信无限共享性
息
的
永不枯竭性
特
征
开发增值性
应用时效性
存在普遍性
2
2
二、知识(knowledge)
❖ 《汉语词典》中解释为:人们在改造世界 的实践过程中所获得的认识和经验的总和。
❖ 知识 是人类对自然界、人类社会中各种现 象、规律的信息反映进行思维分析,加工 提炼,经过系统化、理论化的结果。
二、医学信息素养的内涵主要包括:
信息意识:是个体对信息重要性的认识程度和对 信息是否具有特殊的、敏锐的感受力和持久的注 意力,即对信息的捕捉、分析、判断和吸收的敏 感性。
信息知识:是指与信息有关的理论、知识和方法。
信息能力:是对信息的搜集获取能力、分析鉴别 能力和综合利用能力。
信息道德:是指在整个信息活动中,信息创建者、 信息服务提供者和信息使用者所必须要遵守的伦 理规范。
❖ 因此,知识是系统化、理论化的信息集合。
3 3
三、情报(information, intelligence )
❖ 《辞源》:“定敌情如何,而报于上官者”为情报。 ❖ 《辞海》:“战时关于敌情之报告,曰情报。
信息检索技术
❖ 一、布尔逻辑检索(not>and>or) ❖ 二、截词检索 ❖ 三、位置检索(常用的关系符号是(W)、(N)、
(F)、(S))
(四)限定字段检索
20
信息检索策略
❖ 1.分析检索课题,明确目的和要求 ❖ 2.选择合适的检索工具 ❖ 3.选择检索途径,确定检索标识 ❖ 4.编制检索表达式,调整检索策略 ❖ 5.浏览检索结果,获取原始文献。
具有广泛影响的定义
信息是事物存在方式、运动状态及其特 征的反映,是事物发出的信号、消息。
1 1信息的特征载体依来自性信无限共享性
息
的
永不枯竭性
特
征
开发增值性
应用时效性
存在普遍性
2
2
二、知识(knowledge)
❖ 《汉语词典》中解释为:人们在改造世界 的实践过程中所获得的认识和经验的总和。
❖ 知识 是人类对自然界、人类社会中各种现 象、规律的信息反映进行思维分析,加工 提炼,经过系统化、理论化的结果。
二、医学信息素养的内涵主要包括:
信息意识:是个体对信息重要性的认识程度和对 信息是否具有特殊的、敏锐的感受力和持久的注 意力,即对信息的捕捉、分析、判断和吸收的敏 感性。
信息知识:是指与信息有关的理论、知识和方法。
信息能力:是对信息的搜集获取能力、分析鉴别 能力和综合利用能力。
信息道德:是指在整个信息活动中,信息创建者、 信息服务提供者和信息使用者所必须要遵守的伦 理规范。
❖ 因此,知识是系统化、理论化的信息集合。
3 3
三、情报(information, intelligence )
❖ 《辞源》:“定敌情如何,而报于上官者”为情报。 ❖ 《辞海》:“战时关于敌情之报告,曰情报。
信息检索 ppt课件
详细描述
社交网络信息检索技术主要针对社交网络中 海量、动态更新的信息进行处理和检索。特 点包括实时性、个性化和社会化等。同时, 也面临一些挑战,如信息过载、隐私保护等
。
案例四:社交网络信息检索技术实践分享
总结词
社交网络信息检索技术的创新与应用
详细描述
介绍一些创新性的社交网络信息检索技术,如基于内 容的推荐算法、情感分析技术等。同时,分享一些成 功应用案例,如微博搜索、微信小程序等,说明这些 技术在社交网络中的实际应用和效果。
云服务和移动化 借助云服务和移动通信技术,实 现信息检索服务的移动化和云端 化,方便用户随时随地获取信息 。
个性化推荐和定制化服务 通过数据分析和挖掘,实现个性 化推荐和定制化服务,满足用户 多样化的信息需求。
多模态信息检索 融合文本、图像、音频和视频等 多种类型的信息,实现多模态信 息检索,提高信息检索的全面性 和多样性。
04
信息检索的应用领域
搜索引擎
搜索结果相关性
提高搜索结果与用户查询的关联 度,减少无关信息的展现。
语义分析和理解
对用户查询进行深度解析,识别关 键词的语义,提高搜索的准确性。
实时更新
对互联网上的新信息进行实时跟踪 和更新,确保用户获取最新、最相 关的信息。
数字图书馆
资源数字化
将传统图书馆的资源进行数字化 处理,方便用户在线阅读和下载
关联规则挖掘
挖掘信息之间的关联规则,帮 助用户发现隐藏的信息需求。
信息检索的评价指标
查全率
评估检索系统找全满足用户需求的信息的能 力。
响应时间
评估检索系统响应用户请求的速度。
查准率
评估检索系统找准满足用户需求的信息的能 力。
信息检索 ppt课件
学科不断分化,新学科不断涌现,产生了大量有特定研究对象的分支学科、边缘学科、交叉学科、综合性学科。据统计 ,目前全世界每年出版各种文献量为l2000万册,平均每天出版文献约32万件。
1950-2006年中文图书出版概况
140000 120000 100000
80000 60000 40000 20000
3、文种繁多,内容交叉重复
全球的科技期刊出版采用70余种语言出版。 由于研究和出版的重复,形成了大量的重复文献,如: 会议论文重复率达40 % ,专利文献重复率高达60%
4、文献分布既集中又分散
集中: 某一学科的文献通常有80%都集中在该学科15%的期 刊中,这些期刊称为“核心期刊”,其中的文献代表了该学科的 最高水平、最新成果,具有权威性。
狭义的信息指文献资源或数据资源,包括各媒体中的片 段、文章、图书、情报、观念等。
特 点: 1.不同的事物所存在的状态和运动方式,就会表现出不同的信息;
2.信息不是实体,必须借助某种介质才能表现或传播。
二、知识(knowledge)
是人类在认识和改造客观世界实践中获得的对事物本质 的认识和经验的综合。
信息经过选择、综合、研究、分析等加工过程后可以成为
情报;
知识是系统化、理论化的信息。
五、文献与信息素养
信息素养(Information literacy)指具有检索、分析、 评价和利用各种信息源以解决信息需求及制定明智决 策的能力,是对个人信息行为能力、独立学习能力以 及批判性思维能力等概括性描述。
分散: 随着科学技术发展, 学科分支越来越细,专业文献分散。
学科不断分化,新学科不断涌现,产生了大量有特定研究对象的分支学科、边缘学科、交叉学科
5、新陈代谢频繁,文献老化加快
1950-2006年中文图书出版概况
140000 120000 100000
80000 60000 40000 20000
3、文种繁多,内容交叉重复
全球的科技期刊出版采用70余种语言出版。 由于研究和出版的重复,形成了大量的重复文献,如: 会议论文重复率达40 % ,专利文献重复率高达60%
4、文献分布既集中又分散
集中: 某一学科的文献通常有80%都集中在该学科15%的期 刊中,这些期刊称为“核心期刊”,其中的文献代表了该学科的 最高水平、最新成果,具有权威性。
狭义的信息指文献资源或数据资源,包括各媒体中的片 段、文章、图书、情报、观念等。
特 点: 1.不同的事物所存在的状态和运动方式,就会表现出不同的信息;
2.信息不是实体,必须借助某种介质才能表现或传播。
二、知识(knowledge)
是人类在认识和改造客观世界实践中获得的对事物本质 的认识和经验的综合。
信息经过选择、综合、研究、分析等加工过程后可以成为
情报;
知识是系统化、理论化的信息。
五、文献与信息素养
信息素养(Information literacy)指具有检索、分析、 评价和利用各种信息源以解决信息需求及制定明智决 策的能力,是对个人信息行为能力、独立学习能力以 及批判性思维能力等概括性描述。
分散: 随着科学技术发展, 学科分支越来越细,专业文献分散。
学科不断分化,新学科不断涌现,产生了大量有特定研究对象的分支学科、边缘学科、交叉学科
5、新陈代谢频繁,文献老化加快
信息检索ppt课件
及时获取有价值的信息。
06
信息检索的未来发展
语义网与信息检索
语义网技术的成熟发展为信息检索提供了新的机会和挑战。
语义网通过使用本体、词汇表和规则等,使信息具有明确的含义和上下文,从而提 高了信息检索的准确性和效率。
基于本体的信息检索利用语义网中的本体模型,能够实现更精确、更快速的信息检 索,为搜索引擎、问答系统和推荐系统等应用提供了新的解决方案。
个性化推荐
通过分析用户的购物历史和浏览行 为,电子商务平台可以运用信息检 索技术为用户提供个性化的商品推 荐。
信息检索在数字图书馆中的应用
文本检索
数字图书馆使用信息检索 技术,允许用户通过关键 词或主题词检索相关的图 书和文献资料。
图像检索
数字图书馆中的图像资源 丰富,信息检索技术可以 帮助用户根据图像内容进 行检索,提高查找效率。
跨语言信息检索与多媒体信息检索
随着全球化的加速和互联网的普及,跨 语言信息检索和多媒体信息检索成为研
究的热点问题。
跨语言信息检索主要解决不同语言间 的语义鸿沟问题,通过语言翻译、对齐 等技术,实现跨语言的信息检索和问答
。
多媒体信息检索主要针对图像、视频、 音频等多媒体数据进行信息检索和分析 ,通过使用图像识别、视频分析和音频 识别等技术,提高多媒体信息检索的准
确性和效率。
THANKS FOR WATCHING
感谢您的观看
01
02
03
04
文本处理技术
包括分词、词性标注、句法分 析、文本聚类等。
索引技术
包括倒排索引、B树索引、位 图索引等。
查询处理技术
包括查询扩展、查询优化、查 询执行等。
结果展示技术
包括排序算法、摘要生成、结 果反馈等。
06
信息检索的未来发展
语义网与信息检索
语义网技术的成熟发展为信息检索提供了新的机会和挑战。
语义网通过使用本体、词汇表和规则等,使信息具有明确的含义和上下文,从而提 高了信息检索的准确性和效率。
基于本体的信息检索利用语义网中的本体模型,能够实现更精确、更快速的信息检 索,为搜索引擎、问答系统和推荐系统等应用提供了新的解决方案。
个性化推荐
通过分析用户的购物历史和浏览行 为,电子商务平台可以运用信息检 索技术为用户提供个性化的商品推 荐。
信息检索在数字图书馆中的应用
文本检索
数字图书馆使用信息检索 技术,允许用户通过关键 词或主题词检索相关的图 书和文献资料。
图像检索
数字图书馆中的图像资源 丰富,信息检索技术可以 帮助用户根据图像内容进 行检索,提高查找效率。
跨语言信息检索与多媒体信息检索
随着全球化的加速和互联网的普及,跨 语言信息检索和多媒体信息检索成为研
究的热点问题。
跨语言信息检索主要解决不同语言间 的语义鸿沟问题,通过语言翻译、对齐 等技术,实现跨语言的信息检索和问答
。
多媒体信息检索主要针对图像、视频、 音频等多媒体数据进行信息检索和分析 ,通过使用图像识别、视频分析和音频 识别等技术,提高多媒体信息检索的准
确性和效率。
THANKS FOR WATCHING
感谢您的观看
01
02
03
04
文本处理技术
包括分词、词性标注、句法分 析、文本聚类等。
索引技术
包括倒排索引、B树索引、位 图索引等。
查询处理技术
包括查询扩展、查询优化、查 询执行等。
结果展示技术
包括排序算法、摘要生成、结 果反馈等。
文献检索(信息检索)的概念.ppt
谢谢观赏
25
(8)表谱
用编年、表格等形式来揭示时间概念或谱列历 史事实的工具书。特点是眉目清晰,简要易 查。
纪年表:不同的纪年系列进行对照。如《中国 历史纪年表》
历表:将不同历法的年月日进行对照。
大事年表:按年月编录大事,又称大事记。
专门性表谱:为某学科、某专题、某人物编撰 的表谱。如查官制《历代职官表》,查地理 沿革《历代地理沿革表》,查人物《历代人 20物19-8-19年里碑传综表》,谢个谢观赏人年谱、年表等。 26
检索过程是在人与机器的合作、协同下完成 的,它们经常用实时的、交互的方式从计算机存 贮的大量数据中自动分拣出用户所需要的信息。 计算、比较、选择的匹配任务是由机器来执行的, 而人则是整个检索方案的设计者和操纵者。
检索用户由专业检索人员向个人终端用户转移。
2019-8-19
谢谢观赏
6
三、信息检索工具
(1)字、词典:字典解释字形、读音、含义和用法;
词典解释词语的概念、意义及用法,可分语文
词典、专科词典和综合词典三大类。语文词典
有《现代汉语词典》、《汉语大字典》、《汉
语大词典》;专科词典有《经济大词典》、
《数学词典》;综合性词典有《辞源》(1884
年以前)和《辞海》(兼顾古今)
2019-8-19
谢谢观赏
谢谢观赏
15
3.索引
将收录范围内的文献中的题名、主题、 人名、地名等名词术语以及其他有关款目抽 出,注明出处,并按一定的排检方式组织而 成的一种检索系统。是以文献中的“知识单 元”为单位,揭示各种文献外部特征或内容 特征的系统化记载工具。
索引揭示文献内容比目录更为深入和细 致,比目录应用更广泛。
2019-8-19
信息检索基础PPT课件
信息检索基本原理的核心是用户信息需 求与文献信息集合的比较和选择,信息检索实 质上是两者匹配的过程。
4
2.1.2 信息检索类型
信
息 检
依检索内容划分
索
类
型
文献信息检索 数据信息检索 事实信息检索
5
2.1.2 信息检索的类型
数据检索:检索的结果是数据或数值。 如某种材料的电阻;某变压器
的参数;化学分子式、数据图表等。<手 册>
6
事实检索:检索的结果是事实结论。 查询某一事物(事件)的性质、定义、
原理以及发生的时间、地点过程等。如某 产品是哪个厂家生产,哪个牌子的最好; 第一颗人造卫星是什么时候升空的。<年 鉴>
7
文献检索:检索的结果是文献资料。 查找相关文献的内容、出处、收藏单位
等。如系统地查找数控机床相关方面的文 献。<论文 > 文献检索是信息检索的核心部分。
11
2.2 信息检索途径
检索途径就是检索文献的出发点及路线,也称 “检索点”。
信息检索与信息存储是互逆的过程,存储在检 索工具和系统中的有些著录项或标引字段是可以 提供检索的,这些著录或标引字段就是检索入口。
信息检索途径一般包括文献信息的内容特征途 径和外部特征途径。
12
▪ 根据信息外部特征和内容特征的不同标识, 检索途径可作如下划分:
26
主题语言
检 索 语 言
分类语言
关键词语言 叙词语言
标题词语言
27
2.3.1检索词的提取 ▪ 检索词提取原则
➢选用各学科的专业术语,不能用通俗用 语
➢选用意义明确的词汇,不用一般的、通 用性的词汇
➢充分利用规范词(叙词或主题词)
28
提取检索词的方法
4
2.1.2 信息检索类型
信
息 检
依检索内容划分
索
类
型
文献信息检索 数据信息检索 事实信息检索
5
2.1.2 信息检索的类型
数据检索:检索的结果是数据或数值。 如某种材料的电阻;某变压器
的参数;化学分子式、数据图表等。<手 册>
6
事实检索:检索的结果是事实结论。 查询某一事物(事件)的性质、定义、
原理以及发生的时间、地点过程等。如某 产品是哪个厂家生产,哪个牌子的最好; 第一颗人造卫星是什么时候升空的。<年 鉴>
7
文献检索:检索的结果是文献资料。 查找相关文献的内容、出处、收藏单位
等。如系统地查找数控机床相关方面的文 献。<论文 > 文献检索是信息检索的核心部分。
11
2.2 信息检索途径
检索途径就是检索文献的出发点及路线,也称 “检索点”。
信息检索与信息存储是互逆的过程,存储在检 索工具和系统中的有些著录项或标引字段是可以 提供检索的,这些著录或标引字段就是检索入口。
信息检索途径一般包括文献信息的内容特征途 径和外部特征途径。
12
▪ 根据信息外部特征和内容特征的不同标识, 检索途径可作如下划分:
26
主题语言
检 索 语 言
分类语言
关键词语言 叙词语言
标题词语言
27
2.3.1检索词的提取 ▪ 检索词提取原则
➢选用各学科的专业术语,不能用通俗用 语
➢选用意义明确的词汇,不用一般的、通 用性的词汇
➢充分利用规范词(叙词或主题词)
28
提取检索词的方法
《信息检索基础知识》课件
03
信息检索系统
信息检索系统的构成
信息检索系统由信息源、信息组织与 检索方式、信息检索工具、用户界面
和信息利用等部分构成。
信息源是信息检索系统的物质基础, 包括各种类型的文献、网页、社交媒
体等。
信息组织与检索方式是信息检索系统 的核心,通过关键词、分类、主题等 方式对信息进行组织和检索。
信息检索工具是信息检索系统的手段 ,包括搜索引擎、数据库、图书馆等 。
05
信息检索的未来发展
信息检索技术的发展趋势
语义理解技术
随着自然语言处理技术的不断进步,信息检 索将更加注重对用户查询的语义理解,以提 高检索的准确性和相关性。
个性化检索
个性化检索技术将更加成熟,能够根据用户 的兴趣、偏好和行为习惯,为用户提供更加 精准和个性化的检索结果。
多模态检索
多模态检索技术将实现文本、图像、音频和 视频等多种媒体信息的融合检索,满足用户 对多媒体信息检索的需求。
自然语言处理
自然语言处理是信息检索中不可或缺的技术之一,它利用计算机对自然语言文本进行分析和处理,以 实现自然语言文本的自动识别和机器理解。
自然语言处理技术包括分词、词性标注、句法分析、语义分析等,这些技术能够将自然语言文本转换为 计算机可识别的格式,以便进行后续的信息检索和文本挖掘。
自然语言处理技术的应用范围广泛,例如在搜索引擎中实现自动纠错、自动完成、智能推荐等功能,以 及在智能客服中实现自动问答、智能回复等功能。
源。
网络信息检索阶段
随着计算机技术的发展,人们开始利用计算 机进行信息检索,出现了各种基于计算机技 术的检索工具和数据库。
智能信息检索阶段
随着人工智能技术的发展,智能信息检索逐 渐成为新的发展趋势,它能够更加智能地理 解用户需求,提供更加精准的信息服务。
《信息检索简介》课件
《信息检索简介》PPT课 件
这是一份关于信息检索的简介课件,了解信息检索的定义、过程、基本模型、 评价方法、应用领域、挑战和未来发展。
什么是信息检索
信息检索是指从大量的文本、图像、音频等数据中,根据用户需求,快速、 准确地获取相关的信息。与数据库的区别在于信息检索不仅仅是查找数据。
信息检索的过程
与计算机科学、信息科学、人 机交互等学科的交叉研究,推 动信息检索的创新和发展。
总结
信息检索的定义和过程
了解信息检索的基本概念和流程,包括检索请求 的来源、索引构建和检索结果的评价。
应用领域和面临的挑战
了解信息检索在文本、图像、音频等领域的具体 应用,以及信息过载和信息不对称等挑战。
不同模型和评价方法
以布尔逻辑为基础,将检索请求和文档看作布尔 表达式,进行匹配和检索。
向量空间模型
将检索请求和文档表示为向量,在向量空间中计 算相似度,找出最相关的信息。
信息检索的评价方法
1 查准率和查全率
用于衡量检索结果的准确 性和召回率。
2 ROC曲线和AUC值
通过绘制真阳性率和假阳 性率的曲线,评估分类模 型的性能。
掌握布尔模型、向量空间模型等基本模型,以及 查准率、查全率、F1值等评价方法。
未来发展和研究方向
展望信息检索的未来,如自然语言处理、智能系 统和跨学科研究的发展。
多语言信息检索
涉及多种语言的信息检索, 如何处理不同语言和文化之 间的差异。
信息检索的未来发展
自然语言处理和语音 识别技术的发展
借助自然语言处理和语音识别 技术,提高信息检索的准确性 和效率。
智能系统的不断完善
利用机器学习和人工智能技术, 构建更智能、自适应的信息检 索系统。
这是一份关于信息检索的简介课件,了解信息检索的定义、过程、基本模型、 评价方法、应用领域、挑战和未来发展。
什么是信息检索
信息检索是指从大量的文本、图像、音频等数据中,根据用户需求,快速、 准确地获取相关的信息。与数据库的区别在于信息检索不仅仅是查找数据。
信息检索的过程
与计算机科学、信息科学、人 机交互等学科的交叉研究,推 动信息检索的创新和发展。
总结
信息检索的定义和过程
了解信息检索的基本概念和流程,包括检索请求 的来源、索引构建和检索结果的评价。
应用领域和面临的挑战
了解信息检索在文本、图像、音频等领域的具体 应用,以及信息过载和信息不对称等挑战。
不同模型和评价方法
以布尔逻辑为基础,将检索请求和文档看作布尔 表达式,进行匹配和检索。
向量空间模型
将检索请求和文档表示为向量,在向量空间中计 算相似度,找出最相关的信息。
信息检索的评价方法
1 查准率和查全率
用于衡量检索结果的准确 性和召回率。
2 ROC曲线和AUC值
通过绘制真阳性率和假阳 性率的曲线,评估分类模 型的性能。
掌握布尔模型、向量空间模型等基本模型,以及 查准率、查全率、F1值等评价方法。
未来发展和研究方向
展望信息检索的未来,如自然语言处理、智能系 统和跨学科研究的发展。
多语言信息检索
涉及多种语言的信息检索, 如何处理不同语言和文化之 间的差异。
信息检索的未来发展
自然语言处理和语音 识别技术的发展
借助自然语言处理和语音识别 技术,提高信息检索的准确性 和效率。
智能系统的不断完善
利用机器学习和人工智能技术, 构建更智能、自适应的信息检 索系统。
信息检索概论课件
信息检索概论课件
1. 信息概论
• 1.2信息的特性
(7) 可共享性 与物质、能量不同,信息没有排他性,它可以共享。
信息检索概论课件
1. 信息概论
• 1.3 信息的作用
(1)信息是人类认识客观世界及其发展规律 的基础
人类的认识器官,包括感觉器官和思维器 官,对各种渠道的信息进行接收,并通过思 维器官将已收集到的大量信息进行鉴别、筛 选、归纳、提炼、存贮而形成不同层次的感 性认识和理性认识。
第一章 信息检索概论
• 1. 信息概论 • 1.2信息的特性
(1) 普遍性 信息是事物运动的状态和状态变化的方式(本体论,的反 映—认识论),因此,只要有客观事物的存在,只要客观事物 在不断地运动,就会有它们运动的状态和状态变化的方式, 也就存在着信息,所以信息是普遍存在的,信息具有普遍性。 (2)传递性 信息在事物之间的相互联系必定在信息流动中发生。信息 的传递性表现在人与人之间的消息交换,人与机器、机器与 机器之间的信息交换,动物与植物的信号交换。信息的传递 和流通过程是一个重复使用的流通过程,在这一过程中,信 息的占有者不会因传递信息而失掉信息,一般说来,也不会 因多次使用而改变信息的自身价值。
• 3 信息源
3. 1 信息源的类型 信息源的类型可依不同的标准划分如下:
3.1 . 3 按信息表现形式划分 可以划分为文字信息、图像信息、数值数据信息和语音信。
其中数值数据信息是“信息的数字形式”或“数字化的信息 形式”。狭义的“数据”是指有一定数值特性的信息,如统 计数据、测量数据以及计算机中区别于程序的计算数据。广 义的数据是指在计算机网络中存储、处理、传输的二进制数 字符编码,文字信息、图像信息、语言信息以及从自然界直 接采集的各种自然信息等均可转换为二进制数码,网络中的 数据通信、数据处理和数据库等就是广义的数值数据信息。
1. 信息概论
• 1.2信息的特性
(7) 可共享性 与物质、能量不同,信息没有排他性,它可以共享。
信息检索概论课件
1. 信息概论
• 1.3 信息的作用
(1)信息是人类认识客观世界及其发展规律 的基础
人类的认识器官,包括感觉器官和思维器 官,对各种渠道的信息进行接收,并通过思 维器官将已收集到的大量信息进行鉴别、筛 选、归纳、提炼、存贮而形成不同层次的感 性认识和理性认识。
第一章 信息检索概论
• 1. 信息概论 • 1.2信息的特性
(1) 普遍性 信息是事物运动的状态和状态变化的方式(本体论,的反 映—认识论),因此,只要有客观事物的存在,只要客观事物 在不断地运动,就会有它们运动的状态和状态变化的方式, 也就存在着信息,所以信息是普遍存在的,信息具有普遍性。 (2)传递性 信息在事物之间的相互联系必定在信息流动中发生。信息 的传递性表现在人与人之间的消息交换,人与机器、机器与 机器之间的信息交换,动物与植物的信号交换。信息的传递 和流通过程是一个重复使用的流通过程,在这一过程中,信 息的占有者不会因传递信息而失掉信息,一般说来,也不会 因多次使用而改变信息的自身价值。
• 3 信息源
3. 1 信息源的类型 信息源的类型可依不同的标准划分如下:
3.1 . 3 按信息表现形式划分 可以划分为文字信息、图像信息、数值数据信息和语音信。
其中数值数据信息是“信息的数字形式”或“数字化的信息 形式”。狭义的“数据”是指有一定数值特性的信息,如统 计数据、测量数据以及计算机中区别于程序的计算数据。广 义的数据是指在计算机网络中存储、处理、传输的二进制数 字符编码,文字信息、图像信息、语言信息以及从自然界直 接采集的各种自然信息等均可转换为二进制数码,网络中的 数据通信、数据处理和数据库等就是广义的数值数据信息。
信息检索课件ppt
用知识资源。
信息检索的发展历程
传统信息检索阶段
主要依赖于手工检索,如图书 馆目录、卡片等。
计算机信息检索阶段
随着计算机技术的发展,人们 开始利用计算机进行信息检索 。
网络信息检索阶段
互联网的普及使得信息检索技 术得到了广泛应用,搜索引擎 等网络信息检索工具应运而生 。
个性化信息检索阶段
随着大数据和人工智能技术的 发展,个性化信息检索逐渐成 为研究热点,如推荐系统等。
信息检索课件
目录
• 信息检索概述 • 信息检索基础 • 信息检索相关技术 • 信息检索评价 • 信息检索前沿技术 • 信息检索应用案例
01
信息检索概述
定义与概念
定义
信息检索是指通过一定的方法和 手段,从大量的文档、数据中查 找出与用户需求相关的信息,并 将结果呈现给用户的过程。
概念
信息检索主要关注如何有效地从 海量的信息中筛选出与用户需求 相关的信息,它强调的是对大规 模数据的处理和挖掘能力。
用户。
推荐系统
个性化推荐
通过分析用户的浏览历史、购买记录等个人信息 ,推荐系统能够为用户提供个性化的推荐。
实时性
推荐系统能够根据用户的最新行为进行实时推荐 ,以提供更准确的结果。
考虑用户反馈
推荐系统通常会考虑用户的反馈,以调整其推荐 策略和提高用户满意度。
数字图书馆
资源丰富
数字图书馆拥有大量的电子书籍、期刊和论文等资源,能够满足 用户的学术需求。
混合搜索算法
结合基于关键词匹配和基于权重的搜索算法,提高搜索准确率和召 回率。
机器学习在信息检索中的应用
特征提取
利用机器学习算法从文本中提取 特征,如TF-IDF(词频-逆文档频
信息检索的发展历程
传统信息检索阶段
主要依赖于手工检索,如图书 馆目录、卡片等。
计算机信息检索阶段
随着计算机技术的发展,人们 开始利用计算机进行信息检索 。
网络信息检索阶段
互联网的普及使得信息检索技 术得到了广泛应用,搜索引擎 等网络信息检索工具应运而生 。
个性化信息检索阶段
随着大数据和人工智能技术的 发展,个性化信息检索逐渐成 为研究热点,如推荐系统等。
信息检索课件
目录
• 信息检索概述 • 信息检索基础 • 信息检索相关技术 • 信息检索评价 • 信息检索前沿技术 • 信息检索应用案例
01
信息检索概述
定义与概念
定义
信息检索是指通过一定的方法和 手段,从大量的文档、数据中查 找出与用户需求相关的信息,并 将结果呈现给用户的过程。
概念
信息检索主要关注如何有效地从 海量的信息中筛选出与用户需求 相关的信息,它强调的是对大规 模数据的处理和挖掘能力。
用户。
推荐系统
个性化推荐
通过分析用户的浏览历史、购买记录等个人信息 ,推荐系统能够为用户提供个性化的推荐。
实时性
推荐系统能够根据用户的最新行为进行实时推荐 ,以提供更准确的结果。
考虑用户反馈
推荐系统通常会考虑用户的反馈,以调整其推荐 策略和提高用户满意度。
数字图书馆
资源丰富
数字图书馆拥有大量的电子书籍、期刊和论文等资源,能够满足 用户的学术需求。
混合搜索算法
结合基于关键词匹配和基于权重的搜索算法,提高搜索准确率和召 回率。
机器学习在信息检索中的应用
特征提取
利用机器学习算法从文本中提取 特征,如TF-IDF(词频-逆文档频
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5
④知识、情报和文献
知识是人类社会实践的总结,是人的主观世界对客观世界的 概括和总结。
情报的概念是极其广泛的,它是一种普遍存在的社会现象。
文献一词最早出现在《论语·八佾》中,新版《辞海》读文 献的定义作了解释:“记录有知识的一切载体的统称,即用文字、 图像、符号、声频、视频等手段记录人类知识的各种载体(如纸 张、胶片、磁带、磁盘、光盘等)。
物质的运动产生信息;各种信息经过人们系统化的加工处理,
转化成知识;知识经过系统化的加工处理转化为情报;情报用于
社会实践,解决实践中存在的问题,创造出物质财富或精神财富,
这时的情报便转化为生产力,产生新的信息,形成一个无限循环
的转化过程。这也表明,信息包含知识、知识包含情报。它们不
仅仅是包含关系,而且可以互相转化。
信息检索概述
1
1、信息资源及其组织
①信息的概念 ②信息的特征 ③信息的类型 ④知识、情报和文献 ⑤信息源
2
①信息的概念
我国汉语中很早就有“信息”这 个词。早在一千多年前,唐朝诗人李 中在《碧云集·暮春怀故人》一诗中 就留下了“梦断美人沉信息,目穿长 路倚楼台”的佳句。当时,“信息” 指的是音信、消息。
信息就是人或者机器通过感官或 者外部设备与外界交流的所有内容。
3
②信息的特征
a、客观性与普遍性 b、流动性与传递性 c、时效性与有效性 d、与载体的不可分割性与可加工性 e、积累性与价值性
4
③信息的类型
按照载体的形式划分:印刷型、缩微型、声像 型、电子型 按信息的应用范围划分:白色信息、灰色信息、 黑色信息 按信息的加工程度划分:零次信息、一次信息、 二次信息、三次信息 按照数字化信息资源标准划分:结构化数据、 非结构化的数据
9
4、信息检索的历史
①手工信息检索阶段 ②机械信息检索阶 ③计算机信息检索系统阶段
10
①手工信息检索阶段
信息检索直接发源于文摘索引工作和参考咨询工作。文摘工作的历
史可以追溯到远古时代。根据研究文摘历史的专家弗西斯·威蒂
(Francis J. Witty)介绍,一种用途类似于文摘的东西首先出现在公
12
③计算机信息检索系统阶段
计算机信息检索可以分成四个发展阶段: 第一阶段:脱机检索阶段 第二阶段:联机检索阶段 第三阶段:光盘检索阶段 第四阶段:网络检索阶段
13
5、信息检索的现状
元前两千年封装美索不达米亚人用楔形文字写成的文献的陶制封套上。
我国最早带有内容摘要的图书目录是西汉刘向、刘歆父子整理编撰的
《别录》和《七略》。古代使用文摘的人有学者、政治家,还有教皇和
僧侣。
20世纪,多数图书馆成立了参考咨询部门,主要利用图书馆的书目
工具来帮助读者查找图书、期刊或现成答案。随着文献的激增和读者需
★机电信息检索系统:使用诸如打孔机、验孔机、分类机等机电 设备记录二次文献,用电刷作为检索元件的信息检索系统。
★光电信息检索系统:使用缩微照相记录二次文献,以胶卷或胶 片边缘部分若干黑白小方块的不同组合做检索标志,利用光电检索元 件查找文献的检索的系统。
机械信息检索系统利用当时先进的机械装置改了信息的存储和检 索方式,通过控制机械动作,借助机械信息处理机的数据识别功替部 分人脑,促进了信息检索的自动化。但它并没有发展信息检索语言, 只是采用单一的方法对固定的存储形式进行检索的工具,而且过分依 赖于设备,检索复杂,成本较高,检索效率和质量都不理想。机械信 息检索系统很快就被迅速发展的计算机信息检索系统所取代。
的馆藏目录、检索工具和参考工具书都是卡片型或者印刷型的,检索的
方式基本上是以手工方式为主。
11
②机械信息检索阶段
机械信息检索系统是20世纪40-50年代开始使用各种机械装置进 行信息检索的机械系统,这个阶段的生命周期很短暂,是手工检索向 计算机信息检索的过渡阶段。机械信息检索主要包括两种基本类型。
例如,人类的语言、音乐,自然界的各种声音、图形、图像,计算
机系统中的文字、数据和文档等都属于感觉媒体。
表示媒体:表示媒体的作用是加工、处理和传输感觉媒体,如
语言编码、文本编码、图像编码等。
表现媒体:表现媒体的作用是将媒体信息的内容呈现出来。它
又分为两种:一种是输入表现媒体,源自键盘、摄像机、光笔、话筒等;另一种是输出表现媒体,如显示器、喇叭、打印机等。
存储媒体:存储媒体用于存放经过数字化后的媒体信息,以便
计算机随时处理,如硬盘、软盘、磁带及光盘等。
传输媒体:传输媒体用来将媒体从一处传送到另一处,是信息
通信的载体,如双绞线、同轴电缆、光纤等。
8
3、信息检索的概念
信息检索,亦称为情报检索,作为一项行为的存在已 经有很长时间的历史了,但信息检索的概念是在20世纪40 年代由穆尔斯(C. N. Mooers)首先提出的。
6
⑤信息源
a、口头信息源 b、实物信息源 c、文献信息源
7
2、信息媒体类型、特点和用途
媒体(Medium)指的是信息传递和存储的最基本的技术和手段。
或者说,媒体是信息的存在形式和表现形式。简单地说,媒体就是
人与人之间交流思想和信息的中介物。
感觉媒体:感觉媒体能够直接作用于人的感官,使人产生感觉。
信息检索(Information Retrieval)是指将信息按照一 定的方式组织和存储起来,并根据信息用户的需求找出有 关的信息的过程和技术。它的全称应该叫“信息存储与检 索”(Information Storage and Retrieval)。这是广义 的信息检索,它包括存储和检索两个方面,信息存贮主要 包括对信息在选择的基础上进行信息特征描述、加工并使 其有序化。检索是指借助一顶的设备和工具,采用一系列 方法和策略查找出所需要的信息。存储是检索的基础,检 索是存贮的目的。狭义的信息检索则仅指该过程的后半部 分,即从信息集合中找出所需要的信息的过程。
求的增长,逐渐发展倒从多种文献资源中查找、分析、评价和重新组织
信息;“索引”突破了以前的狭隘范畴,成为独立的检索工具;到20世
纪40年代又进一步包括回答事实性咨询、编制书目、文摘,进行专题文
献检索,提供文献代译等。“信息检索”从此成为一项独立的用户服务
工作,并逐渐从单纯的经验工作向专业化方向发展。但在此阶段所使用
④知识、情报和文献
知识是人类社会实践的总结,是人的主观世界对客观世界的 概括和总结。
情报的概念是极其广泛的,它是一种普遍存在的社会现象。
文献一词最早出现在《论语·八佾》中,新版《辞海》读文 献的定义作了解释:“记录有知识的一切载体的统称,即用文字、 图像、符号、声频、视频等手段记录人类知识的各种载体(如纸 张、胶片、磁带、磁盘、光盘等)。
物质的运动产生信息;各种信息经过人们系统化的加工处理,
转化成知识;知识经过系统化的加工处理转化为情报;情报用于
社会实践,解决实践中存在的问题,创造出物质财富或精神财富,
这时的情报便转化为生产力,产生新的信息,形成一个无限循环
的转化过程。这也表明,信息包含知识、知识包含情报。它们不
仅仅是包含关系,而且可以互相转化。
信息检索概述
1
1、信息资源及其组织
①信息的概念 ②信息的特征 ③信息的类型 ④知识、情报和文献 ⑤信息源
2
①信息的概念
我国汉语中很早就有“信息”这 个词。早在一千多年前,唐朝诗人李 中在《碧云集·暮春怀故人》一诗中 就留下了“梦断美人沉信息,目穿长 路倚楼台”的佳句。当时,“信息” 指的是音信、消息。
信息就是人或者机器通过感官或 者外部设备与外界交流的所有内容。
3
②信息的特征
a、客观性与普遍性 b、流动性与传递性 c、时效性与有效性 d、与载体的不可分割性与可加工性 e、积累性与价值性
4
③信息的类型
按照载体的形式划分:印刷型、缩微型、声像 型、电子型 按信息的应用范围划分:白色信息、灰色信息、 黑色信息 按信息的加工程度划分:零次信息、一次信息、 二次信息、三次信息 按照数字化信息资源标准划分:结构化数据、 非结构化的数据
9
4、信息检索的历史
①手工信息检索阶段 ②机械信息检索阶 ③计算机信息检索系统阶段
10
①手工信息检索阶段
信息检索直接发源于文摘索引工作和参考咨询工作。文摘工作的历
史可以追溯到远古时代。根据研究文摘历史的专家弗西斯·威蒂
(Francis J. Witty)介绍,一种用途类似于文摘的东西首先出现在公
12
③计算机信息检索系统阶段
计算机信息检索可以分成四个发展阶段: 第一阶段:脱机检索阶段 第二阶段:联机检索阶段 第三阶段:光盘检索阶段 第四阶段:网络检索阶段
13
5、信息检索的现状
元前两千年封装美索不达米亚人用楔形文字写成的文献的陶制封套上。
我国最早带有内容摘要的图书目录是西汉刘向、刘歆父子整理编撰的
《别录》和《七略》。古代使用文摘的人有学者、政治家,还有教皇和
僧侣。
20世纪,多数图书馆成立了参考咨询部门,主要利用图书馆的书目
工具来帮助读者查找图书、期刊或现成答案。随着文献的激增和读者需
★机电信息检索系统:使用诸如打孔机、验孔机、分类机等机电 设备记录二次文献,用电刷作为检索元件的信息检索系统。
★光电信息检索系统:使用缩微照相记录二次文献,以胶卷或胶 片边缘部分若干黑白小方块的不同组合做检索标志,利用光电检索元 件查找文献的检索的系统。
机械信息检索系统利用当时先进的机械装置改了信息的存储和检 索方式,通过控制机械动作,借助机械信息处理机的数据识别功替部 分人脑,促进了信息检索的自动化。但它并没有发展信息检索语言, 只是采用单一的方法对固定的存储形式进行检索的工具,而且过分依 赖于设备,检索复杂,成本较高,检索效率和质量都不理想。机械信 息检索系统很快就被迅速发展的计算机信息检索系统所取代。
的馆藏目录、检索工具和参考工具书都是卡片型或者印刷型的,检索的
方式基本上是以手工方式为主。
11
②机械信息检索阶段
机械信息检索系统是20世纪40-50年代开始使用各种机械装置进 行信息检索的机械系统,这个阶段的生命周期很短暂,是手工检索向 计算机信息检索的过渡阶段。机械信息检索主要包括两种基本类型。
例如,人类的语言、音乐,自然界的各种声音、图形、图像,计算
机系统中的文字、数据和文档等都属于感觉媒体。
表示媒体:表示媒体的作用是加工、处理和传输感觉媒体,如
语言编码、文本编码、图像编码等。
表现媒体:表现媒体的作用是将媒体信息的内容呈现出来。它
又分为两种:一种是输入表现媒体,源自键盘、摄像机、光笔、话筒等;另一种是输出表现媒体,如显示器、喇叭、打印机等。
存储媒体:存储媒体用于存放经过数字化后的媒体信息,以便
计算机随时处理,如硬盘、软盘、磁带及光盘等。
传输媒体:传输媒体用来将媒体从一处传送到另一处,是信息
通信的载体,如双绞线、同轴电缆、光纤等。
8
3、信息检索的概念
信息检索,亦称为情报检索,作为一项行为的存在已 经有很长时间的历史了,但信息检索的概念是在20世纪40 年代由穆尔斯(C. N. Mooers)首先提出的。
6
⑤信息源
a、口头信息源 b、实物信息源 c、文献信息源
7
2、信息媒体类型、特点和用途
媒体(Medium)指的是信息传递和存储的最基本的技术和手段。
或者说,媒体是信息的存在形式和表现形式。简单地说,媒体就是
人与人之间交流思想和信息的中介物。
感觉媒体:感觉媒体能够直接作用于人的感官,使人产生感觉。
信息检索(Information Retrieval)是指将信息按照一 定的方式组织和存储起来,并根据信息用户的需求找出有 关的信息的过程和技术。它的全称应该叫“信息存储与检 索”(Information Storage and Retrieval)。这是广义 的信息检索,它包括存储和检索两个方面,信息存贮主要 包括对信息在选择的基础上进行信息特征描述、加工并使 其有序化。检索是指借助一顶的设备和工具,采用一系列 方法和策略查找出所需要的信息。存储是检索的基础,检 索是存贮的目的。狭义的信息检索则仅指该过程的后半部 分,即从信息集合中找出所需要的信息的过程。
求的增长,逐渐发展倒从多种文献资源中查找、分析、评价和重新组织
信息;“索引”突破了以前的狭隘范畴,成为独立的检索工具;到20世
纪40年代又进一步包括回答事实性咨询、编制书目、文摘,进行专题文
献检索,提供文献代译等。“信息检索”从此成为一项独立的用户服务
工作,并逐渐从单纯的经验工作向专业化方向发展。但在此阶段所使用