信息检索ppt课件
合集下载
第2章--信息检索PPT课件
经济
文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
S
T U V X Z
农业科学
工业技术 交通运输 航空、航天 环境科学、安全科学 综合性图书
《中国图书馆分类法》
中国图书馆分类法分类表共分22个大类,再分17个 二级目录,医药卫生属于R大类。 《中图法》采用汉语拼音字母和阿拉伯数字组成的 混合制号码作类目标识,用一个字母标记一个基本
的问题;
另一方面是特定原始文献的查找,即在查找特定
的文献线索后,找出原始文献的过程。
第一节 信息检索基础
一、信息检索概念
(二)信息检索的意义和作用 信息检索 有助于知识更新 ,有助于同学们扩大视野 ,了解和把握有关学科中出现的新思想、新观点与 新知识。掌握信息检索技术是快速、准确地获取和 利用最新信息的有效途径。 信息检索有助于科学研究,了解和把握有关学科的 起源和发展过程。 有助于独立自主地解决自己在学习、生活和工作中 所遇到的疑难问题。 是接受终身教育的必要手段。 节省时间,提高效率。
第二节 信息检索语言
二、检索语言的种类
(一)分类检索语言 分类检索语言又称分类法,是用分类号(字母、数 字或它们的组合)来表达各种概念的,并将各种概 念按学科性质进行分类和系统排列的信息检索语言。 它以树状结构的形式,按知识门类的逻辑次序反映事物 的从属、派生关系,构成具有上位类和下位类隶属、同 位类并列的概念等级体系。 能较好体现概念的族性关系,从学科专业的角度检索资 料,比较方便,扩大、缩小检索范围方便。
(一)按信息检索的对象划分
数据信息检索 利用数据库、工具书等以数值或数据为对象的检 索,也称为数值检索。检索包含分子式、分子量 、公式 、图表等特定数据的信息。
《信息检索》PPT课件
1985年,国家教委印发<改进和发展文献课教学的几点意 见>的通知. (85)教高一司字065号
1992年,国家教委印发《文献检索课教学基本要求》,全 面规定了“文献检索课”的课程性质、教学目的、课程组
织、教学评估.教高司[1992]44号
1993年,国家教委<关于成立《文献检索课》教学指导小
怎样提高信息处理能力?
精选课件ppt
7
内容提要
1
引言
2
基本概念
3
互联网资源
4
专业学术资源
5
商标权
6
其他知识产权
精选课件ppt
8
1. 信息、知识、情报、文献
信息:事物属性,是由事物发出的消息、指令、数据. 知识:是人类社会实践经验的总结,是人的主观世界对于
客观世界的概括和反映. 情报:是激活了的知识,是为特定目的服务的信息;是对
(20%)
精选课件ppt
15
2.3.1 图书
对已发表的成果和经验,或某知识领域的系统论述或总结. 通常以期刊论文、会议论文、研究报告等一次文献为基本
素材,经分析、归纳、重组而成.
范围:专著、文集、教科书、普及读物、百科全书、年鉴、手册、 词典等.
按载体形态分
手抄型文献 印刷型文献 微缩型文献 机读型文献(电子文献) 视听型文献
精选课件ppt
12
2.1 文献内容层次
零次文献:未经正式发表或不宜公开或交流的文献.
包括:底稿、手稿、文稿、书信、图纸、记录、经验、意见等.
一次文献:原始制作,即作者以本人的研究成果为基本素
材而创作(或撰写)的文献.
手抄型:主要指古旧文献和未经付印的手稿及技术档案之 类的资料.
信息检索基础 PPT课件
2.4.2 信息财富
物质、能量、信息是现代社会发展的三大支柱,缺一 不可,而信息资源起着主导作用.
人类财富观:
古代农业社会—农业财富观、货币财富观。 工业社会—股票成为这一时期的财富代言。 20世纪50年代以来—信息资源成为财富的象征。
2.5 信息查询与利用的重要性
数字化时代生存的基本技能:是终身学习的技能, 即具有较强的信息发现、吸收、创新能力。在信息时 代一个人生存的质量如何取决于其信息化程度与信息 素质能力的高低。在信息社会中,个人的信息获取能 力,会对个人的事业成功、经济收入、社会地位即个 人的生存能力产生直接的影响,信息获取能力的差异 有可能形成社会中信息富有和信息贫穷的对立的不平 等情形:一部分人因拥有知识及技巧而能在许多方面 处于有利地位,另一部分人则有可能陷入不利境地。
2.2.4信息、知识与文献的关系
★事物发生发出信息;
★信息经人脑加工变为知识
信息只有经过加工,上升为对自然和社会发展客观规律的 认识,才构成知识。
★知识被记录形成文献;
★文献经传递、应用于理论与实践产生新的信息。
2.4信息社会和信息财富 2.4.1信息社会的特点:信息总量剧增,多媒体
技术和信息高速公路网络被广泛应用,成为信息 社会的重要表征,同时,信息渗入到社会生活的 各个角落,影响和改变了人们的生活和生存方式 。 一个国家的信息化程度,代表着其社会生产力的发 展水平,也决定着这个国家在下一个世纪中存在 与发展的实力和地位,而国家的信息化需要大批 具有信息素质的创造性人才。
3.信息检索方式
(1)根据信息的存储载体和检索技术手段的不同分类 手工检索:传统检索方法,是指手工翻检的方式,利用工具书 等各种印刷版适用于纸质印刷的 书刊文献。 例如:《计算机应用文摘》、《电子科技文摘》等。 计算机检索:使用的是检索系统。系统包括计算机设备、终端 、通信设施、数据库和检索、应用软件等。检索是针对数据 库进行的。即利用计算机检索系统从数据库中检索所需文献 信息。 例如:Dialog、Ei、ISTP、万方数据资源系统等。
《信息检索原理》课件
如何构建信息检索系统
学习如何构建一个信息检索系统,以便为用户提供更好的体验并提高检索结果的质量。
构建索引
将文档转换为可以搜寻的形式。
设计用户界面
为用户提供易于使用的搜索界面和反馈机制。
优化检索结果
优化搜索算法以提高结果的质量。
评估系统
使用标准的评估方法对系统进行评估,并调 整系统以提高性能。
信息检索的指标和评估方法
了解信息检索系统中的瓶颈和问题,可以学习如何优化以提高检索成功率。
数据清洗
清除格式不正确、语法错误 或缺少必要字词等的文档, 并捕获并处理拼写不正确或 同义词。
搜索算法
使用最新的搜索算法来匹配 文档和检索查询。
可扩展性
将系统构建为高度模块化的 结构并运用自然语言处理技 术,以获得最佳结果。
信息检索的挑战和未来趋势
了解当前和未来的挑战可以更好地为未来的工作做好准备。
自然语言处理
个性化搜索
目标是识别查询的自然语言并 将其转换为可检索的标准形式。
通过收集用户的搜索习惯和历 史记录来改进结果。
搜索引擎高级可视化
使用虚拟现实技术让用户更好 地了解搜索结果。
普通的搜索引擎模型
传统的信息检索模型
每个搜索请求都由关键字组成, 搜索引擎根据这些关键字在全 部Web内容中查找匹配。
使用机器处理的卡片目录和通 过专业人员进行分类目录来存 储和获取信息。
基于垂直领域信息检索 模型
针对某个特定主题,通过搜索 和筛选与该特定主题相关的文 件。
信息检索的不同方法
利用不同的方法,可以获得不同的结果。了解不同的体系结构以及如何选择最适合您需要的体系结构至关重 要。
《信息检索原理》PPT课 件
信息检索 ppt课件
学科不断分化,新学科不断涌现,产生了大量有特定研究对象的分支学科、边缘学科、交叉学科、综合性学科。据统计 ,目前全世界每年出版各种文献量为l2000万册,平均每天出版文献约32万件。
1950-2006年中文图书出版概况
140000 120000 100000
80000 60000 40000 20000
3、文种繁多,内容交叉重复
全球的科技期刊出版采用70余种语言出版。 由于研究和出版的重复,形成了大量的重复文献,如: 会议论文重复率达40 % ,专利文献重复率高达60%
4、文献分布既集中又分散
集中: 某一学科的文献通常有80%都集中在该学科15%的期 刊中,这些期刊称为“核心期刊”,其中的文献代表了该学科的 最高水平、最新成果,具有权威性。
狭义的信息指文献资源或数据资源,包括各媒体中的片 段、文章、图书、情报、观念等。
特 点: 1.不同的事物所存在的状态和运动方式,就会表现出不同的信息;
2.信息不是实体,必须借助某种介质才能表现或传播。
二、知识(knowledge)
是人类在认识和改造客观世界实践中获得的对事物本质 的认识和经验的综合。
信息经过选择、综合、研究、分析等加工过程后可以成为
情报;
知识是系统化、理论化的信息。
五、文献与信息素养
信息素养(Information literacy)指具有检索、分析、 评价和利用各种信息源以解决信息需求及制定明智决 策的能力,是对个人信息行为能力、独立学习能力以 及批判性思维能力等概括性描述。
分散: 随着科学技术发展, 学科分支越来越细,专业文献分散。
学科不断分化,新学科不断涌现,产生了大量有特定研究对象的分支学科、边缘学科、交叉学科
5、新陈代谢频繁,文献老化加快
1950-2006年中文图书出版概况
140000 120000 100000
80000 60000 40000 20000
3、文种繁多,内容交叉重复
全球的科技期刊出版采用70余种语言出版。 由于研究和出版的重复,形成了大量的重复文献,如: 会议论文重复率达40 % ,专利文献重复率高达60%
4、文献分布既集中又分散
集中: 某一学科的文献通常有80%都集中在该学科15%的期 刊中,这些期刊称为“核心期刊”,其中的文献代表了该学科的 最高水平、最新成果,具有权威性。
狭义的信息指文献资源或数据资源,包括各媒体中的片 段、文章、图书、情报、观念等。
特 点: 1.不同的事物所存在的状态和运动方式,就会表现出不同的信息;
2.信息不是实体,必须借助某种介质才能表现或传播。
二、知识(knowledge)
是人类在认识和改造客观世界实践中获得的对事物本质 的认识和经验的综合。
信息经过选择、综合、研究、分析等加工过程后可以成为
情报;
知识是系统化、理论化的信息。
五、文献与信息素养
信息素养(Information literacy)指具有检索、分析、 评价和利用各种信息源以解决信息需求及制定明智决 策的能力,是对个人信息行为能力、独立学习能力以 及批判性思维能力等概括性描述。
分散: 随着科学技术发展, 学科分支越来越细,专业文献分散。
学科不断分化,新学科不断涌现,产生了大量有特定研究对象的分支学科、边缘学科、交叉学科
5、新陈代谢频繁,文献老化加快
信息检索ppt课件
3
信息素养
• 信息素养也称信息素质
• 1989年美国图书协会提出的“具备有信息
素质的人,能够识别何时需要信息,知道 如何查找、评估和有效利用需要的信息来 解决实际问题或者做出决策,无论其选择 的信息来自于计算机、图书馆、政府机构、 电影或者其他任何可能的来源”
编辑课件
4
大学生信息素养
1.信息意识 2.信息知识 3.信息能力 4.信息道德
考核形式:文献检索
编辑课件
10
课程的性质
• 中西医学信息检索课是一门关于如何查找
医学文献、知识和信息的工具性课程,实践 性强。
编辑课件
11
第一• 第章一节概文献论与信息
• 一、信息与文献的基本概念 • 二、文献的类型 • 三、文献的级别 • 四、医学文献的特点 • 五、医学文献的社会职能
• 第二节 检索知识概述
从哲学角度解释强调信息是客观性
编辑课件
16
信息的特征
• 客观性 • 依附性 • 可传递性 • 可加工性 • 时效性 • 共享性
编辑课件
17
2.知识
• 知识(Knowledge)是人们在认识和改造客
观世界的实践中所获得的认识和经验的总 和,是人类通过对信息的感知、获取、选 择、处理、加工等一系列思维过程,形成 的对客观事物的本质和规律的认识。
编辑课件
7
全球医学教育最基本要求 (GMER)
国际医学教育组 (IIME )全球 医学教育最基本要求中涉及信 息管理的要求有5项:从不同数 据库和资源中查找、收集、组 织、解释相关医学生物信息; 从临床数据系统中检索特定病 人的信息;利用信息与网络技 术帮助诊断、治疗、预防及监 护与监测健康状况等;了解信 息技术的应用与局限;维护医 疗的实践记录以进行分析和改 进。
信息检索概述PPT课件
5
④知识、情报和文献
知识是人类社会实践的总结,是人的主观世界对客观世界的 概括和总结。
情报的概念是极其广泛的,它是一种普遍存在的社会现象。
文献一词最早出现在《论语·八佾》中,新版《辞海》读文 献的定义作了解释:“记录有知识的一切载体的统称,即用文字、 图像、符号、声频、视频等手段记录人类知识的各种载体(如纸 张、胶片、磁带、磁盘、光盘等)。
物质的运动产生信息;各种信息经过人们系统化的加工处理,
转化成知识;知识经过系统化的加工处理转化为情报;情报用于
社会实践,解决实践中存在的问题,创造出物质财富或精神财富,
这时的情报便转化为生产力,产生新的信息,形成一个无限循环
的转化过程。这也表明,信息包含知识、知识包含情报。它们不
仅仅是包含关系,而且可以互相转化。
信息检索概述
1
1、信息资源及其组织
①信息的概念 ②信息的特征 ③信息的类型 ④知识、情报和文献 ⑤信息源
2
①信息的概念
我国汉语中很早就有“信息”这 个词。早在一千多年前,唐朝诗人李 中在《碧云集·暮春怀故人》一诗中 就留下了“梦断美人沉信息,目穿长 路倚楼台”的佳句。当时,“信息” 指的是音信、消息。
信息就是人或者机器通过感官或 者外部设备与外界交流的所有内容。
3
②信息的特征
a、客观性与普遍性 b、流动性与传递性 c、时效性与有效性 d、与载体的不可分割性与可加工性 e、积累性与价值性
4
③信息的类型
按照载体的形式划分:印刷型、缩微型、声像 型、电子型 按信息的应用范围划分:白色信息、灰色信息、 黑色信息 按信息的加工程度划分:零次信息、一次信息、 二次信息、三次信息 按照数字化信息资源标准划分:结构化数据、 非结构化的数据
④知识、情报和文献
知识是人类社会实践的总结,是人的主观世界对客观世界的 概括和总结。
情报的概念是极其广泛的,它是一种普遍存在的社会现象。
文献一词最早出现在《论语·八佾》中,新版《辞海》读文 献的定义作了解释:“记录有知识的一切载体的统称,即用文字、 图像、符号、声频、视频等手段记录人类知识的各种载体(如纸 张、胶片、磁带、磁盘、光盘等)。
物质的运动产生信息;各种信息经过人们系统化的加工处理,
转化成知识;知识经过系统化的加工处理转化为情报;情报用于
社会实践,解决实践中存在的问题,创造出物质财富或精神财富,
这时的情报便转化为生产力,产生新的信息,形成一个无限循环
的转化过程。这也表明,信息包含知识、知识包含情报。它们不
仅仅是包含关系,而且可以互相转化。
信息检索概述
1
1、信息资源及其组织
①信息的概念 ②信息的特征 ③信息的类型 ④知识、情报和文献 ⑤信息源
2
①信息的概念
我国汉语中很早就有“信息”这 个词。早在一千多年前,唐朝诗人李 中在《碧云集·暮春怀故人》一诗中 就留下了“梦断美人沉信息,目穿长 路倚楼台”的佳句。当时,“信息” 指的是音信、消息。
信息就是人或者机器通过感官或 者外部设备与外界交流的所有内容。
3
②信息的特征
a、客观性与普遍性 b、流动性与传递性 c、时效性与有效性 d、与载体的不可分割性与可加工性 e、积累性与价值性
4
③信息的类型
按照载体的形式划分:印刷型、缩微型、声像 型、电子型 按信息的应用范围划分:白色信息、灰色信息、 黑色信息 按信息的加工程度划分:零次信息、一次信息、 二次信息、三次信息 按照数字化信息资源标准划分:结构化数据、 非结构化的数据
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
19
信息检索技术
❖ 一、布尔逻辑检索(not>and>or) ❖ 二、截词检索 ❖ 三、位置检索(常用的关系符号是(W)、(N)、
(F)、(S))
(四)限定字段检索
20
信息检索策略
❖ 1.分析检索课题,明确目的和要求 ❖ 2.选择合适的检索工具 ❖ 3.选择检索途径,确定检索标识 ❖ 4.编制检索表达式,调整检索策略 ❖ 5.浏览检索结果,获取原始文献。
具有广泛影响的定义
信息是事物存在方式、运动状态及其特 征的反映,是事物发出的信号、消息。
1 1信息的特征载体依来自性信无限共享性
息
的
永不枯竭性
特
征
开发增值性
应用时效性
存在普遍性
2
2
二、知识(knowledge)
❖ 《汉语词典》中解释为:人们在改造世界 的实践过程中所获得的认识和经验的总和。
❖ 知识 是人类对自然界、人类社会中各种现 象、规律的信息反映进行思维分析,加工 提炼,经过系统化、理论化的结果。
二、医学信息素养的内涵主要包括:
信息意识:是个体对信息重要性的认识程度和对 信息是否具有特殊的、敏锐的感受力和持久的注 意力,即对信息的捕捉、分析、判断和吸收的敏 感性。
信息知识:是指与信息有关的理论、知识和方法。
信息能力:是对信息的搜集获取能力、分析鉴别 能力和综合利用能力。
信息道德:是指在整个信息活动中,信息创建者、 信息服务提供者和信息使用者所必须要遵守的伦 理规范。
❖ 因此,知识是系统化、理论化的信息集合。
3 3
三、情报(information, intelligence )
❖ 《辞源》:“定敌情如何,而报于上官者”为情报。 ❖ 《辞海》:“战时关于敌情之报告,曰情报。
情报 是运用一定的媒 体(载体),越过空 间和时间传递给特定 用户,解决科研、生 产过程中的具体问题 所需要的特定知识和 信息。
《医学主题词表》等。
15
关键词语言
关键词(Key words)是直接从文献或网页的标 题、文摘或全文中抽选具有实质意义、能表达文 献实质内容,未经规范化处理的关键性自然语言 词汇。
16
关键词语言的特点
优点:
① 易于实现自动抽词和编制索引,尤其是计算机自动 编制索引。
② 表达主题直观,检索入口多,能及时反映新事物新 概念。
(一)定义
个人为满足其信息需要而获得信息的来源,称信 息源。(联合国教科文组织1976年《文献术语》)
信息源是“人们在科研活动、生产经营活动和 其它一切活动中所产生的成果和各种原始记录, 以及对这些成果和原始记录加工整理得到的成 品”。
6 6
(二)信息源的类型及特点
2.按信息源内容加工深度划分为:
❖ 特点:形态上多样,内容上原创,出处上分散。内
容新颖丰富,叙述具体详尽,参考价值大。
8 8
(二)信息源的类型及特点
❖ 二次文献
是按特定目的对一定范围或学科领域中大量分 散的,无组织的一次文献进行整理加工,以使之 有序化而形成的文献。是报道和查找一次文献的 检索工具,如各种目录、索引、文摘和各种书目 型数据库。
13 13
描述信息外表 特征的语言
书/刊名 著者/团体著者 出版事项
代码/序号
❖ 检索语言
14
分类语言
描述信息内容 特征的语言
主题语言
标题词 元词 叙词 关键词
叙词(Descriptor)
❖ 是能表达文献主题并经过严格规范化处理的词语, 又称主题词。
❖ 特 点:具有概念性、描述性、组配性。 ❖ 如我国《汉语主题词表》(1980出版)、美国
❖ 特点:是对一次文献加工重组而成,不是新的信 息。
9 9
(二)信息源的类型及特点
❖ 三次文献
是根据二次文献提供的线索,选用大量一次文献 的内容,经过筛选、分析、综合和浓缩而再度出版 的文献。如综述、专题评述、年鉴、百科全书、参 考工具书等。
❖ 特点:在内容上具有综合性,在功效上具有参考性。
10 10
缺点: ① 关键词取自标题或者文摘、全文,用词不规范,忽
略了同义词、近义词、简称等等同关系,易漏检。 ② 关键词语言对于文献或者网页的主题没有深入分析,
不能准确地揭示文献实质内容,准确性较差。
17
检索途径
❖ 概念:检索途径是指用文献信息数据库中记 录的某一特征作为检索起点或检索入口
❖ 检索途径通常表现为字段检索
4 4
四、 文献(document)
是指记录有知识或信息的一切载体。具体地说, 用一定的方式(文字、图像、声音等)将信息符 号记录在一定载体(纸张、磁盘、光盘等)上的 知识都称之为文献。文献是知识的外在表现形式。 四个要素:信息内容
信息符号 记录方式 ④载体材料
5 5
一、信息源(Information Sources)
11 11
一、 信息检索的定义
❖ 狭义的信息检索是指从信息集合中找到所需信息 的过程;
❖ 广义的信息检索(Information Retrieval)是指将信 息按一定的方式组织和存储起来,并根据用户的 需要找到有关信息的过程和技术。
12 12
三、信息检索的类型
文献检索(Document retrieval) 事实检索(Fact retrieval) 数据检索(Data retrieval)
揭示文献外表特征
❖ 类型: 揭示文献内容特征
18
检索途径
❖ 一、 分类途径,检索标识是分类号或分类词。 ❖ 二、主题途径(主题词) ❖ 三、 关键词途径(关键词) ❖ 四、著者途径(作者名称) ❖ 五、题名途径(文献提名) ❖ 六、号码途径(号码索引) ❖ 七、其他途径(化学物质登记号检索、分子
式检索等。)
21
检索步骤图示:
分析课题,明确检索需求 选择合适的检索工具
选择检索途径,确定检索标识 构筑检索提问式,输入计算机
浏览检索结果
获取全文 调整、选出满意的结果
22
第六节 检索效果评价
❖ 检索要领是为实现检索结果的准确和全面: 所以检索结果主要通过查全率、查准率两个指
❖ 零次文献 是指未经出版发行或未进入社会交流的最
原始的文献。如:底稿、工程图纸、个人 通信、实验记录等。 ❖ 特点:内容新颖,但不成熟,不公开交流, 难以获得。
7 7
(二)信息源的类型及特点
❖ 一次文献
是指以作者本人取得的成果为依据而创作的论文、 报告等经公开发表或出版的各种文献。也称做原始 文献,如专著、学术论文、专利说明书、科技报告 等。
信息检索技术
❖ 一、布尔逻辑检索(not>and>or) ❖ 二、截词检索 ❖ 三、位置检索(常用的关系符号是(W)、(N)、
(F)、(S))
(四)限定字段检索
20
信息检索策略
❖ 1.分析检索课题,明确目的和要求 ❖ 2.选择合适的检索工具 ❖ 3.选择检索途径,确定检索标识 ❖ 4.编制检索表达式,调整检索策略 ❖ 5.浏览检索结果,获取原始文献。
具有广泛影响的定义
信息是事物存在方式、运动状态及其特 征的反映,是事物发出的信号、消息。
1 1信息的特征载体依来自性信无限共享性
息
的
永不枯竭性
特
征
开发增值性
应用时效性
存在普遍性
2
2
二、知识(knowledge)
❖ 《汉语词典》中解释为:人们在改造世界 的实践过程中所获得的认识和经验的总和。
❖ 知识 是人类对自然界、人类社会中各种现 象、规律的信息反映进行思维分析,加工 提炼,经过系统化、理论化的结果。
二、医学信息素养的内涵主要包括:
信息意识:是个体对信息重要性的认识程度和对 信息是否具有特殊的、敏锐的感受力和持久的注 意力,即对信息的捕捉、分析、判断和吸收的敏 感性。
信息知识:是指与信息有关的理论、知识和方法。
信息能力:是对信息的搜集获取能力、分析鉴别 能力和综合利用能力。
信息道德:是指在整个信息活动中,信息创建者、 信息服务提供者和信息使用者所必须要遵守的伦 理规范。
❖ 因此,知识是系统化、理论化的信息集合。
3 3
三、情报(information, intelligence )
❖ 《辞源》:“定敌情如何,而报于上官者”为情报。 ❖ 《辞海》:“战时关于敌情之报告,曰情报。
情报 是运用一定的媒 体(载体),越过空 间和时间传递给特定 用户,解决科研、生 产过程中的具体问题 所需要的特定知识和 信息。
《医学主题词表》等。
15
关键词语言
关键词(Key words)是直接从文献或网页的标 题、文摘或全文中抽选具有实质意义、能表达文 献实质内容,未经规范化处理的关键性自然语言 词汇。
16
关键词语言的特点
优点:
① 易于实现自动抽词和编制索引,尤其是计算机自动 编制索引。
② 表达主题直观,检索入口多,能及时反映新事物新 概念。
(一)定义
个人为满足其信息需要而获得信息的来源,称信 息源。(联合国教科文组织1976年《文献术语》)
信息源是“人们在科研活动、生产经营活动和 其它一切活动中所产生的成果和各种原始记录, 以及对这些成果和原始记录加工整理得到的成 品”。
6 6
(二)信息源的类型及特点
2.按信息源内容加工深度划分为:
❖ 特点:形态上多样,内容上原创,出处上分散。内
容新颖丰富,叙述具体详尽,参考价值大。
8 8
(二)信息源的类型及特点
❖ 二次文献
是按特定目的对一定范围或学科领域中大量分 散的,无组织的一次文献进行整理加工,以使之 有序化而形成的文献。是报道和查找一次文献的 检索工具,如各种目录、索引、文摘和各种书目 型数据库。
13 13
描述信息外表 特征的语言
书/刊名 著者/团体著者 出版事项
代码/序号
❖ 检索语言
14
分类语言
描述信息内容 特征的语言
主题语言
标题词 元词 叙词 关键词
叙词(Descriptor)
❖ 是能表达文献主题并经过严格规范化处理的词语, 又称主题词。
❖ 特 点:具有概念性、描述性、组配性。 ❖ 如我国《汉语主题词表》(1980出版)、美国
❖ 特点:是对一次文献加工重组而成,不是新的信 息。
9 9
(二)信息源的类型及特点
❖ 三次文献
是根据二次文献提供的线索,选用大量一次文献 的内容,经过筛选、分析、综合和浓缩而再度出版 的文献。如综述、专题评述、年鉴、百科全书、参 考工具书等。
❖ 特点:在内容上具有综合性,在功效上具有参考性。
10 10
缺点: ① 关键词取自标题或者文摘、全文,用词不规范,忽
略了同义词、近义词、简称等等同关系,易漏检。 ② 关键词语言对于文献或者网页的主题没有深入分析,
不能准确地揭示文献实质内容,准确性较差。
17
检索途径
❖ 概念:检索途径是指用文献信息数据库中记 录的某一特征作为检索起点或检索入口
❖ 检索途径通常表现为字段检索
4 4
四、 文献(document)
是指记录有知识或信息的一切载体。具体地说, 用一定的方式(文字、图像、声音等)将信息符 号记录在一定载体(纸张、磁盘、光盘等)上的 知识都称之为文献。文献是知识的外在表现形式。 四个要素:信息内容
信息符号 记录方式 ④载体材料
5 5
一、信息源(Information Sources)
11 11
一、 信息检索的定义
❖ 狭义的信息检索是指从信息集合中找到所需信息 的过程;
❖ 广义的信息检索(Information Retrieval)是指将信 息按一定的方式组织和存储起来,并根据用户的 需要找到有关信息的过程和技术。
12 12
三、信息检索的类型
文献检索(Document retrieval) 事实检索(Fact retrieval) 数据检索(Data retrieval)
揭示文献外表特征
❖ 类型: 揭示文献内容特征
18
检索途径
❖ 一、 分类途径,检索标识是分类号或分类词。 ❖ 二、主题途径(主题词) ❖ 三、 关键词途径(关键词) ❖ 四、著者途径(作者名称) ❖ 五、题名途径(文献提名) ❖ 六、号码途径(号码索引) ❖ 七、其他途径(化学物质登记号检索、分子
式检索等。)
21
检索步骤图示:
分析课题,明确检索需求 选择合适的检索工具
选择检索途径,确定检索标识 构筑检索提问式,输入计算机
浏览检索结果
获取全文 调整、选出满意的结果
22
第六节 检索效果评价
❖ 检索要领是为实现检索结果的准确和全面: 所以检索结果主要通过查全率、查准率两个指
❖ 零次文献 是指未经出版发行或未进入社会交流的最
原始的文献。如:底稿、工程图纸、个人 通信、实验记录等。 ❖ 特点:内容新颖,但不成熟,不公开交流, 难以获得。
7 7
(二)信息源的类型及特点
❖ 一次文献
是指以作者本人取得的成果为依据而创作的论文、 报告等经公开发表或出版的各种文献。也称做原始 文献,如专著、学术论文、专利说明书、科技报告 等。