第3.0章 知识检索基础

合集下载

文献信息检索基础知识

文献信息检索基础知识
索书号
1=Biblioteka 主题语言:用自然语言中的名词、词组、句子描述文 献主题概念的检索语言。 主题词:表达文献主题概念的词叫主题词 。当使用主题词来表达文献内容特征时叫主题标引(标识)。 主题语言的优点: 直观 符合人的辩识习惯 专指性强 主题词标识经过严格的规范化处 理,查准率高。 灵活 词与词的概念组配揭示文献中各种主题。 集中性 将不同学科的同一主题文献集中在一起。 例如有关“鲁迅”的文献资料,分类法将其 分散在文学、艺术、文化、历史各个门类 查找费时,而主题法在“鲁迅”标题下,直接 反映出全部有关“鲁迅”的文献资料。
3种逻辑关系的区别
逻辑算符
AND(与)
OR(或)
NOT(非)
检索式
A AND B A * B
F250 物资经济理论 F251 物资管理 F252 物资流通 F253 物资企业 经营与管理 F259 世界各国 物资经济
F251.1 物资管理 体制 F251.2 物资计划 F251.3 物资统计
分类号
类名
+
类目
F251.3 /1 或F251.3 “1”种次号
信息的基本属性
二、基本概念: 1、信息(information)的概念:信息是事物的存在的形式和运动状态的表征 。
知识性或客观性 记录和传播性
目录
CONTENTS
01
信息存储
Add a title
02
Add a title
一次文献:论文等 二次文献:目录、文摘、索引 三次文献:字词典、百科、年鉴
《汉表》 主表的著录格式(例2) Tian zhu ren 天竺人 Sindus; Sindhus “用”项 Y 古印度人 词族索引(例3) 族首词 法(法律) * 一级下位词 . 国际法 04LA 二级下位词 . .国际公法 三级下位词 . . .海洋法

文献检索基础知识

文献检索基础知识

计算机检索基础知一、计算机检索的概念计算机检索就是指人们在计算机检索网络或终端上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需要的信息,然后再由终端设备显示、下载和打印的过程。

广义的计算机信息检索包括两个过程。

(1)对原始信息加工处理并存贮在各种信息载体上一是对待加工的信息进行著录,即按一定的规则进行描述,如文献信息的名称、责任者、语种、提要等,以便用户识别信息。

二是对待加工的信息进行标引,利用主题词表、分类表等工具,标识出文献信息的内容特征,形成从内容角度查找文献信息的检索点。

(2)信息查询过程就是用户对检索需求加以分析,明确检索范围,弄清主题概念,然后用系统语言或自然语言表示主题概念,形成检索标识及检索策略,输入计算机进行查找。

这个过程实际上是计算机自动将用户的检索表达与数据库中信息标识进行比较匹配的过程二、计算机信息检索的分类1、按内容和功能划分参考型数据库以文档的形式组织起来,提供文献的题录、文摘等书目信息。

如:OCLC、CSA、EI♦全文型数据库存储文献全文或其中的主要部分的源数据库。

KLUWER、ACM、中国学术期刊网♦事实型数据库供查询某一客体的基本事实或简况,包括名录、传记等数据库♦数值型数据库提供各类数值型数据♦图象数据库以图形、图象为记录单位2.根据检索方式分:(1)脱机检索(2)联机检索(3)国际联机检索(4)网络检索3、国际联机检索该系统是70年代出现的一门现代化情报检索手段,目前已发展到相当高的水平,计算机联机网络和检索终端已遍及世界所有主要国家和地区。

特点:(1)可以实现资源共享;(2)检索速度快;(3)信息资源专业化;(4)查全率和查准率较高。

.OCLC:联机计算机图书馆中心,是世界上最大的为读者提供文献信息机构。

有60个数据库,提供会议录、工业通告、图书评论等信息。

DIALOG有900多个数据库,其中广泛使用的有600多个,内容涉及多个学科领域,文献存储量超过3亿篇。

检索基础知识

检索基础知识


主题词的表现形式

标题词:表述信息主题内容的规范化词(先组式 主题法) 元词:标引信息主题的词语是字面上不能再分的 基本词语(后组式主题法) 叙词:表述信息主题内容的规范化词(后组式主 题法) 关键词:表述信息主题内容的非规范化词(后组 式主题法)
三、检索系统
(一)文献检索系统定义 是指按某种方式、方法建立起来的供文 献信息用户查检文献信息及原始文献的一 种有层次的体系,是表征有序的信息特征 的集合体。(包括各种手工检索工具和各类 计算机检索系统)
元(如一篇文章,图书中的一部分,有时也可以是整本出版物)为基本著录单位。
示例1:
3. 文摘 ( abstract )——更有利于用户判断检索结果 的准确性。
文摘是指对一份文献(或称一个文献单元)的内容所做的简略、 准确的描述,文摘的著录项目除了著者,篇名及出处等外,还有表 示文献内容特征的摘要。
4. 索引 ( index )
检索工具的著录对象
目录:单位出版物 题录:单位出版物中的单篇文献 文摘:单位出版物中的单篇文献 索引:单位出版物或单篇文献中的知识单 元



手工信息检索工具的著录项目
目录: 注项 题录: 文摘: 索引: 出版物名称--编著者--出版项—附 题目/著者//出处 题目/著者//出处、文摘 知识单元---顺序号(或页码)

五、检索步骤
分析检索课题,明确检索要求 选择检索工具,确定检索途径 确定检索标识,确定检索运算 构筑检索提问,获取初步结果 调整检索策略,获取所需信息

六、检索效果的评价及其优化
检索效果评价的意义—— (1) 提高检索效率 (2) 改善系统性能
检索效果评价的指标

信息检索基础知识

信息检索基础知识
文献加工困难,阅读不方便。
例如:缩微平片、缩微胶片等。
声像型:
定义: 也称视听型,是指通过特定设备,使用光、声、
磁、电等技术将信息转换为声音、图像、影视和动 画等形式,给人以直观、形象感受的知识载体。 (一种非文字形式的文献) 优点:
信息存储密度高,形象直观、生动、逼真。 缺点:
成本高,不易检索和更新。 例如:录音带、唱片等。
专著(原始文献)
•ISBN号*
期刊
定义:
期刊一般是指名称固定、开本一致的定期或不定期 出版的汇集许多个著者论文的连续出版物。(期刊上刊 登的论文大多数是原始文献)
按内容分:学术性期刊、通讯性期刊、述评性期刊等。
例如:
按时间长短分:周刊、月刊、双月刊、季刊、年刊等。
ISSN号*
报纸
定义:
报纸是以刊载新闻和时事评论为主的定期向公众发 行的印刷出版物。是大众传播的重要载体,具有反映和 引导社会舆论的功能。
广义:信息、信息生产者、信息技术和设备。
二、信息资源(文献)的类型
(一)按文献的载体不同划分: 1、手写型 2、印刷型 3、缩微型 4、声像型 5、电子型 6、多媒体型 (二)按文献的出版形式不同划分: 1、图书 2、期刊 3、报纸 4、会议文献 5、学位论文 6、科技报告 7、专利文献 8、标准文献 9、产品样本 10、档案 11、政府出版物 (三)按文献的加工程度不同划分: 1、零次文献 2、一次文献 3、二次文献 4、三次文献
知识固化在纸张上的一类文献。 优点:
便于阅读、传递,便于大量印刷,成本低。 缺点:
信息存储密度低、分量重,体积大,收藏空间大, 保存期短,管理困难。
例如:图书、期刊、报纸以及各种印刷材料。
缩微型:

检索基础知识

检索基础知识

部分基础知识主要知识点第一节基本概念信息是无形的,它是客观事物的运动状态和特征的反映,是人们认识事物发展的基础。

事物是不断变化发展的,那么它的运动状态和特征也应随着不断变化而发展。

在人类已经进入信息社会的今天,信息被视为如同能源、空气和水一样重要。

信息资源被视为与自然资源同等重要的第二资源。

人们将一个国家信息化程度的高低作为衡量一个国家发展水平的标志。

一个国家科学技术发展水平、经济持续发展都与信息的开发和利用密切相关。

知识是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的过程。

也就是人的大脑通过思维重新组合的系统化的信息集合。

因此,系统化、理论化的信息就称为知识。

信息是知识的源泉、材料,知识是信息的理论和结果。

情报是人们在一定的时间内为一定的目的而传递有使用价值的知识或信息。

这种情报具有保密性、时效性、传递性的特点。

情报的种类有多种。

按服务对象不同,可分为军事情报、科技情报、战略情报、战术情报等;按传递媒介分为文字情报、实物情报、声像情报;按传递范围分为大众情报和专门情报。

三者的关系是:信息是知识的源泉;知识是系统化、理论化的信息;情报是活化的知识和信息,能为人们所利用,其涵义关系是信息>知识>情报。

第二节文献的基本概念一、文献的定义和属性凡属于人类的知识,用文字、图形、符号、声频、视频等手段记录保存下来,并用以交流传播的一切物质形态的载体,都统称为文献。

知识是文献的实质内容,载体是文献的外在形式,而记录是联系知识与载体的手段。

部分基础知识二、科技文献的类型(一)根据加工层次划分1.一次文献:即原始文献,是作者根据自己的工作和研究成果而写成的文章,也可称原始论文。

其特点是内容有创新性,含有前所未有的发明创造,或者一些新的见解与理论,是科学技术有所前进的标志。

一次文献是对知识的第一次加工,是信息的基础,也叫信息源。

一次文献包括:期刊论文、研究报告、会议录、专利说明书、学位论文等。

第3章 知识检索基础

第3章 知识检索基础

数据库与文档
数据库的定义:“至少由一种文档组成, 数据库 并能满足某一特定目的或某一特定数据 处理系统需要的一种数据集合。数据库 就是在计算机存储设备上按一定方式存 储的相互关联的数据集合,是信息检索 的基础。”
数据库≥ 数据库≥文档
检索语言
分类语言:
中国图书馆图书 分类法 国际十进制图书 分类法 国际专利分类法 等等 标题词 关键词 叙词 等等
NNNas
机械工程、电机 叙词 9667 工程、仪器仪表 非叙词 1533 各个学科 叙词 91158 非叙词 17410
物 理 学 、 电 工 叙词 4400 学、控制工程、 非叙词 3000 计算机 航空、宇宙飞行 叙词 14632 非叙词 3187
检索工具及其类型
概念: 2.按文献的收录范围 检索工具是用来存 划分: 储、报道和检索文 综合性、专业性和 献线索的工具。 单一性的检索工具。 类型: 1.按出版形式分:
第二篇 知识检索篇
第三章 第四章 第五章 第六章 知识检索基础 中国知识检索系统 国外知识检索系统 国际联机检索系统
信息资源检索示意图
知识检索概念 知识检索系统及工作原理 检索语言及检索工具 检索系统的功能 检索策略
知识检索的概念
知识检索是从文献 检索、信息检索发 展而来的一个概念, 通常定义为:“将信 息一定的方式组织 和存储起来,并根 据信息用户的需要 找出相关信息的过 程和技术”。
P61
主题语言:
代码语言 引文语言
中国图书馆图书分类法
A 马克思主义、列宁主 义、毛泽东思想 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、 体育 H 语言、文字 I 文学 J 艺术 N 自然科学总论 O 数理科学与化学 P 天文学、地球科学 Q 生物科学 R 医学、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学 Z 综合性图书

信息检索基础知识new

信息检索基础知识new

22
2)表达文献内容特征的检索语言 表达文献内容特征的检索语言主要是指所论述的主题、 观点、见解和结论等。描述文献内容特征的检索语言可 简要概述为: 体系分类语言:利用分类号进行检索。 关键词语言:利用表达文献主题的词语进行检索。 其他:利用文献中出现的分子式、结构式等进行检索。
23
检索工具
定义:就是人们用来报道存贮和查找文献线索工 具。 职能:有两方面的职能。一方面是把有关文献的 特点著录下来,形成一条文献线索,并将它们 按一定方法排列起来。(存贮过程) 另一方面是提供一定的检索过程和手段,按 照一定的检索方法查出所需的文献线索(检索 过程)
21
检索语言的种类
按照表达文献的特征划分: 1)表达文献外部特征的检索语言
表达文献外部特征的检索语言主要是指文献的篇名(题目)、作者 姓名、出版者、报告号、专利号等。 题名:利用文献或文章的名称进行检索; 著者:利用作者或团体作者的姓名进行检索; 文献编号:利用报告号、合同号、存取号等号码途径进行检索; 其他:利用人名、引用文献目录等途径进行检索。
索引 是揭示文献内容出处,提供文献查考线索的工
(9)政府出版物:它是政府各部门发表出版的文件和科 技文献。如政府公告、会议文件和记录、法令汇编等。内 容广泛,但重点领域为政治、经济、法律、军事。按其性 质可以分为行政性文献和科技性文献,具有正式性和权威 性的特点。
17
(10)专利文献:是根据专利法公开的有关发明的文献, 主要为专利说明书。 专利说明书是专利发明人记述发明的新颖性、创造性 和实用性,介绍其用途、方法、设备、以及权项等的文献。 特点:具有新颖性、创造性、实用性
14
(6)标准资料:是对工农业新产品和工程建设的质量、 规格、参数及检验方法所做的技术规定,是人们在设 计、生产和检验过程中共同遵守的依据。 特点:具有一定的法律约束力。

文献检索基础知识

文献检索基础知识

提出21世纪的能力素养包括的五个方面是: 基本学习技能(指读、写、算);信息素养;创 新思维能力;人际交往与合作精神;实践能 力。信息素养是其中的一个要素。(木桶的 容量决定于最短的一块木板 )
美国提出的大学生信息素养指标
①确定所需信息的范围; ②有效地获取所需的信息; ③鉴别信息及其来源;
《吉祥天女》告《千手观音》侵权案


因认为舞蹈《千手观音》侵犯了自己编导的舞蹈《吉祥天女》的著作权 ,北京军区战友文工团编导茅迪芳状告《千手观音》编导张继钢和中国 残疾人艺术团。 茅迪芳称,中国残疾人艺术团演出的、张继钢以编导身份署名的舞蹈《 千手观音》,与自己享有著作权的《吉祥天女》构成了实质性相似。 法院审理后认为,虽然刘露原为《吉祥天女》的领舞又是《千手观音》 的辅导、排练老师,但《吉祥天女》舞蹈是战友文工团全额投资、组织 创作的作品。作为编导,茅迪芳只享有编导的署名权。因此,茅迪芳作 为署名编导,有权主张自己的署名权,并不享有署名权之外的其他权利 。而且经过对比,《吉祥天女》与《千手观音》两个舞蹈的背景音乐、 舞美、灯光、演员服装等均不相同。两个舞蹈并不构成实质性相似,因
三者的关系:
信 息
知 识 文 献
(二)文献的构成要素
知识内容 符号系统 文献载体 记录方式
文献中记录信息和知识,这是文献的灵魂。
表达知识信息的手段,包括语言、文字、图画、 表格、公式、编码、音响、图象、声像等 。 信息内容存储的依附体,包括印刷型文献、音像 制品、机读资料等。 刻划、手写、机械印刷、拍摄和电脑录入、扫描
periodical
期刊的特点
A、期刊以品种为单位形成知识流; B、出版周期短,内容新颖、及时、广泛,专深; C、内容不全面系统,不成熟,论题窄; D、文献中数量最多,使用量最大。

检索基础知识

检索基础知识
并通过计算机、网络等读取的文献
印刷型信息
电子型信息
(二)、根据加工深度划分
一次文献:原始文献,
包括:期刊论文、会议论文、学位论文、研究报告、专利文献、标准文献等
二次文献:用于查找一次文献线索的工具。
包括:目录、题录、索引、文摘等
三次文献:对大量的一次文献进行阅读、分析、归纳、整理、概括而成, 提供某一学
❖ 逻辑算符 ❖ 位置算符 ❖ 截词符
逻辑运算符
查找包含由“and”连接的所有词的文献 如:输入Television AND Satellite,将检索出有 关“电视机和卫星”的文章。
科或专题的历史、现状、发展动态. 包括综述、述评、进展、动态、指南等。
(三)、根据出版形式划分
学位论文 科技报告
政府出版 物
图书
文献
特种文献
期刊 报纸
连续出版物
三大类型十大 信息源
会议文献 专利文献 标准文献 档案文献
特种文献
图书
联合国教科文组织对图书 的定义是:凡由出版社(商) 出版的不包括封面和封底在内 49页以上的印刷品,具有特定 的书名和著者名,编有国际标 准书号,有定价并取得版权保 护的出版物称为图书。
依检索结果内容 划分
信 息 检 索 类 型
依信息存储与 检索方式划分
文献信息检索 数据信息检索 事实信息检索
手工检索 计算机检索
文献线索检索 全文检索
四、 检索工具类型
文献检索工具
题录(Title) 索引(Index) 文摘(Abstract) 文献数据库(Database)
事实数值检索工具
词典 百科全书 手册 年鉴 图表 指南 名录 等
信息检索最大 的问题

《信息检索基础知识》课件

《信息检索基础知识》课件

03
信息检索系统
信息检索系统的构成
信息检索系统由信息源、信息组织与 检索方式、信息检索工具、用户界面
和信息利用等部分构成。
信息源是信息检索系统的物质基础, 包括各种类型的文献、网页、社交媒
体等。
信息组织与检索方式是信息检索系统 的核心,通过关键词、分类、主题等 方式对信息进行组织和检索。
信息检索工具是信息检索系统的手段 ,包括搜索引擎、数据库、图书馆等 。
05
信息检索的未来发展
信息检索技术的发展趋势
语义理解技术
随着自然语言处理技术的不断进步,信息检 索将更加注重对用户查询的语义理解,以提 高检索的准确性和相关性。
个性化检索
个性化检索技术将更加成熟,能够根据用户 的兴趣、偏好和行为习惯,为用户提供更加 精准和个性化的检索结果。
多模态检索
多模态检索技术将实现文本、图像、音频和 视频等多种媒体信息的融合检索,满足用户 对多媒体信息检索的需求。
自然语言处理
自然语言处理是信息检索中不可或缺的技术之一,它利用计算机对自然语言文本进行分析和处理,以 实现自然语言文本的自动识别和机器理解。
自然语言处理技术包括分词、词性标注、句法分析、语义分析等,这些技术能够将自然语言文本转换为 计算机可识别的格式,以便进行后续的信息检索和文本挖掘。
自然语言处理技术的应用范围广泛,例如在搜索引擎中实现自动纠错、自动完成、智能推荐等功能,以 及在智能客服中实现自动问答、智能回复等功能。
源。
网络信息检索阶段
随着计算机技术的发展,人们开始利用计算 机进行信息检索,出现了各种基于计算机技 术的检索工具和数据库。
智能信息检索阶段
随着人工智能技术的发展,智能信息检索逐 渐成为新的发展趋势,它能够更加智能地理 解用户需求,提供更加精准的信息服务。

信息检索基本知识

信息检索基本知识
• 与叙词一样是以较正规和正式的科学名称为基 础的一种主题法检索标识,但存在主、副标题 词固定搭配,即属于先组式检索语言。 •如:
叙词
•叙词是主题语言的高级形式。是以较正规和正式的 科学名称为基础组织而成一种主题法检索标识系统。 •由在概念上不可再分的基本概念单元词汇组成,检 索时可以利用这些单元词进行组配,以表达一个复杂 的概念。
•如课题: 太阳能热水器研究 汉语主题词表中正式主题词是太阳能利用、太阳 能加热等代替。
标题词
中国图书馆图书分类法
• 简称《中图法》,由中国图书馆图书分类法编辑委 员会编。1975年科学技术文献出版社出版第一版。 • 使用字母与数字相结合的混合号码,基本采用层累 制编号法。 • 《中图法》主要供大型图书馆图书分类使用。另外 为适应不同图书信息机构及不同类型文献分类的需 要,它还有几个配套版本:《中国图书资料分类 法》、《中国图书馆图书分类法(简本)》和 《〈中国图书馆图书分类法〉期刊分类表》等。 • 自1988年起,中国出版图书的标准书号中采用《中 图法》的大类号。
关规定和格式撰写的,能完整而真实地反映其所从事科 研活动的技术内容和经验的特种文献。具有内容翔实、 具体完整,技术含量高,实用意义大,便于交流,时效 性好等特点。做好科技报告工作可以提高科研起点,大 量减少科研工作的重复劳动,节省科研投入,加速科学 技术转化为生产力。
•会议文献:指学术会议文献。
•学位论文:是高校研究生、毕业生为获得学位进行 科学研究而写出的学术性论文中,常含有独创性的学 术性文献资料。 •专利文献:专利是与产业活动密切相关的,实用性 非常强。根据专利的技术水平和应用情况,其类型有 invention(发明)、utility patent(实用新型)、和 design patent(外观设计)等。

检索基础知识55P

检索基础知识55P

• • • • •
中国图书馆图书分类法 中国科学院图书馆图书分类法 中国人民大学图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法
《中国图书馆分类法》
K
历史、地理
K81 K811
K82 K825
传记 世界人物传记
中国人物传记 人物传记:按学科分 哲学、社会科学 自然科学、工程技术 各国人物传记
目录类型:
馆藏目录:反映一个图书馆文献收藏情况的目录。 联合目录:反映一个地区或一个系统甚至全国或世界范围的图书馆、信息服务
机构文献收藏情况的一种统一目录。
按出版类型划分:图书目录、期刊目录、会议论文目录。 按物质形式划分:卡片目录、书本目录、机读目录(MARC)、联机公共检索目录 (OPAC ,Online Public Access Catalog ) 等。
• 西汉末年刘向、刘歆父子校书秘阁,编撰了我国第一部综合 性目录——《七略》。《七略》实际上是把当时的图书分为6类, 这就是所谓的“六分法”。类之下再分种,一共38种: (1)“六艺略”分易、书、诗、礼、乐、春秋、论语、孝经、 小学9种。 (2)“诸子略”分儒、道、阴阳、法、名、墨、纵横、杂、农、 小说10种。 (3)“诗赋略”分屈原赋之属、陆贾赋之属、孙卿赋之属、杂 赋、歌诗5种。 (4)“兵书略”分兵权谋、兵形势、(兵)阴阳、兵技巧4种。 (5)“术数略”分天文、历谱、五行、蓍龟、杂占、形法6种。 (6)“方技略”分医经、经方、房中、神仙4种。
(1)常用法: 顺查法——以检索课题的起始年代为起点,按时间顺序 由远及近地查找,直至查到的文献满足要求为止。 倒查法——是一种逆时间由近及远地查找文献的方法。 抽查法——是针对研究课题发展特点,抓住学科发展迅 速发表文献较多的一段时间,逐年进行查找文献的一 种方法。 (2)追溯法 又叫回溯法,是利用已有的文献后面的参考文 献由近及远进行追溯查找的方法。 (3)综合法 又称循环法、分段法或者交替法。是常用法和 追溯法的综合运用。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

机械工程、电机 叙词 9667 工程、仪器仪表 非叙词 1533 各个学科 叙词 91158 非叙词 17410
物 理 学 、 电 工 叙词 4400 学、控制工程、 非叙词 3000 计算机 航空、宇宙飞行 叙词 14632 非叙词 3187
检索工具及其类型
概念: 2.按文献的收录范围 检索工具是用来存 划分: 储、报道和检索文 综合性、专业性和 献线索的工具。 单一性的检索工具。 类型: 1.按出版形式分:
检索语言的新发展
P62
国内外主要叙词表选介
名称 编者 出版时间 专业范围 电子 词量 叙词 7500 非叙词 1000 电子技术汉 电 子 部 一 1977 语主题词表 所 机械工程主 机 械 部 情 1979 题词表 报所 汉语主题词 中 国 科 技 1980 表 信息所北 京图书馆 美 国 电 气 1973 INSPEC Thesaurus 工 程 师 协 会 NASA 美 国 国 家 1967 Theasaurus 航 空 航 天 局
期刊式的、单卷式的 和附录式的检索工具
3.按著录格式划分:
目录、题录、文摘 、索引、 文献指南及工具书目录
网络信息检索工具—搜索引擎
1.全文搜索引擎
全文搜索引擎是名副其实的搜索引擎
2.目录索引
是按目录分类的网站链接列表
3.元搜索引擎
检索系统的功能
1. 布尔检索
逻辑“与”—— AND 或 * 逻辑“或”—— OR 或 + 逻辑“非”—— NOT 或 -

P61
主题语言:
标题词 关键词 叙词 等等

代码语言 引文语言
中国图书馆图书分类法





A 马克思主义、列宁主 义、毛泽东思想 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、 体育 H 语言、文字 I 文学 J 艺术

检索的类型
(5)图像检索: (6)多媒体检索:
2. 按检索设备划分
(1)手工检索:利用书本式的检索工具,如目 录、题录、索引、文摘等进行检索。
(2)计算机检索:利用磁盘、磁带、光盘通
过单机进行检索;通过国际联机,检索远程大 型主机的数据库资源;通过信息高速公路网络 获取和享用电子信息服务。
知识检索系统
数据库与文档
数据库的定义:“至少由一种文档组成, 并能满足某一特定目的或某一特定数据 处理系统需要的一种数据集合。数据库 就是在计算机存储设备上按一定方式存 储的相互关联的数据集合,是信息检索 的基础。”
数据库≥文档
检索语言Βιβλιοθήκη 类语言:中国图书馆图书 分类法 国际十进制图书 分类法 国际专利分类法 等等
P58
知识检索系统是一种智能化的计算机 信息检索系统,它模拟人类关于信息 处理的思维过程和智能活动,实现信 息知识的存储、检索和推理,并向用户 提供智能辅助,知识检索正逐渐成为现 代信息检索新的潮流,知识检索将最 终实现信息服务向知识服务的转化。
知识检索系统的工作原理
存 储 过 程
知 识 处 理 人 员
“See” 指引正式标题词 “ See also” 指引相关标题词 “标题范围注释”
关键词语言
未经规范化处理,不受词表的控制,不
适合于手工检索,适合于计算机自动标 引,适合于计算机检索。
叙词语言
叙词经过规范化处理,受词表的控制,
用以表达文献主题的概念单元,可进行 概念组配。 即适合于手检,也适合于机检,是计算 机检索系统必须使用的语言。
P56
知识检索的优势

P56
知识检索是一种智能化检索; 检索系统全面,信息量大,检索功能强; 不仅可获取二次文献,还能获取一次文献; 可以得到准确度和相关度更高的结果,全面提 高检索效率; 检索界面友好,服务功能更强。 ……
检索的类型
1.按检索内容划分
(1)数据检索 :直接检出如科学技术数据、金融数 据、计算公式等数据。 (2)事实检索: 查找特定的事实。能够回答用户的 实际提问要求。 (3)书目检索:以文献线索为检索内容的检索。 (二次文献检索) (4)全文检索:检索系统存储的是文献的原文。 (一次文献检索)如期刊论文、图书 、法律条文等。通过计算机可检索到 全文。






N 自然科学总论 O 数理科学与化学 P 天文学、地球科学 Q 生物科学 R 医学、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学 Z 综合性图书
标题词语言
名词或词组,经过规范化处理,受词表
的控制,适合于手工检索。 可以是单级标题词,也可由主标题词和 副标题词构成。 参照系统:
第二篇 知识检索篇
第三章
知识检索基础 第四章 中国知识检索系统 第五章 国外知识检索系统 第六章 国际联机检索系统
信息资源检索示意图
知识检索概念 知识检索系统及工作原理 检索语言及检索工具 检索系统的功能 检索策略
知识检索的概念
知识检索是从文献 检索、信息检索发 展而来的一个概念, 通常定义为:“将信 息按一定的方式组 织和存储起来,并 根据信息用户的需 要找出相关信息的 过程和技术”。
信 息 源
知识的组织
领域知识库 用户知识库
检 索 用 过 程 户
检 索 课 题
检索提问
专家经验 知识库
检 索 结 果
检索的原理

将课题的检索标识与存储在检索工具 (书)或文档(计算机数据库)中的文 献标识相比较,匹配,如果一致,则检 索命中。 计算机将具有相同标识的文献信息从 检索系统中输出,输出部分就是命中的 检索结果。
P63
检索方式: 1.基本检索 2.高级检索
2. 截词检索 3. 邻近检索 4. 字段限制检索 5. 其他检索功能
文献检索的一般步骤

P67
分析课题(确定主题概念,确定检索范围) 选择数据库(检索工具书、参考工具书) 确定检索词 构造检索式 (计算机对检索式的运算顺序: 括号内的算符 位置算符 NOT AND OR) 上机检索 整理检索结果
相关文档
最新文档