第二章 信息检索基础2013

合集下载

第二章 文献信息检索基本知识(2).概要

第二章 文献信息检索基本知识(2).概要
(大学生or本科生or研究生)-(大专生or高职生) and 就业
(2)截词检索表达式
用截词符号“*”、“?”或“$”加在检索词 的前后或中间,以检索一组概念相关或同一词根 的词。 按截断的位置可分为:
前截断、中间截断、后截断 按截断的字符数量可分为: 有限截断(?)、无限截断(*)
如:输入检索式“Comput*”,将检出包含 Computer、Computing、Computed、 Computerization 等词汇的结果。
第二章 信息检索基础知识
2.3 文献信息检索的工具
1、文献信息检索工具概述 检索工具是将大量分散无序的文献资料经过加 工整理,按照一定的规则和方法编制起来,用来 报道、存储和查找文献的工具,是附有检索标识
的某一范围文献条目的集合。
传统的检索工具是人们利用手工方法编制的
工具书,有字典、词典、目录、百科全书、名录、 类书、政书、表谱、图录等。这些工具书是人们
题录示例
(3)索引(引得) 索引是将书刊内容中所论及的篇名、语词、主 题等项目,按照一定的排检方法加以编制,注明出 处,供读者查检使用的检索工具。 索引与目录的根本区别就在于著录的对象不同, 目录所著录的是一个完整的出版单位,索引所著录 的则是完整的出版物的某一部分、某一观点、某一 知识单元,提高文献检索的深度和检索效率。
完全一致(精确匹配)、任意一致(模糊匹配)
等。
讨论1: 我馆书目查询系统共有多少种检索方式?其基 本检索有多少个检索字段?
讨论2: “中国学术期刊网络出版总库”有哪些检索方式?

? ? 中国科技期刊数据库初级检索界面
2、 信息检索方法
(1)常用法 ①顺查法 ②倒查法 ③抽查法 (2)回溯法 (3)循环法

第二章 文献信息检索基础

第二章 文献信息检索基础

理的名词术语,具有单一性、组配性好的特 点。
(2)分类语言:直接体现知识分类的等
级制概念标识系统;如中图分类号、杜威 十进制分类法等。
《中国图书馆图书分类法》即《中图法》
《中国图书馆图书分类法》
体现学科的系统性,反映事物的从属、 派生关系,并从上至下、从总体到局部 层层划分,展开,是一种等级分明的语 言。分为五大部类,22个大类,分别用 22个大写字母表示(其中除掉L、M、W、 Y)。
1.前方一致

也叫后截断,将截词符置于一个字符串的后面,以表示其后的有限或无 限个字符的检索。
无限截词
如: ? Physic? 可检出physic、physical、physican、physicalism
有限截词
截断两个字符
中间有 空格
如:? physic?? 可检出physic、physical、physican 截断一个字符 如:? cat? ? 可检出cat、cats
2.3 综合法
综合法又称为循环法,它是把上述两种方法
加以综合运用的方法。综合法既要利用检索 工具进行常规检索,又要利用文献后所附参 考文献进行追溯检索,分期分段地交替使用 这两种方法。即先利用检索工具(系统)检 到一批文献,再以这些文献末尾的参考目录 为线索进行查找,如此循环进行,直到满足 要求时为止。 综合法兼有常用法和追溯法的优点,可以查 得较为全面而准确的文献,是实际中采用较 多的方法。
能包含特征B。可以缩小检索范围,有利于提高查 准率。 A – B(逻辑非)
例:自由分配方面的文献(排除海南大学师生的著作) 提问式::(关键词=‘自由分配’) not (单位=‘海南大学')
三、位置算符
也叫邻近检索, 在检索词之间使用, 规定算符两边的检索词出现在记录中

第二章 信息检索理论基础

第二章 信息检索理论基础


按照报道内容的深度划分:
国外检索刊物文摘型的多于题录型的。文摘 型的检索刊物,具有报道内容详细、检索途径多、 使用方便等特点,如《化学文摘》、《科学文摘》 等。而题录型检索刊物以出版快、索引多采用关 键词索引、使用方便等特点,如《科学引文索引》 等。
按照报道内容的专业划分:
国外检索刊物专业性的多于综合性的。专业 性的检索刊物除常用的《化学文摘》、《医学文 摘》等以外,多数刊物因为报道范围的限制,文 献量少而较少被国内使用。综合性的检索刊物, 因为历史悠久、报道内容质量高、检索途径多、 使用更为普遍。
三、数据库的建设
我国数据库建设取得了很大成绩,尤其是 20世纪90年代中后期,我国各类文献数据库、 事实型和数值型数据库的比例不断增大,图像 数据库日益受到重视,全文数据库、多媒体数 据库有了很大的发展。数据库内容也由科技领 域为主向经济和社会领域转变。数据库的容量 明显扩大。数据库的分布由以国务院各部门为 主向全社会扩展。在实际应用方面呈现如下特 点: 一是我国数据库的应用领域不断扩大; 二是国产数据库逐渐进入国际市场。
原理
信息存储基本原理
书本式文献的传统存储方法是图书馆纸质文献 管理法和印刷型检索工具的编制,包括图书、期刊、 专利、科技报告、政府出版物、技术标准、会议论 文、学位论文、产品样本、档案十大信息源的分类 存储,由这套系统决定的手工检索体系使文献分类 等描述文献内容的特征处于核心地位,文献篇名、 作者名等描述文献外表特征则是天然的补充要素, 加上主题,构成手检时按分类、主题、号码、作者 名检索的四大途径。 机读信息则以数据库(Database)形式存储。信 息被分类、编码、标识且以数据形式存入数据库后, 计算机就能按电子数据方式进行处理并检索。

第二章 文献信息检索基础知识

第二章 文献信息检索基础知识
载体是感光材料,如缩微平片、缩微胶卷。 另外,还有一种计算机输出缩微胶片。
这类文献特点是体积小、信息密度高、 轻便,易于传递,保存容易。但使用时必须 借助于放大设备。

电子型文献(Electronic Document)
原称机读型文献。是指以数字化技术将文献
存储在光、磁载体上,通过计算机或网络进行阅

2、学术期刊 (Periodicals,Journal,Magazine):
指有固定名称和统一的出版形式,按一定规律定
期或不定期连续出版的文献载体,与报纸属于称
连续性出版物。
(1)期刊的特征:
统一的刊名,有连续的年、卷、期及页码;
有国际标准连续出版物刊号ISSN (International Series Standard Number) ISSN由8位数字分两段组成,如1000-0135,前7 位是期刊代号,末位是校验号。
(3)期刊著录格式:
作者(多作者用逗号分开,超过3个者用“等或 et al”). 文章题目[J].刊物名称,年代,卷数(期 数):页数 如: Porter MF, Zhang J. An algorithm for suffix stripping. Program, 1980, 14(3):130~137
P:专利文献类别代码
(2)专利文献著录格式
专利申请者.
专利题名:专利国别(或地区), 专利号[P].出版日期. TACHIBANA R, SHIMIZU S, KOBAYSHI S, et al. Electronic watermaking method and system: US, 6,915,001[P]. 2002-04-25.
(1)图书的特征
图书没有统一的开本

文献检索(第二章 )

文献检索(第二章 )

特种文献
(1)图书
国际上通常把48页以上,不定期出版的印刷品称 为图书。我国国家标准对图书的定义是:“以印刷方 式单本刊行的出版物”。 特点: 内容比较系统、全面、成熟、可靠,有一定的 新颖性,但编辑出版时间过长,传递信息的速 度太慢,时间上难以满足获取最新科技信息的 要求。 图书一般分为两类: 阅读型:教科书、专著等 工具型: 字典、百科全书、年鉴、手册
(9)技术档案
指生产建设、科技部门和企事业单位针对具体的工 程或项目形成的技术文件、设计图纸、图表、照片等 各种原始记录原件及复制件。包括任务书、协议书、 技术指标、审批文件、研究计划、研究方案、试验记 录等。 技术档案是生产领域、科学实践中用以积累经验、 吸取教训和提高质量的重要文献。 技术档案具有保密和内部使用的特点,一般不易获 取,但它是一种重要的信息来源。
(6)标准文献
是为产品质量标准化、产品规格化和系列化、零 部件通用化而制订的技术规定、规范和准则。一个国 家的标准反映着这个国家的经济政策、技术水平、加 工工艺及标准化水平,它是一种重要的技术信息来源。 技术标准的制订工作一般是由主管部门完成的。 标准的新陈代谢十分频繁,随着技术水平的不断提 高,标准也需不断补充、修改,国际经济贸易的发展 又促使标准日趋国际化,因而标准文献体现了本技术 领域的发展水平,科技人员可以从中获取大量有价值 的信息。 标准文献的特点是:具有独立完整性和法律约束性。
(4)会议文献
是指在各种学术会议上发表的论文、报 告、讲演等文献,经编辑整理后的正式出版 物。 学术会议历来是人们交流研究成果的重要 场所。目前全世界每年大约要召开数千个学 术会议。会议种类繁多,有大会、会议、学 术讨论会、研讨会、讲习会、座谈会等。由 此产生了大量的会议文献。 会议文献是传播科技信息的重要渠道,许 多新的发现或发明往往最先披露于会议或会 议文献中。一些定期举行的学术讨论会往往 成为对前一时期研究成果的一次大检阅。某 些会议文献常常不在公开出版物上发表。 特点:学术性很强,代表了某一学科或专业领域的最新研究成果及 国内外的水平发展趋势

第二章 信息检索原理

第二章 信息检索原理
22
2013-11-4
2、主题语言 主题语言是直接以代表信息内容特征和科 学概念的概念词作为检索标识,并按字顺 组织起来的一种检索语言。 分为:规范主题语言和非规范主题语言
2013-11-4
23
1)、规范主题语言 • 以自然语言为基础,经过标准化、规范化处理 的词语,具有概念性、规范性、组配性、语义 性和动态性。
信息源 用户
信息分析、 著录、标引
检索语言 数据库
用户需求分析
信息的表示
存储
检索
检索提问式
匹配过程
输出检索结果
2013-11-4 4

信息检索的实质是一个匹配(match)的过程:
也就是信息用户的需求和信息集合的比较与选择,用户 根据检索需求,对一定的信息集合采用一定的技术手段, 根据一定的线索与准则找出相关的信息。
2013-11-4 27
第三节 检索途径
• 一、信息检索方法
• 二、信息检索途径
2013-11-4
28
1.信息检索的方法
顺查法:从过去某一时间起往现在检索
倒查法:从现在往过去逐年逐月地检索 用户注重新信息,如:写论文
常规法:
信 息 检 索 的 方 法
抽查法就是抽查某一时段的信息.在事 物发展的关键、鼎盛时期,用户注意的 是某些重要的、关键性信息资源
计算机检索简称“机检”,是利用计算机和一定的通信 设备查找所需信息的检索方式.
特点:速度快、效率高、查全较高,成本高,费用大,
查准率通常不尽人意, 现代信息检索即计算机信息检索,是指利用计算机和网 络来处理和查找文献信息的检索方式。目前广泛使用的 计算机检索系统包括光盘系统、联机检索系统和网络检 索系统。
2013-11-4 9

第二章信息检索基础知识

第二章信息检索基础知识

字段检索
限定提问关键词在数据库记录中出现的区域, 以控制检索结果的相关性。搜索引擎 中常用字段有: Title(或t); URL(或u); Link; Host(主机); Text。
自然语言检索 Please find for me something about automobile sale in New York State. 系统会检索出“New York State”和 “ automobile sale” 方面的信息。 概念检索 检索: “automobile”能同时检索出包含: “automobile”、“car”、“truck”、“bus”I21 I211 I212 I213 I22 I221 I222 I223 I23 I231 ……. I3 I31 I311 …… I4 ……
文学作品
中国文学作品
中国诗歌作品 中国古代诗歌 中国近代诗歌 中国现代诗歌 中国戏剧作品 中国古代戏剧 中国近代戏剧 中国现代戏剧 中国小说作品 中国古代小说 ………
按网络信息传播范围分:光盘信息源、联机 检索信息源、Internet信息源 按网络信息加工层次分:网络资源指南、搜 索引擎
2.2 信息检索语言及信息检索技术
2.2.1 . 信息检索语言:把信息的存储和检索联 系起来,把标引人员与检索人员联系起来以便取 得共同理解的语言,称为检索语言。类型: 按描述文献信息的特征划分:描述文献信息外表特
(2)图书馆的电子信息服务
图书馆提供的上网服务 图书馆的检索服务 图书馆提供的电子信息服务 图书馆提供的电子信息服务 图书馆提供的书籍全文在线阅读 图书馆举办的用户培训
(3)图书馆的信息资源借阅与查找
图书借阅 古籍善本书、线装书的阅览 期刊查阅 个人发表论文的查找 快速借阅所需图书 图书馆的图书逾期罚款制度 借阅查询 代书牌的使用

信息检索基础.ppt

信息检索基础.ppt
查全率 80% 查准率 88.9%
27
2.3 信息检索类型
1.文献检索
以索引、文摘或其他文献特征为主要检索对象 ,目的是运用检索系统查检出与某课题相关文献 检索,从而获取原始文献。
2.数据检索
以数据为检索对象,可直接选择专门的数据性 工具进行查检,从而得到数值性数据、图表、化 学结构式、计算公式等。
冠状动脉疾病 冠状动脉心脏病
主题词 冠状动脉疾病
治疗
文献
20
4. 著者检索
用文献的著者、编者、译者的姓名或机构团体名 称编制而成的索引。
按著者姓名字顺编排 书写格式 姓前(全称)、名后(缩写,即用首字
母)
如:Willian Henry Harrison →Harrison W H
Ren Shu Min → Ren SM
计算机检索系统
3
二、信息检索的原理
是将描述特定用户所需信息的提问特征,与 信息存储的检索标识进行异同的比较,从中找 出与提问特征一致或基本一致的信息。
本质是用户的信息需求与存储 在信息集合中的信息进行比较和 选择, 即匹配的过程。
4
主题
信息 文献的 分析 存贮 信息内容
主题
信息 检索者的 分析 检索 信息需要
18
3. 主题途径
主题词:是以自然语言为基础,以概念组配为 基本原理,并经过规范化处理,表达主题的最 小概念单元,作为信息存储和检索依据的一种 检索语言。
特 点: 词义、词类、词形规范保证词语与概念的唯一
对应关系,具有专指性。
19
检索举例:冠心病的治疗
自由词
冠心病
冠状动脉粥样硬化性心脏病 治疗
1. 直接浏览法
直接浏览法也称直接查找法,指检索者不依靠任何检 索工具或检索系统,从本专业最新核心期刊或其他文献中 直接阅读原文或浏览最新目次而获取文献的方法。这是一 种最常见的信息资源的获取方式。因为编制检索工具需要 时间,有的半年,甚至长达一年之久,直接浏览可以及时 获得最新文献。但利用这种方法查找的信息不全面、不系 统、且局限性较大,不能作为查找文献的主要方法。

信息检索教程(第二章)

信息检索教程(第二章)

4
(b)按收录文献出版形式分
●图书目录 ●期刊目录 ●会议论文目录 ●标准目录等。
(c)按物质形式划分
●卡片目录 ●书本目录 ●机读目录 ●联机公共检索目录等。
5
(2)图书馆目录、OPAC和联合目录概述
①图书馆目录
定义:它主要提供馆藏资源的检索,又叫馆藏目录,它反映
了一个图书馆的文献收藏情况,是一种重要的检索工具。
26
常用法示例
27
追溯法示例
28
2.3.2检索途径
29
30
1.分类途径
图书期刊分类法
世界三大图书分类法
《杜威十进分类法》(DDC)(Dewey decimal Classification ) 《国际十进分类法》(UDC)(Universal Decimal Classification) 《国会图书馆图书分类法》(LCC)(Library congress classification)
定义:所谓文献检索的方法,即查找文献的方法。有以下三种: 常用法:直接利用文献检索工具或检索系统来查找文献的方法,是 一种常规的科学检索方法。又称工具法或直接法。分为顺查法 、倒查法和抽查法。 追溯法:是一种跟踪查找法。它不利用检索工具只是利用文献(尤其 是评述性论文或专著) 后面所附的参考文献进行逐一地追踪查 找原文。又称引文法。 综合法:是常用法和追溯法的综合。利用检索工具或检索系统进行 常规检索,再利用文献后所附参考文献进行追溯检索,分期分 段交替使用这两种方法,直到满足要求为止。可以查得较全面 较准确,尤其适用于那些过去年代内文献较少的课题。称循环 法、分段法或交替法。
22
2.2.2检索工具的鉴别与评价
1.信息收录范围与信息质量

第二章 信息检索基础知识

第二章 信息检索基础知识

全文检索
图像检索 超文本检索
文献检索
使用以二次文献为存储对象的信息系统,如目录
型、题录型、文摘型数据库,是一种相关性检索。特 点:检索结果不直接解答课题用户提出的技术问题, 只提供与之相关的线索。 例如:查找有关“食品安全与人类健康 ”方面的
国内外信息有哪些?
数据检索
以数值信息为检索对象,通过检索,用户可以获 得所需要的确切数据,是一种确定性检索。它一般以
的方式记录在相应的信息载体上,组织成系统
化的检索系统。
1. 数据库及其构成
数据库(database):至少由一种文档组
成,并能满足某一特定目的或某一特定数据处
理系统需要的一种数据集合。 通俗地说,数据
库就是在计算机存储设备上,按一定方式存储的 相互关联的数据集合,是信息检索的基础。
1. 数据库及其构成
一、信息检索的效果评价指标 二、影响检索效率的主要因素
一、信息检索的效果评价指标
以一个检索提问去检索任何一个数据库都会出现 4 个相关量:检出的相关信息量、未被检出的相关信 息量、检出的非相关信息量、未检出的非相关信息量。
一、信息检索的效果评价指标
1. 查全率 a 查全率(R )= —— ×100% a+c 查全率是对所需信息被检出程度的信息量指标。 2. 查准率 a 查准率(P )= ——×100% a+b 查准率是衡量拒绝非相关信息的指标。
中国图书馆分类法的体系结构:
S农业科学类目简表
(2)按事物的性质分类
按事物的性质分类 --- 热门主题 : 各种搜索引擎和网站 按事物的性质分类 --- 功能(使用方向)主题: 国际专
利分类法(IPC)
2.主题描述及信息检索语言

新第二章 信息检索基础知识

新第二章 信息检索基础知识

2.2 信息检索语言
三、主题语言
4.关键词语言
是指从文献标题、文摘、正文中抽离出来的,对表征文献主题 内容具有实质意义的语词,以关键词作为信息标识和检索依据的主 题语言。关键词没有固定的词表,因为对于同一个事物的概念,不 同作者甚至是同一个作者在不同的著作中用词都会不同,它是没有 经过规范化的自然语言词汇。 在检索中文医学文献中使用频率较高的《CMCC》数据库就是 采用关键词索引方法建立的。
2.5 计算机检索技术 四、词组检索
将固定词组或短语 看成单个词进行处理。
常用“ ”作为词组检索的运算符。
2.5 计算机检索技术 五、字段检索
对指定的一个或多个字段进行检索,从而提高查准率或查全率。
标题、作者、摘要、关键词、作者单位、文献来源、学位授予单位、 学位级别、会议信息、会址、会期、书名、出版地、出版年、专利号、报 告号、ISBN、ISSN等。
2.2 信息检索语言
一、信息检索语言的定义、作用和种类
4.分类:
篇名(题目) 著者名称 描述文献外表特征 文献序号 引用文献 等级体系分类语言 分类语言 组配分类语言 主题语言
检索语言
描述文献内容特征
代码语言
标题词语言 关键词语言 单元词语言 叙词语言 分子式索引 结构式索引 专利号索引等
2.2 信息检索语言
2.4 信息检索标识 一、检索标识的定义
检索标识即检索词,是指能表达检索课题主题概念和信息需 求的名词术语、分类号、名称、代码等的总称,包括主题词、 关键词、名称、分类号、分子式、专利号及各种号码。
2.4 信息检索标识 二、信息检索标识的类型
1.描述信息内容特征的检索标识: 分类、主题、代码(符号)。
2.5 计算机检索技术 一、布尔逻辑检索

第二章信息检索基础1

第二章信息检索基础1

化学物质登记号(CAS registry number)检索
分子式(formula)检索 记录顺序号(accession number)检索 化合物结构图检索(structure search)检索 ……
不同检索途径常用字段名称
题名途径:题名、标题、篇名、题目、title 分类检索途径:分类号,中图分类号 主题途径:主题词、MeSH、MeSH terms、 Thesaurus、map term to subject headings 关键词途径:关键词、keywords、text words 著者途径:(第一)作者、著者、责任者、 author、first author
研、生产中的具体问题所需要的特定知识或信息。(微波炉
发明) (四)文献(Literature) 文献是记录有知识的一切载体,是知识的外在形式。
情报的基本属性
知识或信息 经过传递
经用户使用产生效益 情报的 基本属性
信息与知识、情报、文献的关系
知识源于信息,是信息的一部分 情报源于知识或信息,是激活了的知识或信息 文献是信息、知识、情报的主要载体形式
形成系统,便于检索的文献。
如:题录、书目、索引和文摘。
特征1 特征2 特征3 特征4 特征5
提取特 征
特征n
二次文献
二次文献
二次文献
2013-8-10
40
三次文献
三次文献是利用二次文献并在其指引下,对大 量的一次文献进行综合分析研究,加以浓缩和提 炼而成的文献。 包括综述、述评、进展、预测等,各类词典、 手册、年鉴、百科全书、指南等参考工具书也属 于三次文献的范畴。
一次文献、二次文献、三次文献
一次文献:
又称原始文献,是首次公开发表的文献,直 接记录了科研成果,报道了新发明、新技术、新 知识和新观点。 一次文献主要包括专著、期刊论文、科技报 告、会议文献、学位论文、专利文献等。

第二章信息检索基础知识

第二章信息检索基础知识

属后组式语言。
主题词
概念:通过文献所属学科的主题对文献进行检索, 是以主题词为检索标识,它是一种特性检索。 主题词是用来表达文献的主题概念的,经过规范化 主题词 处理的名词或词组。 如:出生缺陷-畸形 杵状指-骨关节病,继发肥大性
主题词表- 主题词表-单元词表
《WPI--规范化主题词表》
(WPI--LIST OF STANDARD THESAURUS TERMS)
是检索英国德温特公司专利文献的工具。按规范 词字顺排列。其著录格式见图
WPI-List of Standard Thesaurus Terms 1987 COBALT(3772)(1) COBALT@(3) CODON【87】(4) ELECTRIC(33892)(1) Electrical(2)
关键词 自然语言 单元词 标题词 叙词 语 言 言 语
分类语言
分类语言是运用概念划分的方 法,按文献内容所属学科、专 业性质的逻辑次序,以数字、 字母或数字与字母结合为基本 字符,以分类号为标识,用来 存储和检索文献的文献标识系 统。
分类语言的特点
主要特点就是按学科专业性质集中图书 区分不同性质的图书 集中性质相同的图书 相近的放在相近的位置 按照远近亲疏的关系把图书组成为一个 有条理的体系 提供从学科分类查找图书的途径
机械制造工艺系统学 / 张恩生,申铁固编著-上海交通 大学出版社 TH16/ Z31 机械设计学习指南 / 陶民华等编机械工业出版社 TH122-44/ T43 机械优化设计基础 / 张九明编著煤炭工业出版社 TH122/ Z32A 分类号+著者号TP393-62/J25
主题语言
主题语言是指以自然语言的字符为字符, 以名词性术语为基本词汇,用名词性术 语作为标识的一种信息标识系统。是主 题概念检索文献信息的检索语言。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一节 信息检索系统
一、信息检索系统

是根据特定的信息需求而建立起来的一种有关信 息收集、加工、存储和检索的服务工作系统。
可分为 手工检索系统 计算机检索系统

一、信息检索系统
按信息检索系统的实施手段可分为:
手工检索系统
脱机检索
计算机检索系统 联机检索
网络检索(光盘检索)
1. 脱机检索阶段
20世纪50~60年代
R 4 临床医学
R44诊断学
R441症状诊断学 R443物理诊断学(体检诊断) R441症状诊断学 R444电诊断 R443物理诊断学(体检诊断) R445影像诊断学 R444电诊断 R446.1生物化学检验、临床检验 R446实验室诊断 R445影像诊断学 R446.5微生物学检验 R447鉴别诊断学 R446实验室诊断 R446.6免疫学检验 R448机能诊断学 R446.8组织学检验 R447鉴别诊断学 R449预后及劳动鉴定 R446.9其他 R448机能诊断学 R45治疗学 R446.111血液一般(常规)检 验 R47护理学 R446.112血液生物化学检验 R48临终关怀学 R446.113血液细胞学检验 R49康复医学



文档(file):文档是按一定结构组织的相关记录的 信息集合。一个数据库可按年代和学科分割成若干个 文档。 记录(record):构成文档的基本数据单元。它是对 某一实体的全部属性进行描述的结果。它描述原始信 息的外部特征和内部特征,每条记录有许多个字段组 成,一条记录代表一篇原始文献的相关信息。 字段(field):比记录更小的单元,是组成记录的基 本要素。在书目数据库中,记录中含有题名、著者、 出版年、主题词、文摘等字段。
三、 关键词途径
是最常用的一种检索途径。
优点:利于新课题、新事物的检索。 缺点:没有严格的语法规范,个人使用
的爱好不同自由词选择不同,要查全, 需考虑同义词等。
输入
检 索 系 统 检 索 输出 结 果
检 检 索 索 分析 提 课 问 题 特 征
选用

形成
检索
2.1.3

检索语言


又称标引语言、索引语言、概念标识系统等 检索语言是为信息的加工、存储和检索 的共同需要而编制的专业语言。 是信息检索系统存储和检索信息时共同使用的 一种约定性语言,以达到信息存储和检索的一 致性,提高检索效率。 检索语言是检索系统的重要组成部分, 是沟通文献贮存和检索两个过程及标引人员与 检索人员双方思想的桥梁。
数据库的组成
2.数据库类型(按内容分型)
(一)书目数据库(Bibliographic Databases) (二)事实数据库(Numeric Databases) (三)数值数据库(Fact Databases) (四)全文数据库(Full Text Databases) (五)图像数据库(Image Databases)
数据库类型(按内容分型)
(四)全文数据库(Full Text Databases) :存储文献全文或节选 其中主要部分的数据库。可以直接获 取原始资料。
(五)图像数据库(Image Databases): 以图像为信息主体,配有文字解释。
文 献 文 信 标引著录 献 分析 息 信 特 息 征
(文 检献 索信 检 索 形成 点 息 )特 征 语 标 言 识 和 名 称 规 (检 检索 索提 词问 )标 识
叙词

是能表达文献主题并经过严格规范化处理 的词语,又称主题词。
特 点:具有概念性、描述性、组配性。 如我国《汉语主题词表》(1980出版)、美国《医学 主题词表》等。

美国《医学主题词表》
(MeSH,Medical Subject Headings)
特 点:
词义、词类、词形规范保证词语与概念的唯 一对应关系,具有专指性 采用参照系统显示词语之间的相关关系
数据库类型(按内容分型)
(一)书目数据库(Bibliographic Databases) 是机读形式的二次文献数据库,包括:目 录、题录、文摘等书目线索。 (二)事实数据库(Numeric Databases) 也称指南数据库,存储描述人物、机构、 事物的等非文献信息源的数据库。 (三)数值数据库(Fact Databases):为用户直 接提供所需的数据信息,无需再追查原文。
采用主题词分类索引(范畴表或树状结构)显示词语 之间的等级(从属)关系,增强了族性检索能力。
关键词语言
是直接从文献的标题、文摘或全文中抽 选具有实质意义、能表达文献主题概念,未 经规范化处理的自然语言词汇。
优点: ① 易于实现自动抽词和编制索引; ② 表达主题直观,检索入口多,能及时反映新事物新 概念。 缺点:检索质量难以保证,容易漏检。
国内常见的分类法有:
1.
2. 3.
《中国图书馆分类法》,简称《中图法》 《中国人民大学图书馆图书分类法》 《中国科学院图书馆图书分类法》

《中国图书馆分类法》
是我国建国后编制出版的一部具有代表性的大型综 合性分类法,简称《中图法》。英文译名为Chinese Library Classification,英文缩写为CLC。 将学科划分为5个基本部类,22个基本大类,再进 行层层划分,逐级展开,形成一个严格有序的直线性 知识门类等级体系。
第二章 信息系统的发展及组成; 2.理解分类语言和主题语言; 3.掌握各种检索途径的利用及其区别;
4.掌握常用的信息检索技术;
5.掌握信息检索策略的制定;
6.掌握查全率、查准率的概念及提高检索效果的措施。
信息检索就是充分利用信息检索系统,按照一 定的检索语言和规则对文献信息进行标引,按 照检索系统提供的检索途径,采用先进的信息 检索技术,制定合理有效的检索策略,快速、 准确、全面地检索出所需的文献信息。
R446.119其他
R446.11血液学检验 R446.12尿液检验 R446.13粪便检验 R446.14脑脊髓液检验 R446.19其他
优点: 体现了学科和专业的系统性,便于族性检索, 提高查全率。
缺点:
专指性较差,不能充分揭示信息资源中大量存在 的细小专深主题。 分类表中的类目不能随时更改,因而不能及时反 映新的科学技术。 按照直线序列设置类目,对边缘学科课题只能标 引在一门学科的类目之下,检索时可能漏检。
体 系 结 构
社会科学
自然科学
综合性图书
Z 综合性图书
R 医药、卫生
R 1 2 3 4 5 6 预防医学、卫生学 中国医学 基础医学 临床医学 内科学 外科学 R 74 75 76 77 78 79 神经病学与精神病学 皮肤病学与性病学 耳鼻咽喉科学 眼科学 口腔科学 外国民族医学
71 妇产科学
72 73 儿科学 肿瘤学
8
9
特种医学
药学
R 4 临床医学
R44诊断学 R441症状诊断学 R443物理诊断学(体检诊断) R441症状诊断学 R444电诊断 R443物理诊断学(体检诊断) R445影像诊断学 R444电诊断 R446实验室诊断 R445影像诊断学 R447鉴别诊断学 R446实验室诊断 R448机能诊断学 R447鉴别诊断学 R449预后及劳动鉴定 R448机能诊断学 R45治疗学 R47护理学 R48临终关怀学 R49康复医学
R441.1疼痛 R441.2眩晕 R441.3发热 R441.4心动过速 R441.5咳嗽、咳痰 R441.6呕血、黑便 R441.7咯血 R441.8呼吸困难 R441.9休克 R442.1厌食、恶心、呕吐 R442.2便秘、腹胀、腹泻 R442.3肝脾肿大 R442.4黄疸 R442.5腹水、水肿 R442.6痉挛 R442.7出血 R442.8综合征 R442.9其他
马克思主义、列宁主义、毛 泽东思想、邓小平理论
哲学、宗教
A 马克思主义、列宁主义、 毛泽东思想、邓小平理论
B
C D E F G H I J K N O P Q R S T U V X
哲学、宗教
社会科学总论 政治、法律 军事 经济 文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理 自然科学总论 数理科学和化学 天文学、地球科学 生物科学 医药、卫生 农业科学 工业技术 交通运输 航空、航天 环境科学、安全科学



我国古代第一部成型的图书分类法是西汉刘向、 刘歆(xin)父子编制的《七略》。 西晋,荀勖(xu)创立了四部分类法,即甲、 乙、丙、丁四大部。 从隋唐起,图书的四部分类法已经基本定型。 皇家图书馆及秘书省、翰林院等重要典藏图书 之所,都是按照经、史、子、集分四库贮藏图 书的,名为"四库书"。

又称脱机批处理检索,用户提出的信 息需求是委托式的,交专业人员统一安排, 必须等待成批或定期处理。
缺点:检索结果延误。 优点:无网络通讯费,检索费用由用户平
摊,价格便宜。
2. 联机检索阶段
20世纪60~70年代
是用户利用终端设备,通过通信网络或 通信线路与检索系统联机,采用分时技术, 多个用户可以同时与主机“对话”,从检索 中心的数据库查找所需要的文献信息过程。


分类语言是用分类号作标识,具有学科系统性 的人工语言。 提供分类检索途径,具有族性检索的特点,但 专指性较差。 分类语言的特点: 分类语言较好地体现了学科和专业的系统性, 反映了事物的隶属、平行和派生的关系,提供 的分类检索途径,具有族性检索的特点,能获 得较高的查全率,但专指性较差,不适合专深 主题和多位概念的检索。
分类号基本知识介绍:以 R563.1为例
分类号
R R5
名称
医药、卫生 内科学
级别
一级类目 二级类目
R56
R563 R563.1
呼吸系及胸部系统疾病
肺疾病 大叶性肺炎
相关文档
最新文档