第二章文献信息检索基本理论与方法_PPT幻灯片

合集下载

第2章--信息检索PPT课件

第2章--信息检索PPT课件

经济
文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
S
T U V X Z
农业科学
工业技术 交通运输 航空、航天 环境科学、安全科学 综合性图书
《中国图书馆分类法》
中国图书馆分类法分类表共分22个大类,再分17个 二级目录,医药卫生属于R大类。 《中图法》采用汉语拼音字母和阿拉伯数字组成的 混合制号码作类目标识,用一个字母标记一个基本
的问题;
另一方面是特定原始文献的查找,即在查找特定
的文献线索后,找出原始文献的过程。
第一节 信息检索基础
一、信息检索概念
(二)信息检索的意义和作用 信息检索 有助于知识更新 ,有助于同学们扩大视野 ,了解和把握有关学科中出现的新思想、新观点与 新知识。掌握信息检索技术是快速、准确地获取和 利用最新信息的有效途径。 信息检索有助于科学研究,了解和把握有关学科的 起源和发展过程。 有助于独立自主地解决自己在学习、生活和工作中 所遇到的疑难问题。 是接受终身教育的必要手段。 节省时间,提高效率。
第二节 信息检索语言
二、检索语言的种类
(一)分类检索语言 分类检索语言又称分类法,是用分类号(字母、数 字或它们的组合)来表达各种概念的,并将各种概 念按学科性质进行分类和系统排列的信息检索语言。 它以树状结构的形式,按知识门类的逻辑次序反映事物 的从属、派生关系,构成具有上位类和下位类隶属、同 位类并列的概念等级体系。 能较好体现概念的族性关系,从学科专业的角度检索资 料,比较方便,扩大、缩小检索范围方便。
(一)按信息检索的对象划分
数据信息检索 利用数据库、工具书等以数值或数据为对象的检 索,也称为数值检索。检索包含分子式、分子量 、公式 、图表等特定数据的信息。

文献信息检索ppt课件

文献信息检索ppt课件

和B的文献,才算命中文献。

3、逻辑“非”
————————————————
AB
用符号“not”或“-”,其逻辑表达式为: A not B 或 A-B
其意义为:检索记录中含有检索词A,但不能 含有检索词B的文献,才算命中文献。

逻辑提问式(布尔逻辑组配):
计算机检索的基本技术,主要通过逻辑运算 符(布尔算符)“与(and,*)”、“或 (or,+)”、 “非(not,-)”等将检索词连接 的提问式。
注意:优先级为not, and, or,用括号保证优 先权;运算符两侧必须各有一个空格(半角)。
实例:
膜法提取甘露醇中的微生物污染控制 (膜法+膜集成)*甘露醇*(细菌污染+微生物污 染)
写出以下检索词,并用上述布尔逻辑符写出检 索式:
固氮和固碳的生化机理或基因机制
(二)、位置算符
在检索词之间使用,规定算符两边的检索词出现 在记录中的的位置,以提高检准率。比如:如果 不用with位置算符,则词组可能被系统识别为逻辑 运算,protein disulfide isomerase(蛋白质二 硫键异构酶)可能被识别成“protein AND disulfide AND isomerase”。尤其是出现数字等 符号时不易识别成词组。
AB
用符号“or”或“+”表示,其逻辑表达式为:
A or B
或 A+B
其意义为检索记录中凡含有检索词A或检索词B,
或同时含有检索词A和B的,均为命中文献。
例:
2、逻辑“与”
————————————————
AB
用符号“and”或“*”表示,其逻辑表达式为:
A*B

【精品】信息检索ppt课件ppt课件

【精品】信息检索ppt课件ppt课件

• 一个原则 • 两类搜索引擎 • 三大系列中文网站 • 四次文献: 零次文献
二次文献
• 五大多媒体技术 • 十大文献信息资源
一次文献 三次文献
• 一个原则 • 两类搜索引擎 • 三大系列中文网站 • 四次文献 • 五大多媒体技术:素材下载技术 素材转换技术
多媒体制作技术 素材发布技术 网页制作和网站发布技术 • 十大文献信息资源
图、文、声、像等信息存储到介质上通过计算 机阅读。
(2)、按信息加工级别划分信息源
• 信息出版量的急剧增长,信息类型的多样化和 信息分布的离散状态,获取相关信息犹如大海 捞针。利用信息的可塑性,将信息处理为不同 等级。通常文献学上将其称为“三次文献”:
一次文献 primary document 二次文献 secondary document 三次文献 Tertiary document 零次文献 最原始的资料
5)专利文献(patent)
种 6)学位论文 nment publication)

8)标准文献(standards) 9)产品资料(product literature)
10)科技档案(scientific and technical archives)
• 1)印刷型(Printed form)(书本型)
以纸张为载体 2)缩微型(Microform) 以缩微胶片、平片等感光材料为载体 3) 声像型(Audio-Visual form)(视听材料) 以磁性和感光材料为载体 4) 电子型(Machine Readable form) 以计算机信息存储设备为载体,以数字代码将
Company
LOGO
三、网络检索的 六大方面
• 一个原则:选择合适的关键词,制定正确的检索 策略。

医学文献检索检索基础及检索方法PPT课件

医学文献检索检索基础及检索方法PPT课件
中国图书馆分类法简称中图法4950医学文献检索中国图书馆分类法一级类目表马克思主义列宁主义毛泽东思想邓小平理论文化科学教育体育工业技术5051医学文献检索中图法r医药卫生类目体系医药卫生r1预防医学卫生学r2中国医学r3基础医学r4临床医学r71妇产科学r72儿科学r6外科学r5内科学r73肿瘤学r74神经病学与精神病学r75皮肤病学与性病学r76耳鼻咽喉科学r77眼科学r78口腔科学r79外国民族医学r8特种医学r9r21中医预防卫生学r22中医基础理论r24中医临床学r25中医内科学r26中医外科学r271中医妇产科学r272中医儿科学r273中医肿瘤科学r274中医骨伤科学r275中医皮肤科学与性病学r276中医五官科学r277中医其他学科r278中医急症学r28中药学r289方剂学r29中国少数民族医学5152医学文献检索医药卫生r2中国医学r24中医临床学r241中医诊断学r2412r24129其他类目按学科概念之间的逻辑隶属关系逐级展开划分出更专指更具体的下位类目
❖描述文献内容特征的检索语言 主要有分类语言和主 题语言。
46
医学文献检索
二、分类语言
❖ 根据文献的内容学科属性,从知识分类的角度揭示 各类文 献的特点和联系,对大量文献进行有序类集, 进而建立文献的分类检索途径。
❖ 所谓“类”,是具有某种(或某些)共同属性的事 物的集合,分类语言中称为“类目”。
知识来源于信息,是信息的一部分,而信息则是构 成知识的原材料,这些原材料经过人脑接受、选 择、处理之后才能组合成新的知识(即系统化了 的信息),将这些认识结果记录在载体上,则形 成了文献。情报是为了解决特定问题所需要的知 识。文献则是知识信息情报的载体。
(二)文献类型
1、按照文献编纂形式划分
图书

信息检索基础.ppt

信息检索基础.ppt
查全率 80% 查准率 88.9%
27
2.3 信息检索类型
1.文献检索
以索引、文摘或其他文献特征为主要检索对象 ,目的是运用检索系统查检出与某课题相关文献 检索,从而获取原始文献。
2.数据检索
以数据为检索对象,可直接选择专门的数据性 工具进行查检,从而得到数值性数据、图表、化 学结构式、计算公式等。
冠状动脉疾病 冠状动脉心脏病
主题词 冠状动脉疾病
治疗
文献
20
4. 著者检索
用文献的著者、编者、译者的姓名或机构团体名 称编制而成的索引。
按著者姓名字顺编排 书写格式 姓前(全称)、名后(缩写,即用首字
母)
如:Willian Henry Harrison →Harrison W H
Ren Shu Min → Ren SM
计算机检索系统
3
二、信息检索的原理
是将描述特定用户所需信息的提问特征,与 信息存储的检索标识进行异同的比较,从中找 出与提问特征一致或基本一致的信息。
本质是用户的信息需求与存储 在信息集合中的信息进行比较和 选择, 即匹配的过程。
4
主题
信息 文献的 分析 存贮 信息内容
主题
信息 检索者的 分析 检索 信息需要
18
3. 主题途径
主题词:是以自然语言为基础,以概念组配为 基本原理,并经过规范化处理,表达主题的最 小概念单元,作为信息存储和检索依据的一种 检索语言。
特 点: 词义、词类、词形规范保证词语与概念的唯一
对应关系,具有专指性。
19
检索举例:冠心病的治疗
自由词
冠心病
冠状动脉粥样硬化性心脏病 治疗
1. 直接浏览法
直接浏览法也称直接查找法,指检索者不依靠任何检 索工具或检索系统,从本专业最新核心期刊或其他文献中 直接阅读原文或浏览最新目次而获取文献的方法。这是一 种最常见的信息资源的获取方式。因为编制检索工具需要 时间,有的半年,甚至长达一年之久,直接浏览可以及时 获得最新文献。但利用这种方法查找的信息不全面、不系 统、且局限性较大,不能作为查找文献的主要方法。

第2章 文献信息检索的方法和途径ppt课件

第2章 文献信息检索的方法和途径ppt课件
❖ 确定检索策略 根据课题研究的特点和检索要 求制定检索策略。选择检索方法、检索工具以 及检索范围(专业、时间、语种、文献类型等), 其中最关键的是确定检索标识,如关键词、主 题词、分类号、作者、作者单位等。
整理版课件
22
5. 实施检索并调整检索策略
6. 索取原始文献 当查到研究课题的相关 信息后,判定是否符合检索需要,如符 合需要,则要准确记录下题名、作者、 出处、以获取原始文献。
介绍内容:
计算机检索概念和发展历程 计算机检索的基本技术 计算机检索步骤 计算机检索的发展趋势
整理版课件
29
2.3.1 计算机检索概念和发展历程
计算机检索概念
计算机检索:是通过计算机(单机、网 络)可以查找、利用各种信息资源。
包括图书馆的公共书目(OPAC--Online Public Access atalogue)、各种联机数据 库、Internet上的信息资源等。
整理版课件
35
(6) Web信息资源检索(90年代末-)
进入90年代后,随着网络技术的发展,尤其是 互联网的迅猛发展,使计算机检索进入一个崭 新的时期。检索方法更简单,检索结果更全面
2.3.2 数据库检索
概念
数据库就是在计算机存储设备上按一定方式 存储的相互关联的数据集合。是计算机技术与 信息检索技术相结合的产物,是现代重要的信 息资源,也是信息检索的重要资料来源。
技术档案
整理版课件
4
➢网络信息资源: (数据库)存在于网络中, 通过上网获取。
特点:丰富、覆盖面广,超文本、超媒 体、集成地提供信~息,来源分散、无序、 难以控制,方便、及时、快速和交互性。
优越性:廉价,新颖、深入,广泛、直 接交流,非正式和自由发表的园地。

文献检索与利用 ppt课件

文献检索与利用 ppt课件

《中国分类主题词表》
馆藏书目:
四. 信息检索的关键技术
信息抽取:对文本中包含的信息进行结构化处理,以表格的形式加以组织。
输入的是原始文本,输出的是固定格式的信息点。信息以统一的形式集成在 一起,便于查找和比较。
文本分类与聚类:分类--基于统计或规则,根据文本的内容或结构特征,
将文本自动分到已知的类别中。聚类:将文本集合分组成多个类或者簇,使 得同一个簇中的文本内容具有较高的相似度,二不同簇中的文本内容差别较 大。分类一般需要训练,聚类不用。
• 信息检索是对信息项(information items)进行表 示(representation)、存储(storage)、组织 (organization)和存取(access)。
• 狭义的信息检索
根据特定的需求,利用某种检索工具,按照 一定的方法与步骤,从大量文献中查找出符 合用户需求的信息与文献的过程。 (information search)
自动文摘:是一种压缩技术,目标是从信息源中提取出重要且不冗余的信息, 并以简介、浓缩、全面的方式呈现出来。
链接分析:用来分析网页的重要程度、如A链接向B,那么可以认为B中包含
A认为有价值的资源。
分布式信息检索:多台计算机、多个处理器大规模检索 Web信息检索:处理Internet信息的检索。
教学目的与意义
• Why --- 为什么学习信息检索 • What --- 什么是信息检索 • How --- 怎样进行信息检索 • Where --- 在哪里进行信息检索 • How-to-better --- 如何提高检索效率效果
教学目的与意义
• Knowledge 了解相关知识
• Skill
• 第三章 信息检索系统的评价 • 第四章 文本操作技术 • 第五章 文本索引和搜索

文献信息检索ppt.ppt

文献信息检索ppt.ppt

表述文献外表 特征的语言
责任者 代码 引文



分类法
类 型
表述文献内容 特征的语言
主题法
主题途径 主题词是规范化的检索语言,主题词检索途径的 检索系统都有相应的主题词词表,利用主题词途 径标引或检索文献时,一定要先查对词表,再进 行标引或检索。国内中文主题词表一般采用《中 国主题词表》或《中国图书馆图书分类主题词 表》,英文文献检索系统一般采用《❖ 是一种定量检索技术:在每个提问词后面给 定一个数值表示其重要程度,这个数值称为 权,在检索时先查找这些词在记录中是否存 在,然后计算存在的权值总和,权值之和达 到或超过给定阈值,该记录即为命中记录。
七 聚类检索
❖ 把相似度较高的文献集中在一起形成一个个 的文献类的检索技术。
八、匹配方式 P37-38
❖ 检索词的词干后(前)加一个“?”(有的系统 为加*),表示词干后(前)可以有任意个字符。
如“apple?”可代替(apple + apples + apple-pie + applesauce);
❖ 由于文字结构方面的原因,中文检索系统极 少使用通配符进行截词。
❖ 椰壳制备高比表面积活性炭 ,椰壳可能表达 为椰子壳,可以用“(椰子壳十椰壳)*高比 表面积活性炭 ”,或直接用“椰*高比表面 积活性炭 ”
AB
用符号“or”或“+”表示,其逻辑表达式为: A or B 或 A+B
其意义为检索记录中凡含有检索词A或检索词B, 或同时含有检索词A和B的,均为命中文献。
例:
2、逻辑“与”
————————————————
AB
用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B

第2讲文献信息检索基本原理PPT课件

第2讲文献信息检索基本原理PPT课件
25
著者
反映文献外部特征 文献号(如:专利号、标准号、
检索标识 检
报告号、ISBN号、ISSN号)
其他(如:题名)

标 识
分类号 分类语言
检 索 语 言
反映文献内容特征 检索标识
关键词 自然语言 主
主题词 单元词 标题词 叙词
规 范 语 言
题 词 语 言
(
)
26
1 分类语言 以学科体系为基础,用号码作为概念标识,按分
Michel,D…
团体作者: European Commission
BE
CEC
出版日期: 1999
页: 164S
5
❖期刊著录
记录标识: 记录来源: 文献类型: 文献题名:
作者单位: 母体文献: 卷期页码: 出版单位: 分 类 号: 主 题 词:
9807001 JX 刊 机械零件组成编码频率分析及设计规范化通用标准化 鲍子强 长沙重型机器厂 矿山机械 1997,No.12,p.39~42 洛阳矿山机械研究所 97*TD-3*12 标准化,成组技术,机械零件,设计 (略)
比如,查找某一统计数据,某一数学公式,某一材 料的成分、性能,某种元件的型号、参数等。 • 解决方案:利用手册、年鉴等参考工具书或数值型 数据库来检索。
20
②事实检索 • 特征:以特定的事实为检索对象。
比如,查找名词术语的解释,了解某人或某机构 的简况,或考证某一事件发生的前因后果等。 • 解决方案:利用辞典、百科全书、年鉴、名录等 参考工具书或事实型数据库来检索。
发布日期:
1998-11-13
标准状态:
ST
实施日期:
1999-05-01
起草单位:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2
文献信息检索
第一节 信息检索系统
一、信息检索系统
是根据特定的信息需求而建立起来的一种有关信 息收集、加工、存储和检索的服务工作系统。
可分为 手工检索系统 计算机检索系统
2021/3/9
3
文献信息检索
2021/3/9
文献信息检索
2021/3/9
文献信息检索
2. 联机检索阶段 20世纪60~70年代
西晋,荀勖(xu)创立了四部分类法,即甲、
乙、丙、丁四大部。
从隋唐起,图书的四部分类法已经基本定型。
皇家图书馆及秘书省、翰林院等重要典藏图书 之所,都是按照经、史、子、集分四库贮藏图 书的,名为"四库书"。
2021/3/9
15
文献信息检索
1. 分类语言
是按文献的学科性质给予相应的分类号,用 分类号来表达文献的主题概念,根据分类表中 的顺序编排成分类索引,提供分类途径供检索 文献使用。
数据库类型(按内容分型)
(一)书目数据库(Bibliographic Databases)
(二)事实数据库(Numeric Databases) (三)数值数据库(Fact Databases) (四)全文数据库(Full Text Databases) (五)图像数据库(Image Databases)
2021/3/9
12
文献信息检索
第二节 信息检索语言
又称标引语言、索引语言、概念标识系统等。
是为信息加工、存储和检索共同需要而编制 的专业语言。
是信息检索系统存储和检索信息时共同使用 的一种约定性语言,以达到信息存储和检索 的一致性,提高检索效率。
2021/3/9
13
文献信息检索
描述信息外表 特征的语言
Z 综合性图书
18
文献信息检索
R 医药、卫生
R 1 预防医学、卫生学 R 74 神经病学与精神病学
2 中国医学
75 皮肤病学与性病学
3 基础医学
76 耳鼻咽喉科学
4 临床医学
77 眼科学
5 内科学
78 口腔科学
6 外科学
79 外国民族医学
71 妇产科学
8 特种医学
72 儿科学
9 药学
73 肿瘤学
2021/3/9
4. 网络信息检索阶段 20世纪80年代末—
2021/3/9
7
文献信息检索
二、信息检索系统的组成
(一)计算机硬件 (二)计算机软件 (三)数据库
按一定方式存储在磁盘、磁带或光盘上的 相互关联的数据集合。
2021/3/9
8
文献信息检索
数据库的组成
数据库由文档、记录和字段组成。
2021/3/9
9
文献信息检索
(三)数值数据库(Fact Databases):为用户直接 提供所需的数据信息,无需再追查原文。
2021/3/9
11
文献信息检索
数据库类型(按内容分型)
(四)全文数据库(Full Text Databases) :存储 文献全文或节选其中主要部分的数据库。可以直 接获取原始资料。
(五)图像数据库(Image Databases):以图像为 信息主体,配有文字解释。
2021/3/9
R441.1疼痛பைடு நூலகம்
R441.2眩晕
R441.3发热
R441.4心动过速
R441.5咳嗽、咳痰
R441.6呕血、黑便
R441.7咯血
19
文献信息检索
R 4 临床医学
R44诊断学
R441症状诊断学 RRRRRRRR444444444444444435679483物电影实鉴机预物RRRRR理诊像验别能后理44444R44444诊断诊室诊诊及诊4157864断断诊断断劳症断影实鉴机4学 学 断 学 学 动学状像验别能电(鉴(诊诊诊室诊诊体定体断断断诊断断检检学学断学学诊诊断断)) R45治疗学 R47护理学 R48临终关怀学 R49康复医学
是用户利用终端设备,通过通信网络或通 信线路与检索系统联机,采用分时技术,多个 用户可以同时与主机“对话”,从检索中心的 数据库查找所需要的文献信息过程。
优点:检索的速度快,检索质量高。 缺点:检索费用高,技术复杂。
2021/3/9
6
文献信息检索
3. 光盘检索阶段 20世纪80年代中期
优点:存储量大、使用方便、费用低、 利用微机就可以进行检索,支持多用户。
2021/3/9
10
文献信息检索
数据库类型(按内容分型)
(一)书目数据库(Bibliographic Databases) 是机读形式的二次文献数据库,包括:目录、题
录、文摘等书目线索。
(二)事实数据库(Numeric Databases) 也称指南数据库,存储描述人物、机构、事物的
等非文献信息源的数据库。
2021/3/9
17
文献信息检索
马克思主义、列宁主义、毛 A 马克思主义、列宁主义、
泽东思想、邓小平理论
毛泽东思想、邓小平理论
哲学、宗教
体 社会科学
系 结 构
自然科学
2021/3/9
综合性图书
B 哲学、宗教
C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、安全科学
书/刊名 著者/团体著者 出版事项
代码/序号
检索语言
2021/3/9
分类语言
描述信息内容 特征的语言
主题语言
标题词 元词 叙词
关键词 14
文献信息检索
1. 分类语言
方 技 略
数 术 略
兵 书 略
诗 赋 略
诸 子 略
六 艺 略
辑 略
我国古代第一部成型的图书分类法是西汉刘向、
刘歆(xin)父子编制的《七略》。
2021/3/9
16
文献信息检索
《中国图书馆分类法》
是我国建国后编制出版的一部具有代表性的大型 综合性分类法,简称《中图法》。英文译名为 Chinese Library Classification,英文缩写为CLC。
将学科划分为5个基本部类,22个基本大类,再 进行层层划分,逐级展开,形成一个严格有序的直 线性知识门类等级体系。
文献信息检索
第二章 信息检索基础
2021/3/9
1
文献信息检索
本章要求
1.了解信息检索系统的发展及组成; 2.理解分类语言和主题语言; 3.掌握各种检索途径的利用及其区别; 4.掌握常用的信息检索技术; 5.掌握信息检索策略的制定; 6.掌握查全率、查准率的概念及提高检索效果的 措施。
2021/3/9
相关文档
最新文档