文献信息检索ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三节 计算机信息检索技术
(一)逻辑运算符 逻辑运算符又称布尔算符,是用来表达各检
索词之间的逻辑关系的符号。 逻辑运算符有“与”、“或”、“非”三种,
分别用“and” 、“or”、 “not”来表示, 也可以用 “*” “+” “-”来表示。
1、逻辑“或”——— ——————————————
其优点是: A、简捷,降低对检索人员的要求; B、易用,易于计算机编制和检索; C、及时,能及时更新词汇。
缺点:
1、不规范,有大量的同义词、近义词,影响查
全率和查准率。如“高速公路” 有”highway”“autoroute”,“freeway”, “speedway”,“thruway”等,“图形图像” 和“图形图象”同义,检索时如果不能全部记 住,会出现漏检;而“cell”既指细胞又指电 池,检索时会出现误检。
分类途径
根据分类语言进行检索的途径,它是一种按学科 范畴和体系来划分事物的检索语言,以分类表的 形式体现。国内文献分类一般使用《中国图书馆 图书分类法》(简称《中图法》).(P30)
专利使用《国际专利分类法》(IPC)分类。国 外分类法很多,比较常见的有《美国国会图书馆 分类法》(LC)、《国际十进分类法》等。
第二节 检索途径与检索语言 P25-26
1 检索途径 (检索项,检索点、检索入口)
分类途径 主题途径 关键词途径 题名途径 责任者途径 引文途径
2、检索语言:用来描述检索提问主题、学 科分类等内容的语言,它和检索途径是相对 应的。(P27) 常见的检索语言有主题语言和 分类语言。
题名
检 索 语
第二章 文献信息检索技术
第一节 文献信息检索技术
(一)检索方式 1、命令式检索:用逻辑运算符、位置算符及其他检索符号,
把不同的检索词连接起来进行检索的一个种方式,如数据库 中的专业检索。适用于专业人员。 2、菜单式检索:一种通过窗口菜单进行检索的简单、易操作 的检索方式。现各数据库的高级检索、初级检索都属于菜单 式检索,是最常用的检索方式,适用于一般读者检索。 3、导航检索:点击检索界面上的超链接进行检索,也叫超链 接检索。
wk.baidu.com
AB
用符号“or”或“+”表示,其逻辑表达式为:
A or B
或 A+B
其意义为检索记录中凡含有检索词A或检索词B,
或同时含有检索词A和B的,均为命中文献。
例:
2、逻辑“与”
————————————————
AB
用符号“and”或“*”表示,其逻辑表达式为:
A*B
或
A and B
其意义为检索记录中必须同时含有检索词A
分类途径
中图法分类体系
A 马克思主义、列 宁主义、毛泽东思想 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教 育 、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学
P 天文学,地球科学 Q 生物科学 R 医药、卫生 S 农业、林业 T 工业技术总论 TB 一般工业技术 TD 矿业工程 TE 石油、天然气工业 TF 治金工业 TG 金属学、金属工艺 TH 机械、仪表工业 TJ 武器工业 TK 动力工程
表述文献外表 特征的语言
责任者 代码 引文
言
的
分类法
类
型
表述文献内容
特征的语言
主题法
主题途径 主题词是规范化的检索语言,主题词检索途径 的检索系统都有相应的主题词词表,利用主题词 途径标引或检索文献时,一定要先查对词表,再 进行标引或检索。国内中文主题词表一般采用 《中国主题词表》或《中国图书馆图书分类主题 词表》,英文文献检索系统一般采用《美国国会 图书馆标题表》 。
TL 原子能技术 TM 电工技术 TN 无线电电子学、
电讯技术 TP 自动化技术、计
算技术 TQ 化学工业 TS 轻工业、手工业 TU 建筑科学 TV 水利工程 U 交通运输 V 航空、宇宙飞行 X 环境科学 Z 综合性图书
关键词途径
以关键词进行检索的方式,关键词又称 自由词,是从文献的题名、摘要和正文 中抽出的具有实际意义的非规范化自然 语言。
注意:优先级为not, and, or,用括号保证优 先权;运算符两侧必须各有一个空格(半角)。
实例:
膜法提取甘露醇中的微生物污染控制 (膜法+膜集成)*甘露醇*(细菌污染+微生物污 染)
写出以下检索词,并用上述布尔逻辑符写出检 索式:
固氮和固碳的生化机理或基因机制
(二)、位置算符
在检索词之间使用,规定算符两边的检索词出现 在记录中的的位置,以提高检准率。比如:如果 不用with位置算符,则词组可能被系统识别为逻辑 运算,protein disulfide isomerase(蛋白质二 硫键异构酶)可能被识别成“protein AND disulfide AND isomerase”。尤其是出现数字等 符号时不易识别成词组。
常见的位置算符如下:
位置算符
with
near
field subfiel
d link
表示方法 (W)或()
(nW) (N) (nN) (F) (S)
(L)
说明 两个词在命中结果中相邻(可有空格、标点和连字 符),词序不得颠倒。 两个词之间最多可夹入n个词,词序不得颠倒。 两个词在命中结果中相邻,词序可颠倒。 两个词之间最多可夹入n个词,词序可颠倒。 两个词在同一字段出现,位置不固定。 两个词在同一子字段出现,位置不固定。
和B的文献,才算命中文献。
例
3、逻辑“非”
————————————————
AB
用符号“not”或“-”,其逻辑表达式为: A not B 或 A-B
其意义为:检索记录中含有检索词A,但不能 含有检索词B的文献,才算命中文献。
例
逻辑提问式(布尔逻辑组配):
计算机检索的基本技术,主要通过逻辑运算 符(布尔算符)“与(and,*)”、“或 (or,+)”、 “非(not,-)”等将检索词连接 的提问式。
2、词汇量大,给存取带来困难。
由于关键词是未经人工干预的自然语言,符合 大众的检索习惯,大多数检索系统都有关键词 检索。
题名途径:根据文献名称包括书名、刊名、 论文篇名等来检索文献的途径。
责任者途径:指根据已知文献著者来查找 文献的途径, 包括个人著者和机关团体。
引文途径:从被引文献去检索引用文献的 检索途径。