文献信息检索ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三节 计算机信息检索技术
(一)逻辑运算符 逻辑运算符又称布尔算符,是用来表达各检
索词之间的逻辑关系的符号。 逻辑运算符有“与”、“或”、“非”三种,
分别用“and” 、“or”、 “not”来表示, 也可以用 “*” “+” “-”来表示。
1、逻辑“或”——— ——————————————
其优点是: A、简捷,降低对检索人员的要求; B、易用,易于计算机编制和检索; C、及时,能及时更新词汇。
缺点:
1、不规范,有大量的同义词、近义词,影响查
全率和查准率。如“高速公路” 有”highway”“autoroute”,“freeway”, “speedway”,“thruway”等,“图形图像” 和“图形图象”同义,检索时如果不能全部记 住,会出现漏检;而“cell”既指细胞又指电 池,检索时会出现误检。
分类途径
根据分类语言进行检索的途径,它是一种按学科 范畴和体系来划分事物的检索语言,以分类表的 形式体现。国内文献分类一般使用《中国图书馆 图书分类法》(简称《中图法》).(P30)
专利使用《国际专利分类法》(IPC)分类。国 外分类法很多,比较常见的有《美国国会图书馆 分类法》(LC)、《国际十进分类法》等。
第二节 检索途径与检索语言 P25-26
1 检索途径 (检索项,检索点、检索入口)
分类途径 主题途径 关键词途径 题名途径 责任者途径 引文途径
2、检索语言:用来描述检索提问主题、学 科分类等内容的语言,它和检索途径是相对 应的。(P27) 常见的检索语言有主题语言和 分类语言。
题名
检 索 语
第二章 文献信息检索技术
第一节 文献信息检索技术
(一)检索方式 1、命令式检索:用逻辑运算符、位置算符及其他检索符号,
把不同的检索词连接起来进行检索的一个种方式,如数据库 中的专业检索。适用于专业人员。 2、菜单式检索:一种通过窗口菜单进行检索的简单、易操作 的检索方式。现各数据库的高级检索、初级检索都属于菜单 式检索,是最常用的检索方式,适用于一般读者检索。 3、导航检索:点击检索界面上的超链接进行检索,也叫超链 接检索。
wk.baidu.com
AB
用符号“or”或“+”表示,其逻辑表达式为:
A or B
或 A+B
其意义为检索记录中凡含有检索词A或检索词B,
或同时含有检索词A和B的,均为命中文献。
例:
2、逻辑“与”
————————————————
AB
用符号“and”或“*”表示,其逻辑表达式为:
A*B

A and B
其意义为检索记录中必须同时含有检索词A
分类途径
中图法分类体系
A 马克思主义、列 宁主义、毛泽东思想 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教 育 、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学
P 天文学,地球科学 Q 生物科学 R 医药、卫生 S 农业、林业 T 工业技术总论 TB 一般工业技术 TD 矿业工程 TE 石油、天然气工业 TF 治金工业 TG 金属学、金属工艺 TH 机械、仪表工业 TJ 武器工业 TK 动力工程
表述文献外表 特征的语言
责任者 代码 引文


分类法


表述文献内容
特征的语言
主题法
主题途径 主题词是规范化的检索语言,主题词检索途径 的检索系统都有相应的主题词词表,利用主题词 途径标引或检索文献时,一定要先查对词表,再 进行标引或检索。国内中文主题词表一般采用 《中国主题词表》或《中国图书馆图书分类主题 词表》,英文文献检索系统一般采用《美国国会 图书馆标题表》 。
TL 原子能技术 TM 电工技术 TN 无线电电子学、
电讯技术 TP 自动化技术、计
算技术 TQ 化学工业 TS 轻工业、手工业 TU 建筑科学 TV 水利工程 U 交通运输 V 航空、宇宙飞行 X 环境科学 Z 综合性图书
关键词途径
以关键词进行检索的方式,关键词又称 自由词,是从文献的题名、摘要和正文 中抽出的具有实际意义的非规范化自然 语言。
注意:优先级为not, and, or,用括号保证优 先权;运算符两侧必须各有一个空格(半角)。
实例:
膜法提取甘露醇中的微生物污染控制 (膜法+膜集成)*甘露醇*(细菌污染+微生物污 染)
写出以下检索词,并用上述布尔逻辑符写出检 索式:
固氮和固碳的生化机理或基因机制
(二)、位置算符
在检索词之间使用,规定算符两边的检索词出现 在记录中的的位置,以提高检准率。比如:如果 不用with位置算符,则词组可能被系统识别为逻辑 运算,protein disulfide isomerase(蛋白质二 硫键异构酶)可能被识别成“protein AND disulfide AND isomerase”。尤其是出现数字等 符号时不易识别成词组。
常见的位置算符如下:
位置算符
with
near
field subfiel
d link
表示方法 (W)或()
(nW) (N) (nN) (F) (S)
(L)
说明 两个词在命中结果中相邻(可有空格、标点和连字 符),词序不得颠倒。 两个词之间最多可夹入n个词,词序不得颠倒。 两个词在命中结果中相邻,词序可颠倒。 两个词之间最多可夹入n个词,词序可颠倒。 两个词在同一字段出现,位置不固定。 两个词在同一子字段出现,位置不固定。
和B的文献,才算命中文献。

3、逻辑“非”
————————————————
AB
用符号“not”或“-”,其逻辑表达式为: A not B 或 A-B
其意义为:检索记录中含有检索词A,但不能 含有检索词B的文献,才算命中文献。

逻辑提问式(布尔逻辑组配):
计算机检索的基本技术,主要通过逻辑运算 符(布尔算符)“与(and,*)”、“或 (or,+)”、 “非(not,-)”等将检索词连接 的提问式。
2、词汇量大,给存取带来困难。
由于关键词是未经人工干预的自然语言,符合 大众的检索习惯,大多数检索系统都有关键词 检索。
题名途径:根据文献名称包括书名、刊名、 论文篇名等来检索文献的途径。
责任者途径:指根据已知文献著者来查找 文献的途径, 包括个人著者和机关团体。
引文途径:从被引文献去检索引用文献的 检索途径。
相关文档
最新文档