文献检索与应用2
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分类途径的优缺点
2)缺点 (1)不适用于特性检索,查准率比主题词低 【例题】论文《多功能昆虫鸣声信号采集和分析系统及其在褐飞虱 鸣声研究中的应用》和论文《活菌制剂与抗生素对仔猪饲料消化率和 肠道微生物数量的影响》适合用分类途径还是主题途径检索? 【题解】这类课题仅仅采用分类号无法准确表达课题,用分类号只 能粗略表达,并且分到两个类目,不易归类,适宜用主题途径检索。 论文1的【关键词】是:昆虫 insect鸣声信号acoustic signal 信号采集signal acquisition 信号分析 signal analysis行为观察 褐飞虱brown planthopper 水稻rice 害虫pest
知识检索可以分为:事实型检索、数值型检索、文献检索
事实型检索:以检索特定的事实为检索对象,如查找名词术 语的解释、了解某人或某机构的简况,或考证某一事件发生 的前因后果。
数据型检索:检索特定的数值。如查找某一统计数据、某一 数学公式、某一材料的成分
Federal Code联邦法规——《美国法典》、《美国宪法》、以及《联 邦法院规章》所有联邦法规,其中包括《联邦公报》、《联邦法规汇 编》、《美国总检察长意见》、以及《联邦采购法规和增补》
1根据检索目的确定所需数据库的类型2根据信息需求的内容专业范围选择数据库3根据记录来源选择数据库4根据熟悉程度选择数据库开始某一项科学研究或承接某项工程设计需要对课题进行全面的文献普查并从中筛选出所需的资料用以编写可行性报告计划任务书对这样的课题应选择一个年限比较长的收录比较广泛的相关专业的二次文献数据库在全面回溯检索的基础上选出相关的文献再获取一次文献
Subject Information Gateway 学科信息门户是将特定学科领域的信息资源、工具和服 务集成为一体,为用户提供方便的信息检索和服务入口。
Social Science Information Gateway SOSIG 国家科技图书文献中心 NSTL 中国科学院国家科学图书馆 CSDL
(2)不能适应学科发展中的变化,难以反映新学科和新名词术语 【实例】食品风险分析是保证食品安全的一种新模式,同时也是一 门正在发展中的新兴学科。风险分析的目标在于保护消费者的健康和 促进公平的食品贸易。目前的文章在分类上暂时归入[ R155.5 ] 食 品卫生与检验和[ TS201.6 ] 食品安全与卫生。没有一个专门的“食 品风险分析”分类号。 (3)人们认识的不统一,往往造成分类不一致及排检的错误,不易反映 交叉学科。 【实例】例如管理心理学,它是心理学的一个分支,主要是研究企 业中人的心理活动规律,用科学的方法改进管理工作,充分调动人的 积极性的一门学科。但是,人们很可能误解为归入管理学。
光盘数据库
网络数据库
目录式
印刷型检索工具
以印刷本为主体的检索工具, 按揭是文献内容的深度分为:
索引式 文摘式
检 索 工 具
利用计算机终端 设备,通过通信 线路,从文献信 息检索系统中心 的计算机数据库 中检索
个人用户通过网络对数 据库进行检索的方式。
联机检索 使用计算机系统对信息资料进 行储存的一种检索方式
知识检索基础
什么是知识检索?
基于知识和知识组织,融合知识处理与多媒体信息处理 等多种方法和技术,能高效存取所有媒体类型的知识资 源(文本、图像、视频、声音)并能充分表达和优化用 户需求,准确精选用户需要的结果对一种信息处理过程。
知识检索的类型
1 依据数据格式和检索技术的层次不同划分
文本信息检索、多媒体检索、超媒体及超文本检索
查找“制药化学”相关的书,可从 R 医药、卫生===〉R9 药学===〉R91药物基 础科学
专利分类 /zgzl/zlfl/default.htm
A 马克思主义、列宁主义、毛泽东思想 B 哲学法律
N 自然科学总论 O 数理科学和化学
C 社会科学总论
D 政治
检出 prevent
prevents prevented preventing prevention preventable …….
截词符
中间屏蔽
?
例: s organi?ation 检出 organisation ,organization
中文数据库检索有没有截词?
检索系统的检索功能
3 位置算符 要求检索词在检索结果中出现时,其间的相互距离不 应超过若干个字符的范围限制。
主题词规范实例:同义词 【实例】“煤炭”与“煤”是同义词,都可以使用,但是只能用“ 煤”作为主题词。术语“商品煤”,英文是Commercial coal/salable coal,含义是作为商品出售的煤,其同义词“销 煤”,现在已经停止使用。术语“精煤”,英文是cleaned coal ,含义是煤经精选(干选或湿选)后生产出来的、符合质量要求 的产品,其同义词“洗精煤”现在已经停止使用。 【实例】“如“实验”与“试验”、“天然资源”与“自然资源” 这两组词汇,应该选择“实验”和“自然资源”作为主题词。 【实例】“计算机”与 “电脑”,是同义词,都可以使用,电脑是 俗名,计算机是正式用名,就用“计算机”作为主题词。“发动 机”与“马达”(motor)是同义词,但是选择“发动机”作为 主题词;同理,“贫铜矿”宜用“低品位铜矿”表达;土豆、洋 芋用“马铃薯”表达。 【实例】“对不同写法,如“X射线”与“爱克斯射线”,“氟利昂 ”与“氟里昂”,应该选择最常用的“X射线”、“氟利昂”。
检索语言
就是为沟通文献标引与文献检索 而编制的人工语言,也是连接信息存储和检索两个 过程中标引人员与检索人员双方思路的渠道,是用 于文献标引和检索提问的约定语言。
检索语言
检索语言
分类 1 分类语言/索引
根据学科之间的逻辑归属关系,从总到分,从 一般到具体,逐级展开划分。常用的如:《中 国图书馆图书分类法》、《国际专利分类》
的具体位置与截断字符的数量。
截词检索
用于解决一些词干相同、词义相近、但词尾或词头不 一致的派生词(如由同一词根派生出的名词、动名词、
动词、形容词、副词等),或名词的单、复数形式,
或同一词的英美不同拼写形式等词的一次输入。
截词方式
按截断的位置分:
右截断 (前方一致) 中截断 (中间屏蔽) 有限截断 无限截断
多义词的规范
限定多义的主题词含义或在特定检索工具规定只 有一个特定意义,排除歧义。
【实例】“Cell”既表示生物学中的“细胞”,又表示电学 中的“电池”,这种多义词易造成误检。在生物学检索工 具里规定“Cell”表示生物学中的“细胞”,“battery” 表示电学中的“电池”。 【实例】杜鹃既表示一种鸟,也表示一种花,就须限定说 明为:杜鹃(动物)、杜鹃(植物)。
检索策略
制定步骤 1 分析课题、明确检索要点 明确检索目的。需要解决研究中的某一关键问题?开 展科研立项?成果查新?专利申请?了解最新动态、研究进 展? 明确课题的主题内容和研究重点 明确课题的学科范围 明确所需信息的外部特征:需要的是文献型,还是数 值型、事实型;是全文型,还是书目型?
检索策略
P 天文学
Q 生物科学
E 军事
F 经济 G 文化、科学、教育、体育 H 语言 I 文学 J 艺术 K 历史地理
R 医药、卫生
S 农业科学 T 工业技术 U 交通运输 V 航空航天 X 环境科学 Z 综合性图书
《中国图书馆分类法》基本大类表
生物科学的类目结构
分类途径的优缺点
1)优点 (1)族性检索,查全率较高。 (2)按照人们认识事物的习惯,以学科分类为基础,容易被人们接受和 应用 【例题】检索英语会话类辞典,例如《美国语会话百科》、《英语会话 大全》、《现代英汉生活用语图解词典》,请选择,哪种检索途径才 能够同时查出这3本书? 【选项】 A.用关键词“会话”和“词典” B.用中国图书分类号H319.9-61 C.用书名“英语会话”和“大全” D.用书名“英语会话”和“词典”
计算机检索系统
利用光盘作为储存 介质,通过计算机 对光盘数据库的读 取实现检索
光盘数据库
网络数据库
常 规 检 索 方 法
常规法:利用常规检索工具查找有关文献,使信息时代 应该掌握的最基本的方法
顺查、倒查、时间抽样
引文法:利用文献后附的参考文献、相关书目、推荐文 章或引文注释查找相关文献
交替法
学科门户
制定步骤 2 根据检索目的选择数据库 数据库的类型
数据库的内容
数据库的收录范围 数据库的实时性 数据库的价格
一般来说,选择数据库应遵循以下几条原则: (1)根据检索目的确定所需数据库的类型
(2)根据信息需求的内容、专业范围选择数据库
(3)根据记录来源选择数据库
(4)根据熟悉程度选择数据库
1) 开始某一项科学研究或承接某项工程设计,需要对课题进行全面的 文献普查,并从中筛选出所需的资料,用以编写可行性报告、计划任务书 等。 对这样的课题,应选择一个年限比较长的,收录比较广泛的相关专业 的二次文献数据库,在全面回溯检索的基础上,选出相关的文献,再获取 一次文献。 2) 为解决某个技术难题,查找关键性的技术资料。 对这样的课题,应选择工程和技术类数据库或专利数据库。 3) 为贸易与技术引进、合资谈判,了解国外市场、产品与公司的行情。 查找科学数据库以了解技术的先进性,查找市场、产品、公司等商情 数据库以对手的情况。 4) 为申报专利或鉴定成果,查找参考依据。 以选择国内外专利数据库为主。 5) 为某项决策查找有关情报。 根据决策的不同性质,进行综合性的全面文献调研,涉及到科学研究、 技术研究、产品、市场等最新发展动态。 6) 为撰写论文查找相关文献等。 以期刊论文、学位论文等学术研究性的数据库为主。
用于限定词与词之间的位置关系,以提高查准率。 当检索词为词组形式时,或两个检索词之间可能被禁 用词或标点符号隔开时,均应使用位置算符。
位置算符举例
(W) 算符 例: real(w)estate 检出 real estate
位置算符
(N) 算符 例:fiber? ?(n)optic? 检出 fiber optics optical fibers
检索系统的检索功能
1 逻辑检索
逻辑“与”: AND 逻辑“或”: OR 逻辑“非”: NOT
检索系统的检索功能
2 截词检索
一种常用的模糊检索方法,是指在检索时使用词的 一个局部(某些位置上的字符被截去)进行检索,凡 满足这个词局部中的所有字符(串)的记录,均为命 中结果。
截词检索需要使用专门的符号(截词符)以指定截词
按截断的字符数量分:
截词符
注意:不同的检索系统有不同的规则定义
有限截
??
例:process??
??sses 等 检出 process processes processing procession 等
截词符
无限截
?
例: prevent?
检索语言
分类 2 主题语言/索引
依照文献的主题概念而编制的索引体系,其内 容一般按照主题词字的顺序排列。如《工程索 引叙词表》
主题语言
关键词语言
叙词语言
代码语言
叙词表可分两类:综合性的和专业性的。综合性叙词表中比较有影 响的是美国《工程与科学主题词表》和《日本科学技术情报中心主 题词表》;专业性叙词表有美国的《航空和航天局主题词表》、 规范化科学名词来标引信息主题概 《国际核情报系统主题词表》、英国的《电机工程师协会主题词表》 等。中国有60余部叙词表,其中综合性叙词表有《汉语主题词表》 念并排列组织信息的一种人工语言。 和《国防科学技术主题词典》;专业性叙词表有《航空科技资料主 题词表》、《电子技术汉语主题词表》、《化学工业主题词表》等。
……
检索方法
直接检索
多次检索 回溯检索 跟踪检索 综合检索
检索策略
广义 指为实现检索目的而制定的全盘计划和检索 方案,是对整个检索过程的指导和谋划;
狭义 指输入计算机的检索式。
事实上,在构造检索策略过程中,要涉及到许多方面的知识与技能。如对检索课题 的明确程度,对检索课题的分析;对数据库及其系统特性和功能的掌握;编制逻辑 检索式的技巧以及调整检索策略的方法等方面都会影响用户检索的整体效果。因此 制定检索策略是一种全面的知识与技能,也是一种经验.掌握了这种技能和经验,再 通过广泛实习,可以获得比较好的检索效果。
2 依据用户使用信息的目的不同
撰写论文的信息检索、学科建设和学科研究的信息检索 生产开发的信息检索、回答或解决问题的信息检索
对已知文献的查找
目录式
印刷型检索工具
以印刷本为主体的检索工具, 按揭是文献内容的深度分为:
索引式 文摘式
检 索 工 具
联机检索
计算机检索系统
使用计算机系统对信息资料进 行储存的一种检索方式