药学信息资源检索:计算机信息检索基础
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其作用是扩大检索范围,提高查全率
逻辑非:是一种具有概念排除关系的组配
用NOT (not)或 -算符表示 A NOT B:表示检索含有检索词A而不含检索
词B的信息。即在含有A检索词的文献中去除 含有B检索词的文献。
例如:查找有关“非儿童白血病”的文 献,检索式可写成:
白血病 NOT 儿童
其作用Biblioteka Baidu缩小检索范围,提高查准率。
不良反应文献的检索表达式; 阿司匹林 AND (合成 OR 不良反应) (2)非高效液相法进行阿司匹林含量测定的
研究文献的检索表达式。 (阿司匹林 AND 含量测定) NOT 高效液相
1.2、截词检索
截词检索就是用截断的词的一个局部进行的检索, 并认为凡满足这个词局部中的所有字符(串)的文 献,都为命中的文献。
prepared等所有以prepar开头的单词。
检索终端
服务器(数据库终端)
通信网
INTERNET
结果返回
结果输出
第二部分 数据库结构和类型
数据库结构 数据库类型
数据库的结构
数据库通常由若干个文档组成,每个文 档又由若干个记录组成,每条记录则包 含若干字段。
文档(file)是数据库中一部分记录的有序集合。 记录(record)是数据库的信息单元,每条记录描述
了一个原始信息的外部特征和内部特征。 字段(field)是比记录更小的单位,是组成记录的数
据项目即外部特征和内部特征等。
比如:某药物文献的数据库
所有有关奥美拉唑的文献收入同一文档, 那么文档中收录的每篇文献信息是就是一 条记录(题录或题录摘要);而篇名、著 者、出处、摘要、关键词等描述文献的外 部特征和内部特征就是一个个字段。
全文数据库(Full Text Database)
存储的是原始文献的全文。
全文检索可直接获取原始资料,而不是书目检 索时的线索,提高了用户的检索效率。
如:中国期刊全文数据库、万方数据库、维普 数据库等全文数据库
超文本型数据库
存储声音、图象和文字等多种信息。 如美国的蛋白质结构数据库PDB,该数据
(23259) (619)
其作用是缩小检索范围,提高查(准52) 率。
逻辑或:是一种具有概念并列关系的组配
用OR(or)或 +算符表示 A OR B:表示让系统查找含有检索词A或B,或同 时包括检索词A和检索词B的信息。
如:查有关 “肿瘤”的文献,检索式可写 成:
cancer OR tumor OR neoplasm
数值数据库 (Numeric Database)
主要包含的是数字数据,如各种统计数据、 科学实验数据、科学测量数据等。
例如医学上使用的化学制剂、药物的各种理化 参数、人体生理上的各种数值,人口统计数据 都可收入数值数据库。
美国国立医学图书馆编制的化学物质毒性数据 库RTECS,包含10万多种化学物质的急、慢性 毒理实验数据。
许多书目数据库是印刷型文献检索工具的机 读版,如MEDLINE、IPA等
指南(事实)数据库
(Fact Database)
存储的是用来描述人物、机构、事物等信息的 情况、过程、现象的事实数据。
如名人录、机构指南、大事记等,均可归入事实 数据库。
美国医生咨询数据库PDQ:能提供有关癌症治疗和 临床实验的相关病因、诊断标准、治疗方案以及 最新研究进展等信息。
在一个检索式中如果含有两个以上的布 尔逻辑符要注意运算次序:
()>NOT>AND>OR
例如:
(1) Vitamin A OR Vitamin C AND 合成 (2)(Vitamin A OR Vitamin C )AND 合成
逻辑与 逻辑或 逻辑非
逻辑与 逻辑或 逻辑非
练习:
利用布尔逻辑检索技术,写出检索 (1)阿司匹林的合成文献以及有关报道它的
缺点:收费;有时间限制回溯性差,无法 查久远的文献。
计算机信息检索的发展阶段P125
脱机批处理检索阶段(1954-1964) 联机检索阶段(1965- ) 光盘检索阶段(1980- ) 网络化检索阶段(1995- )
计算机检索系统:检索者,检索终端(PC机,同时也是
输出端),网络(或通信电缆),数据库存储服务器
计算机信息检索基础
主要内容
第一部分 计算机检索概述 第二部分 数据库结构和类型 第三部分 检索技术和检索策略
第一部分 计算机检索概述
计算机检索的基本原理
计算机信息检索------是指利用 计算机对信息进行存储与检索。
计算机信息检索的特点 与手工信息检索相比, 机检具有如下的优点:
检索速度快 检索途径多 更新快 资源共享 检索更方便灵活 检索结果可以直接输出
库可以检索和观看蛋白质大分子的三维结 构。
第三部分 检索技术与基本程序
P131
检索技术
检索策略
一、检索技术 P131
1.布尔逻辑检索 2.截词检索 3.位置运算检索 4.字段限定检索
不同的检索系统表示方法不尽相同,以美国 DIALOG检索系统(具有代表性)使用的为例 。
1.1、布尔逻辑检索
有了检索字段可以检索出该文档的所有记 录。
数据库的类型
按照数据库所含信息的内容划分:
书目(文摘)数据库 指南(事实型)数据库 数值型数据库 全文数据库 超文本型数据库
书目(文摘)数据库
(Bibliographic Database)
存储的是二次文献,包括文献的外部特征、题 录、文摘和主题词等,检索结果是所需文献 的线索而非原文。
通常用于西文检索中。主要用于检索词的单复数、 词性的词尾变化、词根相同的一类词,以及同一词 的拼法变异等。
通用的截词符有:?和*
?代表一个字符(属有限截断);*代表不定个
字符(属无限截断)
如:wom?n 可查到woman 和 women
prepar *,可查到prepare, prepartion,
在检索过程中用于表达词于词之间 的逻辑关系的算符就称为布尔逻辑运 算符。
分为三种布尔逻辑运算符: 逻辑与、逻辑或、逻辑非
逻辑与:是一种概念交叉或概念限定关系的
组配。
用“AND(and)”或“*” 算符表示
A AND B:表示让系统检索同时包含检 索词A和检索词B的信息
例如:查有关“雷尼替丁的含量测定”的文献,检索式可写成: 雷尼替丁 AND 含量测定
逻辑非:是一种具有概念排除关系的组配
用NOT (not)或 -算符表示 A NOT B:表示检索含有检索词A而不含检索
词B的信息。即在含有A检索词的文献中去除 含有B检索词的文献。
例如:查找有关“非儿童白血病”的文 献,检索式可写成:
白血病 NOT 儿童
其作用Biblioteka Baidu缩小检索范围,提高查准率。
不良反应文献的检索表达式; 阿司匹林 AND (合成 OR 不良反应) (2)非高效液相法进行阿司匹林含量测定的
研究文献的检索表达式。 (阿司匹林 AND 含量测定) NOT 高效液相
1.2、截词检索
截词检索就是用截断的词的一个局部进行的检索, 并认为凡满足这个词局部中的所有字符(串)的文 献,都为命中的文献。
prepared等所有以prepar开头的单词。
检索终端
服务器(数据库终端)
通信网
INTERNET
结果返回
结果输出
第二部分 数据库结构和类型
数据库结构 数据库类型
数据库的结构
数据库通常由若干个文档组成,每个文 档又由若干个记录组成,每条记录则包 含若干字段。
文档(file)是数据库中一部分记录的有序集合。 记录(record)是数据库的信息单元,每条记录描述
了一个原始信息的外部特征和内部特征。 字段(field)是比记录更小的单位,是组成记录的数
据项目即外部特征和内部特征等。
比如:某药物文献的数据库
所有有关奥美拉唑的文献收入同一文档, 那么文档中收录的每篇文献信息是就是一 条记录(题录或题录摘要);而篇名、著 者、出处、摘要、关键词等描述文献的外 部特征和内部特征就是一个个字段。
全文数据库(Full Text Database)
存储的是原始文献的全文。
全文检索可直接获取原始资料,而不是书目检 索时的线索,提高了用户的检索效率。
如:中国期刊全文数据库、万方数据库、维普 数据库等全文数据库
超文本型数据库
存储声音、图象和文字等多种信息。 如美国的蛋白质结构数据库PDB,该数据
(23259) (619)
其作用是缩小检索范围,提高查(准52) 率。
逻辑或:是一种具有概念并列关系的组配
用OR(or)或 +算符表示 A OR B:表示让系统查找含有检索词A或B,或同 时包括检索词A和检索词B的信息。
如:查有关 “肿瘤”的文献,检索式可写 成:
cancer OR tumor OR neoplasm
数值数据库 (Numeric Database)
主要包含的是数字数据,如各种统计数据、 科学实验数据、科学测量数据等。
例如医学上使用的化学制剂、药物的各种理化 参数、人体生理上的各种数值,人口统计数据 都可收入数值数据库。
美国国立医学图书馆编制的化学物质毒性数据 库RTECS,包含10万多种化学物质的急、慢性 毒理实验数据。
许多书目数据库是印刷型文献检索工具的机 读版,如MEDLINE、IPA等
指南(事实)数据库
(Fact Database)
存储的是用来描述人物、机构、事物等信息的 情况、过程、现象的事实数据。
如名人录、机构指南、大事记等,均可归入事实 数据库。
美国医生咨询数据库PDQ:能提供有关癌症治疗和 临床实验的相关病因、诊断标准、治疗方案以及 最新研究进展等信息。
在一个检索式中如果含有两个以上的布 尔逻辑符要注意运算次序:
()>NOT>AND>OR
例如:
(1) Vitamin A OR Vitamin C AND 合成 (2)(Vitamin A OR Vitamin C )AND 合成
逻辑与 逻辑或 逻辑非
逻辑与 逻辑或 逻辑非
练习:
利用布尔逻辑检索技术,写出检索 (1)阿司匹林的合成文献以及有关报道它的
缺点:收费;有时间限制回溯性差,无法 查久远的文献。
计算机信息检索的发展阶段P125
脱机批处理检索阶段(1954-1964) 联机检索阶段(1965- ) 光盘检索阶段(1980- ) 网络化检索阶段(1995- )
计算机检索系统:检索者,检索终端(PC机,同时也是
输出端),网络(或通信电缆),数据库存储服务器
计算机信息检索基础
主要内容
第一部分 计算机检索概述 第二部分 数据库结构和类型 第三部分 检索技术和检索策略
第一部分 计算机检索概述
计算机检索的基本原理
计算机信息检索------是指利用 计算机对信息进行存储与检索。
计算机信息检索的特点 与手工信息检索相比, 机检具有如下的优点:
检索速度快 检索途径多 更新快 资源共享 检索更方便灵活 检索结果可以直接输出
库可以检索和观看蛋白质大分子的三维结 构。
第三部分 检索技术与基本程序
P131
检索技术
检索策略
一、检索技术 P131
1.布尔逻辑检索 2.截词检索 3.位置运算检索 4.字段限定检索
不同的检索系统表示方法不尽相同,以美国 DIALOG检索系统(具有代表性)使用的为例 。
1.1、布尔逻辑检索
有了检索字段可以检索出该文档的所有记 录。
数据库的类型
按照数据库所含信息的内容划分:
书目(文摘)数据库 指南(事实型)数据库 数值型数据库 全文数据库 超文本型数据库
书目(文摘)数据库
(Bibliographic Database)
存储的是二次文献,包括文献的外部特征、题 录、文摘和主题词等,检索结果是所需文献 的线索而非原文。
通常用于西文检索中。主要用于检索词的单复数、 词性的词尾变化、词根相同的一类词,以及同一词 的拼法变异等。
通用的截词符有:?和*
?代表一个字符(属有限截断);*代表不定个
字符(属无限截断)
如:wom?n 可查到woman 和 women
prepar *,可查到prepare, prepartion,
在检索过程中用于表达词于词之间 的逻辑关系的算符就称为布尔逻辑运 算符。
分为三种布尔逻辑运算符: 逻辑与、逻辑或、逻辑非
逻辑与:是一种概念交叉或概念限定关系的
组配。
用“AND(and)”或“*” 算符表示
A AND B:表示让系统检索同时包含检 索词A和检索词B的信息
例如:查有关“雷尼替丁的含量测定”的文献,检索式可写成: 雷尼替丁 AND 含量测定