计算机文献检索基础

合集下载

文献检索基础知识

文献检索基础知识
文献检索基础知识;中文信息计算机检索及实习;外文信息 计算机检索及实习;专利等特种文献信息检索及实习;事实 数据型信息检索及实习;书目信息检索及原文的获取; 综合 考查。
• 检查考核:出勤率(15%),作业练习(实习报告3份) (30%);综合考查(55%)
第一节 基础知识
一、文献、信息的定义
1、定义
辅助字段种类很多,且随数据库的不同而各有差异。
3 、数据库的结构
记录:几个不同字段的集合构成记录,每 条记录所包含的字段并不一定完全相同, 但一个数据库内的记录往往含有相同的 字段。 每条记录相当于文摘型或题录型检 索刊物的一条著录款目。
• 科技报告 Sci-Tech Report • 专利文献 Patent Document • 会议文献 Conference paper:Proceedings, Compilation, Collected paper, Records... • 学位论文 Dissertation, Thesis • 标准文献,产品资料, 技术档案,政府出版物
科技报告
目的:向上级主管部门汇报 特点:每份单独成册,有专门的编号;
内容具体:有科研项目的研究方 案,实验记录,实验数据,图表等; 报道比期刊早; 保密或控制发行。
technical report
识别标志:报告号(机构名+顺序号)
世界上著名的科技报告有:
PB--美商业部NTIS AD--美军事国防部 NASA--美宇航局 DOE--美能源部 这四大报告每年公开和解密部分约6万件。 科技人员对科技报告的需要量约占其全部文献 量的10%-20%,特别在是发展迅速、竞争激烈的高科 技领域。
声像型 (视听型) Audio-Visual form:

文献信息检索基础知识

文献信息检索基础知识
索书号
1=Biblioteka 主题语言:用自然语言中的名词、词组、句子描述文 献主题概念的检索语言。 主题词:表达文献主题概念的词叫主题词 。当使用主题词来表达文献内容特征时叫主题标引(标识)。 主题语言的优点: 直观 符合人的辩识习惯 专指性强 主题词标识经过严格的规范化处 理,查准率高。 灵活 词与词的概念组配揭示文献中各种主题。 集中性 将不同学科的同一主题文献集中在一起。 例如有关“鲁迅”的文献资料,分类法将其 分散在文学、艺术、文化、历史各个门类 查找费时,而主题法在“鲁迅”标题下,直接 反映出全部有关“鲁迅”的文献资料。
3种逻辑关系的区别
逻辑算符
AND(与)
OR(或)
NOT(非)
检索式
A AND B A * B
F250 物资经济理论 F251 物资管理 F252 物资流通 F253 物资企业 经营与管理 F259 世界各国 物资经济
F251.1 物资管理 体制 F251.2 物资计划 F251.3 物资统计
分类号
类名
+
类目
F251.3 /1 或F251.3 “1”种次号
信息的基本属性
二、基本概念: 1、信息(information)的概念:信息是事物的存在的形式和运动状态的表征 。
知识性或客观性 记录和传播性
目录
CONTENTS
01
信息存储
Add a title
02
Add a title
一次文献:论文等 二次文献:目录、文摘、索引 三次文献:字词典、百科、年鉴
《汉表》 主表的著录格式(例2) Tian zhu ren 天竺人 Sindus; Sindhus “用”项 Y 古印度人 词族索引(例3) 族首词 法(法律) * 一级下位词 . 国际法 04LA 二级下位词 . .国际公法 三级下位词 . . .海洋法

第一章_文献检索基础知识(重点讲)

第一章_文献检索基础知识(重点讲)
国际标准书号由4段10位数字组成。中国标准书 号由两部分组成:第一部分是国际标准书号(ISBN); 第二部分是图书分类名和种次号,以斜线分割。如: ISBN 7-03-006493-3/TP•927。
国际标准书号ISBN:
第一段:组号,是国家、地区、语言的代号,中国 的组号为“7”;
第二段:出版社号,由2~6位数字组成,是出版社的 代号。如北京大学出版社的社号为301; 第三段:书序号,由2~6位数字组成,表示某种图书 在某出版社的对应流水号; 第四段:校验码,由一位数字组成。
特点:
1 学科性 4 相对性 2 集中性和代表性 5 累积性 3 动态性 6 权威性和实用性
《中文核心期刊要目总览》
同行评审是国外高水平期刊对来稿评审普遍采取的 方式。
作者将文稿寄交编辑部,初审合格后,将论文稿 件送交有关专家(即同行)进行审阅。同一篇稿件同 时送给若干个专家审阅,一般3-4名。专家将稿件评语 反馈给编辑部或作者本人。
9)产品技术资料:
又称产品样本,指产品目录、产品样本和产品说 明书一类的厂商产品宣传和使用资料。
产品样本是为推销产品而印发的企业出版物,对定型产品 的性能、构造、用途、用法和操作规程等作具体说明,内容成 熟,数据可靠,有的有外观照片和结构图,可直接用于产品的 设计制造中参考。
10)技术档案:
指企业或机构在科研生产中形成的技术文件、 图纸、原始记录等。
43值和权值和12大于大于9命中命中计算机应用计算机应用权值和权值和9等于等于9命中命中软软件件权值和权值和8小于小于9不命中不命中信息检索目标的确定选用合适的信息检索工具和检索系统确定检索方法常用追溯分段使用适当的检索语言描述文献内部特征的语言外部特征语言构造检索表达式上机检索整理检索结果并对检索效率进行评价查全率查准率54文献检索的步骤文献检索的步骤731确定检索目标确定检索目标要进行信息检索首先必须确定信息检索的目标即对信息用户的需求进行具体的分析这种分析应主要包括以下内容

计算机检索基础知识

计算机检索基础知识

14
这个阶段文献信息数据库不论从种类还
是规模上都远远超过了以往各个阶段, 全文数据库、多媒体数据库更是其中的 佼佼者;文献信息检索不再是单位内部 联机检索,价格昂贵的国际联机检索, 而是通过各个接入网、交换网检索互联 网各结点上的服务器的各类信息。
15
三、计算机信息检索的服务方式
计算机检索系统按其服务功能可分为回溯检索、定题
16
2、定题检索(Selective Dissemination of Information,SDI) 定题检索服务是根据用户检索课题的内容,一次性输 入事先确定好的检索提问式保存在检索系统中,检索 系统根据数据库更新周期,定期地对保存的检索提问 式进行检索,将检索出的最新文献信息提供给用户。 定题检索服务对于长期追踪某一领域的新颖信息很适 合。 3、人机对话检索 这是用户以交互方式直接访问系统及数据库、在线实 时进行的检索。用户一旦输入检索提问,计算机检索 系统就可立即执行,并在用户终端显示屏上输出检索 结果。
33
4、限制检索
限制检索是通过限制检索范围,达到优化检索结果的
方法。限制检索的方式有多种,例如:进行字段检索、 使用限制符、采用限制检索命令等。 1)字段检索 它是把检索词限定在某个/些字段中,如果记录的相应 字段中含有输入的检索词则为命中记录,否则不中。 例如:查找微型机和个人计算机方面的文章。要求 “微型机”一词出现在叙词字段、标题字段或文摘字 段中,“个人计算机”一词出现在标题字段或文摘字 段中,检索式可写为:microcomputer?/de,ti,ab OR personal computer/ti,ab
31
(2)按截断的字符位置划分: 前方一致:允许词尾有变化。如“Textile?”可 同时检出含有Textile和Textiles的文献。 后方一致:允许词头有变化。如“*polymer”可 同时检出含有有Homopolymer,Copolymer等词的 文献。 中间一致:词头、词尾都可变化。如: “*Wave*”可检出含有 wave,waves,wavelet,microwave,wavelength等词 的文献。 中间屏蔽:允许中间的某些字母有变化。如: “Fib??s”相当于查出含有Fibers和Fibres的文献

文献检索基础知识

文献检索基础知识
• 是采用录音、录像、摄影、摄像等手段,将声音、图像等 多媒体信息记录在光学材料、磁性材料上形成的文献,也 称视听型文献,如音像磁带、唱片、幻灯片等。 • 直接记录声音、图像、影视、动画
• 生动、形象、直观 • 唱片、录音(象)带、影视片
• 多媒体,集合声频和视频
2.1.4 电子型 (Electronic Document)
三次信息源内容更集中,针对性更强,系统性好,并有一 定的检索功能,参考价值较大。

从零次文献、一次文献、二次文献到三次文献,是一个由 分散到集中,由无序到有序,由博而精的对知识信息进行不 同层次的加工过程。它们所含信息的质和量是不同的,对于 改善人们的知识结构所起到的作用也不同。
二次文 献
三次文献
• 图书参考文献著录格式:
著者.书名[M].版本(第1版不标注).出版地:出版者,出版 年.引文所在的起止页码.
• [1] 刘荫铭,李金海,刘国丽等编著.计算机安全技术[M]. 北京:清华大学出版社,2000
外文图书的识别:
作者
编辑
Gong, Victor, and Norman Rudnick, Eds. AIDS: Facts and Issues. New Brunswick: Rutgers UP, 1986.
知识:
人类在改造客观世界实践中所获得的认识和经验的总和,是信息的一部分。 它必须借助于文字、语言、符号、代码、电磁波、图像和实物加以表现。
二 文献的类型
按载体介质划分: 书本型资料(book type),也称印刷型; 非书资料(non-book type),包括缩微型、声像型和机读型。 按信息的加工深度和功能划分:
2.1.1 纸张型(Paper Document)

文献检索基础知识(检索过程).ppt

文献检索基础知识(检索过程).ppt
? 期刊 ? 优点:周期短,信息量大(学术论文举例)
? 科技报告 ? 研究人员经过对某个专题进行研究后撰写的研究报告。 ? 有密级,发行范围严格控制
? 会议文献 ? 在各类学术会议上产生的会议论文集 ? 比期刊还能及时的反映最新学术动态
? 专利文献(举例) ? 将科技信息与法律信息融为一体的,具有明显知识产权特征的文献资料 ? 专利类型:发明专利、实用新型专利、外观设计专利
第8页
第三讲 文献检索基础知识
?一、信息资源概论 (续)
?2、信息资源的分类(续)
? (3)按出版形式划分(续)
? 政府出版物 ? 由各级政府出版发行的文献。例如政府法令、方正政策等 ? 便于了解国家、各级政府的方针政策、发展规划、产业政策等 ? 例: 滨州市人民政府公报 ? 政府网站: ? / ? / ? /
? 产品资料 ? 产品说明书等
? 报纸 ? 新闻报道、评论等 ? 信息量大,实时性强。
第9页
第三讲 文献检索基础知识
?二、 信息资源检索
?1、 信息资源检索的概念
? 信息检索:
? 将信息按一定的方式组织和存储起来,并根据用户需求找出相关信息的过程。
? 包含两个方面:
? 信息的组织和存储 ? 信息查找
? 三次信息资源 ? 对一、二次信息资源进行综合分析、评价,进一步综合、浓缩形成的信息资源。 ? 例如:词典、年检、百科全书等 ? 三次信息资源的特点是:高度综合、信息量大。
? 零次信息资源 ? 非公开发行的信息资源( 以上一、二、三次信息资源均指公开发行的信息资源)。 ? 例如:手稿、笔录等。
第4页
第7页
第三讲 文献检索基础知识
?一、信息资源概论 (续)
?2、 信息资源的分类(续)

文献检索-第二章__文献检索基本知识

文献检索-第二章__文献检索基本知识

Z——综合性图书
O 数理科学和化学 (一级类目) O1 数学 (二级类目) O3 力学 O4 物理学 O6 化学 O61 无机化学(三级类目) O611 化学元素与无机化合物 (四级类目)

图书馆图书的排架与查询:

图书是按索书号排列在书架上的 图书查询先确定索书号 索书号:由图书分类号和书次号组成;分类号在上,书 次号在下。


⑶事实检索
事实检索以特定客观事实为检索对象,检索结果是某一具体 的、客观存在的事实。 如:查找“前事不忘、后事之师”最早的出处。

信息检索的类型

按照检索方式的不同,分为手工检索和计算机检索。

手工检索:用人工来处理和查找所需信息的检索过程。主要 依靠印刷型的二次文献,如文摘、目录等。
计算机检索:利用计算机和一定的通信设备查找所需的信息。 如联机检索和网络检索。
(2)主题途径
从文献中抽选出来的,代表文献内容实质词 汇——主题词,包括关键词、标题词、叙词等作 为检索标识,进行文献检索的一种途径。
(3)著者途径
根据已知文献著者(作者)的姓名来查找 文献的途径。
(4)名称途径
根据文献的名称来查找文献的途径。如: “书名目录”、“刊名目录”。
(5)序号途径
以文献的编号为特征编排和检索文献的途 径。如:“专利号索引”、“报告号索引”等。
(6)其他途径
有些检索工具还附有一些特殊索引,可提 供从特殊途径查找所需文献的线索。如《CA 》中的分子式途径、环结构式途径等。
3、文献的检索步骤
(1)分析研究待查课题
检索的目的是什么? 课题属于什么学科专业? 需要什么类型的文献?(中文,外文文献) 所需文献的年代范围等 另外,还需要了解与检索课题相关的专业背景知 识、有关的专业名词、术语等。

计算机检索基础知识(3)

计算机检索基础知识(3)
计算机检索步骤(检索策略)
(1)分析检索课题,明确检索需求。 (2)选择信息源(图书馆订购的资 源、网上免费资源)。 (3)确定检索标识,选择检索项。 (4)编写检索提问式。 (5)实施检索并调整检索策略。 (6)输出检索结果。
计算机检索基础知识
1.了解数据库的类型; 2.选择合适的数据库; 3.选择恰当的检索词(检索项); 4.计算机检索中常用的运算符; 5.计算机信息检索策略的制定与调整。
用户行为分析在搜索引擎中的应用
主题字段:用户行为分析 并含 搜索引擎
根据查得的中文文献扩展英文关键词
检索式及检索结果
379 records in Compendex for 19692012 (((Search Engine ) WN All fields) AND ((User Behavior Analysis ) WN All fields))
数据量(记录数) 文种 更新频率 访问模式(口令,IP控制) 其它信息:帮助信息、出版者、发行者、在同行中的地位。
如何了解一个数据库样例:超星数字图书

国内重要的数字图书之一 服务形式:WEB/镜像 涵盖学科或主题范围:所有学科 文献类型(出版形式、内容层次等): 电子图书,全文(一次文献)
1.数据库的类型
记录的收录格式
记录的内容类型
记录的出版类型
书目(Catalogue) 摘要(abstracts) 全文(full text) 文献(Document) 数据(Data) 事实(Fact) 图书、期刊论文、会议论 文、学位论文、标准文献、 专利文献等。
计算机检索基础知识
1.了解数据库的类型; 2.选择合适的数据库; 3.选择恰当的检索词(检索项); 4.计算机检索中常用的运算符; 5.计算机信息检索策略的制定与调整。

第二章文献检索基本知识

第二章文献检索基本知识

检索工具的形式:
书本式检索工具
期刊式:连续性,具有期刊的出版特点 单卷式:独立性,以一定的专题为内容 附录式:不单独出版,附于书刊之后
卡片式检索工具:(很少用)
缩微式检索工具:(很少用)
机读式的检索工具:(磁带等已很少用)现在常用的检索 工具如
网络、光盘数据库等
检索工具的类型:
、目录型检索工具:按一定次序编排,仅提供检索线索
是否有一部优秀的综合性的百科全书,常常是 衡量一个国家科学文化发展水平的尺度
百科全书由若干条目组成。条目是百科全书的基本知识 单元,是独立的概念或完整的知识主题。也是基本的检 索单元。
条目一般包括条头、释文、参考书目
此外还有前言、插图、附录(如大事年表)和索引等
现代百科全书的特点:
、概述知识条目化
例如:
马、列、毛、邓
哲学、宗教
农业科学
工业技术
无线电电子学电信技术
半导体技术
中国图书馆分类法(中图法)
基本大类 马 列哲

工业技术

综 合
毛学


邓宗

教 一般工业技术




业油



工程 工程 工程 … 测
基础 设计 材料

科学 与绘 学


天 然

工 程



工程材料一 金属材 … 耐腐蚀材
般性问题
常见的几种目录型检索工具 )国家书目:是一种不加选择地记载一个国家出版的全部图书的目
录,可反映一个国家的出版业水平 )馆藏目录:同图书馆、情报所等单位自己编制的本馆藏书、资料

计算机检索基础

计算机检索基础
是指对有关的一次文献和二次文献进行广泛深入
的分析研究之后综合概括而成的产物,具体包括 各种述评、综述、或进展性出版物,各种字典、 词典、手册(教科书)、百科全书、年鉴以及文 献指南(或书目指南)等。
1.3 文献的主要类型
印刷型、缩微型、声像型和电子型 文献是以载体的物理形态区分的四种文献类型。
1. 印刷型
2.7 政府出版物
政府出版物是各国政府部门及其所属机构所发表的
文件。可分为行政性文件和科技文件两大类。
政府出版物对了解一个国家的科学技术和经济政策
及其演变情况。有一定的参考价值。
2.8 学位论文
是高等学校学生为获得某种学位而撰写的科学论文。
一般有学士论文、硕士论文和博士论文之分。 学位论文的特点是:理论性、系统性较强,内容专 一,阐述详细,具有一定的独创性,是一种重要的 文献信息源。
零次文献一般是通过口头交谈、参观展览、参加报
告会等途径获取,不仅在内容上有一定的价值,而 且能弥补一般公开文献从信息的客观形成到公开传 播之间费时甚多的弊病。
一次文献(primary document)
是指作者以本人的研究成果为基本素材而创作(或 撰写)的文献,不管创作时是否参考或引用了他人 的著作,也不管该文献是以何种物质形式出现,均 属一次文献。一次文献中所记录的情报,一般比较 具体、详尽和系统化。 习惯上也称一次文献为原始文献。图书、期刊论文、 科技报告、会议论文、专利说明书、技术标准以及 部分学位论文等公开发表的文献都属一次文献。另 外,还包括一些不公开发表的文献。如:日记、内 部报告、技术档案等等。
式的长处。 科技会议是公布新的研究成果的重要场所。又是获 得难得文献的重要途径。另外也是及时全面地了解 有关领域发展情况的重要渠道。

计算机检索基本知识

计算机检索基本知识

超文本式:多用于网络信息检索,基于Web技术,可检 索多媒体信息
多为表单形式,有的直接输入检索词即可,如大部 分数据库的高级检索;有的既可输入检索词也可输入检 索式;如维普数据库的标准检索,有的必须输入检索式, 如EI数据库的高级检索。
计算机检索过程
词表
检索课题
主题分析
选择数据库 确定检索词 制定检索式 计算机处理
检索误区2——internet网上虽然有一些较好的资源,但是 与专业的网络数据库来比,无论是质量还是数量上都有 很大的差距,检索文献目前来说最主要的来源还应是专 业数据库,即正规的出版物上发表的文献。仅用搜索引 擎来查找文章 是非常不可取的。 检索误区3——不要忽略摘要数据库, 虽然检索摘要数据库不能马上得到全文, 但是摘要数据库的数据量大,范围广,是查找文章线索 极好的检索工具。就目前的情况而言,不可能全部都能 得到电子版的全文,先找到文章线索再根据线索查找印 刷版的全文是一项不错的组合。
限制检索
泛指检索系统中提供的缩小或约束检索结果的检索 方法。主要有以下方式: 字段检索——利用字段进行限制,如题名、摘要、全文等 通常的字段限制范围的大小顺序是: 题名<关键词<摘要<全文 二次检索——在前一次检索的结果中进行另一概念的检索
所有文章 经过一次检索后 在上一次检索结果 的范围内进行再次 检索
同句检索: 要求参加检索运算的两个检索词必须在同一 自然句中出现。 位置运算符: (S)--sentence 同字段检索:对同句检索条件进一步放宽,可以使用同字 段段检索。 位置运算符为: (F)——field (L)——link
词组的检索:通常用“”或()来表示两词是作为一个词 组来检索的 如:“hypermedia database” ;“profit and loss”将查 找profit and loss 禁用词:通常一些虚词(如冠词和连词不包含在检索范围 之内) 如:a about also and any as at be between by both for some so not this with 等将被自动忽略

第一讲文献信息检索基础知识

第一讲文献信息检索基础知识

(三)不同加工层次的文献信息
一次文献
二次文献
三次文献
按文献 的加工 深度分
一次文献
* 作者以自己的研究成果为基础创作或撰写, 并通过某种渠道而公开的文献;
* 对知识的第一次加工;具有创造性; * 大多数期刊论文、科技报告、学位论文、会
议文献、专利文献、技术档案等。
二次文献
* 对一次文献进行浓缩、整序及加工处理而成 的具有报道和检索作用的文献;
报纸
是以报道新闻及评论 为主,出版周期比期刊 更短,多为活页性连续 出版物。其特点是内容 丰富、信息量大、出版 迅速、发行量大、读者 众多。
科技报告
科技报告是科技工作者对科学、技术研究结果或研 究进展的记录。
科技报告的特点
(1)反映新的科研成果迅速; (2)内容多样化; (3)质量参差不齐; (4)保密性强; (5)每份报告独立成册,有连续编号。
第一讲文献信息检索基础 知识
第一节 信息与信息素养 第二节 科技文献的类型 第三节 信息检索与文献检索工具 第四节 信息检索原理 第五节 信息检索的方法和途径 第六节 信息检索常用技术及检索效果评价
第一节 信息与信息素养
一、信息的基本含义
1、图书馆学和情报学领域,信息被定义为事物 或记录。 2、综合学术界对信息的定义,可以认为信息是 以物质介质为载体,传递和反映世界各种事物存 在方式、运动规律及特点的表征。
美国信息产业协会主席保罗 . 泽考斯基(Paul Zurkowaski)1974年在美国全国图书馆与情报学委 员会上,最早提出了信息素养的概念,他把信息素 养概括为:“利用大量的信息工具及主要信息源使 问题得到解答的技术和技能。”
信息素养为什么重要
在科技飞速发展、信息资源激增的当今时代,信息 素养越来越显示其重要性

计算机检索基础

计算机检索基础

计算机信息检索基础知识一、布尔逻辑与检索功能当人们使用计算机在数据库检索系统或互联网中进行检索时,常常需要用多个概念所对应的多个关键词的组合进行检索,仅用一个概念对应的关键词很难完成复杂内容关系的检索要求。

通常,一个检索要求中涉及到的多个概念之间与布尔逻辑的“与”、“或”、“非”都可以通过分析找到明确的对应关系。

即使用关键词和反应关键词之间关系的布尔逻辑运算符、通配符等相关组配符号(含逻辑算符、优先符即括号、位置算符以及英文检索时常用的截词符或通配符),我们就可以将现实中需要检索的内容或翻译成计算机、网络能够认识的形式或语言,输入到计算机中进行检索,得到我们所要的信息资料,完成检索。

下面简单介绍布尔逻辑中的三个基本运算“与”、“或”、“非”。

1、逻辑“与”计算机检索中“与”逻辑关系的常见表示有:“与”、“AND”、“and”、“*”等。

逻辑“与”关系的含义:表示概念A和概念B之间的相交关系,经过“与”运算处理后的表达式:“概念A”AND“概念B”表示一种同时含有概念A和概念B成份的内容,它已经既不是概念A,也不是单纯的概念B了,该操作使关注的范围缩小了。

如下图所示公共的阴影部分。

例如:概念A=艺术,概念B=舞蹈,则概念A、概念B的“AND”逻辑表达式:“概念A”AND“概念B”也即“艺术”AND “舞蹈”则表示要检索那些既讲艺术同时又提到舞蹈的信息资源,或者主要讲舞蹈同时又提到艺术的文献信息资源。

2、逻辑“或”计算机检索中“或”逻辑关系的常见表示有:“或”、“OR”、“or”、“+”等。

逻辑“或”关系的含义:表示概念A或概念B本身或者两者之间的叠加关系。

经过“或”运算处理后的表达式:“概念A”OR“概念B”表示含有“概念A”或含有“概念B”或两个概念都包含,该操作使关注的范围扩大了。

如下图所示所有的阴影部分。

例如:概念A=艺术,概念B=舞蹈,则概念A、概念B的“OR”逻辑表达式:“概念A”OR“概念B”也即“艺术”OR “舞蹈”则表示要检索那些含有艺术,或者含有舞蹈,或者两者都涉及的文献信息资源。

第二章、文献检索基础知识

第二章、文献检索基础知识

(2)树状结构表: 树状结构表将字顺表中的主题词按照每个 词的词义范畴和学科属性,分别归入15个大类之中,多数 大类又进一步细分多达9 级。每一级类目用一组号码标明, 级与级之间用“.”号隔开。主题词上、下级之间采用逐级 缩进格式表现主题之间的隶属关系,每个主题词都有一个 或两个以上的树状结构号,该号是联系字顺表和树状结构 表的纽带。现摘录片段如下: Nervous System A8 Central Nervous System A8.186 Brain A8.186.211 Prosencephalon A8.186.211.730 Telencephalon A8.186.211.730.885 Basal Ganglia A8.186.211.730.885.105 Corpus Striatum A8.186.211.730.885.105.487 Neostriatum A8.186.211.730.885.105.487.550 Putamen A8.186.211.730.885.105.487.550.784
文献检索包括两方面的内容
一方面是文献线索 文献线索的查找,即如何利用检 文献线索 利用检 索工具的问题; 索工具 另一方面是特定原始文献 特定原始文献的查找,即在查 特定原始文献 找特定的文献线索后,找出原始文献 找出原始文献的过 找出原始文献 程。
文献检索的一般意义
促进素质教育,培养信息意识 避免低水平的重复劳动,全面掌握必要的文献 信息; 节省时间和费用,提高信息利用效率,促进信 息资源的开发; 促进专业学习,加速成才。
书名目录(Title Catalogue) 著者目录(Author Catalogue ) 分类目录(Classified Catalogue) 主题目录(Subject Catalogue )

文献检索课二计算机检索的基础知识

文献检索课二计算机检索的基础知识

–计算机检索系统的类型
1.文献型数据库 文献型数据库是指能直接提供文献线索和文献原文的数 据库,即数据库记录的对象为文献信息时。包括目录型 数据库、题录型、文摘型和全文型数据库。 (1)目录型数据库 是对信息外表特征予以揭示和报道,以整个出版单位或 收藏单位为基本著录单元,如“本”、“种”、“件” 等。著录内容包括书(刊)名、作者、出版年月、出版 地及收藏情况等。可分馆藏目录(如各图书馆的馆藏机 读目录数据库OPAC)、联合目录、出版发行目录等。
1、文献型检索工具 (1)目录 以报道文献出版或收藏信息为主要功能的工具。如《全国总书 目》。 (2)题录 是将图书、报刊等文献中论文的篇目按照一定的排检方法编排 而成,供人们查找篇目出版的工具。如《全国报刊索引》 (3)文摘 以精练的语言把文献信息的重要内容、观点、数据等摘录下来, 并按一定的著录规则与排列方式编排起来,供读者检索使用的一 种检索工具。 2、非文献型检索工具 主要指参考工具书。如词典、百科全书、年鉴、年表、名录等。
• A(nW)B AB两词靠近,次序为A先B后,中间最多可加n个词。 例 如 : communication(2w)satellite , 只 检 索 出 communication satellite 、 communicationsatellite,communication through satellite 、 communication on the satellite词组的记录。
– 选择检索系统
• 主要是根据课题的检索要求选择合适的检索工具或数 据库,如: 查找图书可用OPAC书目数据库;查学科术语或数 据等可用事实型数据库、参考工具书或网络搜索引擎; 撰写学位论文、申请研究课题,需要了解研究对象的 历史、现状和发展,要求检索文献全面、彻底,检索 覆盖的年份也较长,尽可能选用一些收录年份较长的 综合型和专业数据库。 • 考虑权威性数据库; • 数据库的学科专业范围是否与课题的学科相吻合; • 需要的是题录、文摘信息还是全文信息,还是事实、 图形、数据等; • 数据库收录的文献类型、年限、更新周期,所需文献 信息在国别和语种是否符合检索需求等。

第二章 计算机检索基础1

第二章 计算机检索基础1

广义上包括存储和检索两个过程
狭义仅指检索过程
计算机检索发展简史
脱机
1954年
联机
国际联机
网络检索
光盘
80年代中期
1.脱机检索(50年代末~60年代中期 )
• 计算机检索的原始时期,计算机由电子管组成,主要存储介质是磁带、 磁鼓,只能进行简单的检索。 • 专业检索人员定期批量处理用户的情报要求 • 用户不能立刻获得检索结果
• 检索结果为题名,作者,文摘等。
• 在脱机检索阶段,计算机主要进行文献目录、索引、文摘等前处理工作。
2.联机检索(60年代末~70年代初)
• 1963年-1964年间,美国洛克希德导弹与宇航公司的情报实验室建立了” 人-机“对话的联机情报检索系统(DIALOG的前身),此后在60年代末 到70年代初联机检索系统得以快速发展。国际著名的DIALOG系统、 ORBIT系统、MEDLINE系统都是从这个时期发展起来的。 • 多个检索终端,通过通讯线路与联机检索系统中央计算机(主机)联接 • 利用分时技术,使多个用户可同时与主机以“对话”方式进行检索 • 用户可随时浏览检索结果
检索系统中央计算机直接进行“ 人-机对话”,查找世界各国的情报
文献资料。 • 联机检索系统进入发展的黄金时期。
4.光盘网络检索(90年代-)
• 以太网技术的出现推动了网络版光盘数据库的出现。 • 光盘网络是一种计算机网络,如图书馆局域网 • 实现多用户光盘资源共享 例如:美国“化学文摘”(CA)从1987-1991年的五年累积索引(含文摘)
面使网络信息资源的内容从单一的书目到图文并茂的多媒体,更富有吸 引力和使用价值;另一方面,超文本的广泛利用改变传统的信息组织的
线性方法,使电子资源的组织更接近于“自然”,大大方便了用户的使

2.1.1 计算机检索基础知识.

2.1.1  计算机检索基础知识.

“计算机 AND 图书馆”
A CB
A and B 逻辑“与”运算
是用来组配具有同义或同族概念的词。如:检索提问式: “A OR B”或“A + B”其含义:是数据库记录中任何一条 记录,只要含有“A”或“B”中任何一个检索词即为命中的 文献。
“OR”的作用是扩大检索范围,
增加命中文献量,提高文献的
是一种概念相交和限定关系的组配。例如:“A AND B”
“A*B”,其含义:是检出的记录中必须同时含有“A”和“B”
两个检索项。
“AND”算符的作用是对检索词加以限定,逐步缩小检索范围, 提高检索结果的查准率。例如检索“计算机在图书馆中的应用” 方面的文献,其检索式可写成:
“计算机 * 图书馆”或
enzymes
color
enzymatic
colour
enzymic
grain$ 可查找:
Hof*man* 可查找: grain
Hofman
grains
Hofmann
Hoffman
Hoffmann
多通配符示例 organi?ation* 可 查找:
organisation organisations organisational organization organizations organizational
前截断:截词符放在被截词的左边,可与后截断一同使 用。例如输入*ware,可检software、hardware等。截 词符号可代表一个或以上字符。
()>NOT>AND>OR
如: 信息OR情报 NOT 经济 (信息OR情报)NOT 经济 检索结果不同。
所有可以使用单词和短语的检索字段均可以使用截 断运算符或通配符。它们可在检索式中表示未知字符。 • 星号 (*) 表示任何字符组,包括空字符。 • 问号 (?) 表示任意一个字符。 • 美元符号 ($) 表示零或一个字符。

计算机检索基础知识

计算机检索基础知识
2. 计算机信息检索的基本技术
①布尔逻辑检索(Boolean searching):是利用布尔逻辑符进行检索的方法,布尔逻辑符有三种,即逻辑"与"(AND)、逻辑"或"(OR)和逻辑"非"(NOT)。在一个检索式中如果含有两个以上的布尔逻辑符就要注意运算次序:()>NOT>AND>OR,即先算括号内的逻辑关系,再依次算"非"、"与"、"或"关系。
中国生物医学文献数据库
中国生物医学文献数据库 (CBMdisc) 收录了1978年至2002年1000多种中国生物医学期刊,以及汇编、会议论文的文献题录。
2002年中国生物医学文献数据库分为以下文档:
CBMdisc02 收录 2001-2002 年的文献题录。
检索途径多:除手工检索工具提供的分类、主题、著者等检索途径外,还能提供更多的检索途径,如题名途径等。
更新快:尤其是国外的计算机检索工具,光盘多为月更新、周更新,网络信息甚至为日更新。
资源共享:通过网络,用户可以不受时空限制,共享服务器上的检索数据库。
检索更方便灵活:可以用逻辑组配符将多个检索词组配起来进行检索,也可以用通配符、截词符等进行模糊检索。
检索结果可以直接输出:可以选择性打印、存盘或E-Mail甚至可以直接检索出全文。
在了解计算机信息检索服务的知识前,首先应了解计算机信息检索的相关知识。
1. 计算机信息检索系统的构成
计算机信息检索系统从物理构成上说,包括计算机硬件、软件和数据库、通讯线路和检索终端五个部分。一般而言,软件由计算机信息检索系统的开发商制作,通讯线路、硬件和检索终端只要满足计算机检索系统的要求都不需要检索者多加考虑。对检索者来说,他们必须了解的是数据库的结构和类型,以便根据不同的检索要求选择合适的数据库和检索途径。

2第二章 计算机检索基础知识

2第二章 计算机检索基础知识
数值数据库 图像数据库 源数据库 术语数据库 (一次文献) 文本- 数值数据库 全文数据库 混合数据库


按文献类型划分:

文献类数据库
书目数据库(二次文献) 全文数据库(一次文献)

库 数值数据库 非文献类数据库 图像数据库 术语数据库
按载体形式分为 :
单机版光盘数据库 数 据 联机数据库 光盘数据库 络版光盘数据库

网络数据库
镜像站数据库
三、数据库的文档结构
1. 顺排文档(linear file):是按记录的编号
顺序排列的文档。为主文档。顺排文档结构简 单,管理方便,节省储存空间,但检索速度较 慢。
2. 倒排文档(inverted file):是将数
据库中具有某些特征的字段值和具有该 字段值的记录号按顺序排列构成的文档, 也称为索引文档。
4.数据结构具有通用性、开放性、动态性 5.信息资源体积小,数量巨大
一座拥有百万册图书的图书馆,经过数字化处理后,只需 3400张光盘就可以全部存储下来。
6.传播方式的无限性
电子信息资源不受时间、空间的限制,实现跨时空、跨行业 的传播。
7.交互性
电子信息资源不是传统信息资源的复制,而是对传统信息 资源和信息交流渠道的补充。
2.2
数据库
一、 定义
数据库是可以共享的某些具有共同存取方 式的相关数据,以一定的组织方式的集合。 数据库本质的三个要素:相关数据、共同 存取方式和一定的组织方式、共享。 通俗地说,数据库是以某一特定方式组织 和存放的数据的仓库。
数据库与其他数据集合的主 要区别在于数据库中的各项 数据可以通过同一种方式进 行储存与查找,因此同一个 数据库中的记录格式都是一 样的。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

字段举例
TI: New antibiotics miyakamides produced by a fungus. AU: Shiomi,-K; Hatae,-K; Yamaguchi,-Y; SO: J-Antibiot-(Tokyo). 2002 Nov; 55(11): 95-8 IS: 0021-8820 PY: 2002 LA: English AB: New antibiotics… … MESH:*Antibiotics-biosynthesis;Aspergillus-flavusmetabolism PT: Journal-Article
数据库的类型(按所含信息内容划分)
1、书目数据库(Bibliographic database)
2、事实数据库(Fact database) 3、数值数据库(Numeric database) 4、多媒体数据库(Multimedia database)
*第三节 计算机检索基本技术与检索方法
接。
如:(中年人 OR 老年人) AND (女性 OR 妇女)AND 骨质疏松 症/治疗
【例1】急性胰腺炎的小鼠实验。
检索提问式:
acute near3 pancreatitis and (mice or mouse)
“急性”和“胰腺炎”之间用位臵算符near3是因为 其间有可能出现以下词汇:
2.编制检索表达式
检索表达式:
又称检索提问式(query),是用来表达检索
提问的逻辑表达式,由选择好的检索词根据
检索要求运用不同的运算符号进行组配,以
达到较为理想的检索效果。
检索表达式:
检索表达式分简单表达式和复合表达式。简单表达式只含一个检
索词,只表达一个简单的检索概念,
例如:hepatitis b virus in ti、舒喘灵、吴阶平 in au等。 复合表达式含有两个或两个以上的检索词,用布尔逻辑算符相连
(二)检索系统和数据库的选择
(三)确定检索途径
(四)确定检索词、编制检索表达式
1.确定检索词
检索词要能正确反映课题的要求.
必须符合系统的要求. 尽量使用主题词检索。
用自由词检索时,要注意网罗该自由词的不同表达形式, 如近义词、同义词、缩写、全称等,以防止漏检;英文 词作为自由词检索,还可以采用截词算符,以保证不因 词性变化、拼写差异等原因造成漏检。
2、截词检索(truncation)
截词检索的作用:扩大检索范围,提高查全率,减 少检索词的输入量,节省检索时间,降低检索费用 等作用。 前截断 后截断 中截断 复合截断
常用的截词符号
截词符号各检索系统不统一,常用的有“*”、“?”、
“#”、“$”、“:”等。
前截断
又称左截断,是将截词符号放臵在一个字符串的左 方,允许检索词的前端有若干变化,是后方一致的 检索。
短语用“ ”表示,检索出与“ ”内形 式完全相同的短语,以提高检索的精度 和准确度。 如:“hypertension drug therapy”
6、精确检索和模糊检索
精确检索是指所检索信息与输入的检索词完全一 致的匹配技术。 模糊检索是指所检索的信息与输入的检索词之间 有一定的差异,只要包含检索词的文献都能被检 出,不要求完全匹配。 例如,检索“马智”写的文章。 模糊检索会检索出包含了“马智超”、“马智惠” 等内容的文献。
布尔逻辑检索 截词检索
位臵检索
字段限定检索
短语检索
模糊检索
1、布尔逻辑检索
逻辑“与” (AND 或 *) 逻辑“或” (OR或+) 逻辑“非” (NOT或-)
逻辑“与”(AND 或*)
表示检出记录中同时含有检索词A和检索词B。 A AND B A*B
A
B
该运算符的基本作用是缩小检索范围,减少命中文献量,以提 高查准率。
如:心脏瓣膜疾病 AND 心力衰竭
逻辑“或”(OR 或+)
表示检出记录中含有检索词A或检索词B。 A OR B A+B
A
B
该运算符的基本作用是扩大检索范围,增加命中文献量,提高查全率。
如:AIDS OR 艾滋病 OR 爱滋病 OR 获得性免疫缺陷综合征
位置算符的作用
用位臵算符(又称邻近算符)规定检索词与检索 词在信息记录中的相邻位臵关系,可以提高查准 率。 常用的位臵算符是(W)、(N)、(F)、(S)
(W)和(nW)运算符
(W)含义为“With”,表示这个算符两侧的 检索词必须相邻,词序不能颠倒。 如:diabetes (w) diet 检出的文献中必须同时有糖尿病和饮食。 (nW)表示两词之间允许插入最多为n个其 他词。
三、计算机信息检索的方法与步骤
检索策略的概念:
检索步骤的科学安排称作检索策略。检索策略是为实现 检索目标而制定的全盘计划和方案,是对整个检索过程 的谋划和指导。 制定检索策略:就是在正确分析信息需求和手头已有线 语种范围、检索的途径、步骤等,编制出符合检索课题 的检索提问式。
索的基础上,选择适用的数据库、确定检索的时间范围、
第二节
计算机信息检索的特点及构成
一、计算机信息检索的特点
1、检索速度快,效率高。 2、检索途径多,检索手段灵活。
3、更新速度快,检索内容新。
4、信息容量大,提供多种服务方式。 5、不受时空限制,实现资源共享。
二、计算机信息检索的构成
1、硬件部分
2、软件部分
3、数据库
什么情况下用截词检索?
名词的单复数形式 词的不同拼写方法 词的前缀或后缀变化.
使用截词检索注意事项
灵活,谨慎 截词部位要适当 不要截词过短,造成误检. 不同的检索系统截词符号不同,注意区 别使用.
3、位置检索
位臵检索是通过检索式中的位臵算符来规定检索词在结果中的相 对位臵。
例如检索式*physics,就可以检索出包含physics、 astrophysics(天体物理学)、biophysics(生物物理 学)、geophysics(地球物理学)等词的结果。
后截断
又称右截断,将截词符号放臵在一个字符串的右方,允 许检索词的后端由若干变化,是前方一致检索。 例如检索式Computer*,检出结果包含computer、 computerized、computerization等词汇的结果。
字段限制检索举例
1.篇名[ti]:chemistry[ti] 2.文摘[ab]:cancer[ab] 3.出版年[py]:2000[py] 4.文献类型[pt]:review[pt] 5.作者[au]:zhang wb[au] 6.通讯地址[ad]:beijing[ad]
5、 短语检索(“ ”)
计算机信息检索基础
孙风梅 E-mail:sun2127@
第一节 计算机信息检索概述
一、计算机信息检索的概念及意义 二、计算机信息检索的发展
一、计算机信息检索的概念及意义
什么是计算机信息检索?

计算机信息检索就是人们根据特定的信息需求,
利用计算机从相关的机读数据库中识别并获取所需 信息的过程。
二、计算机信息检索的发展
1、脱机检索阶段
20世纪50年代开始至60年代中期
2、联机检索阶段
20世纪60年代开始至70年代中期
3、网络信息检索阶段
20世纪80年代以后
我国计算机检索系统的发展
我国计算机检索系统始于20世纪70年代
1983年开始自建数据库
1995年开始先后建成了《中国教育科研网 (CERNET)》、《中国共用计算机互联网(CHINA NET)》、《金桥信息网》、《中国科学技术网》等。 拥有6个国际网络出口节点。7条INTERNET专线。

逻辑“非”(NOT或-)
表示在含检索词A的记录中去掉含检索词B的记录。 A NOT B, A - B 作用是缩小检索范围,提高查准率。
A
B
关于非室性早搏的心率失常的文献 : 组配式为“心率失常 NOT 室性早搏” , 检索到的文献是不包含室性早搏的心率失常的 文献记录。
计算机检索的优先级运算
中截断
也称“通用字符法”或“内嵌字符截断”,这
种截断是把截断符号放臵在检索词的中间部分, 允许检索词中间有若干变化形式,中间截断一 般仅允许有限截断。
例如检索式为wom?n,可以同时检索到含有
woman和women的结果。
复合截断
是指同时采用两种以上的截断方式。 例如?chemi?可以检出chemical、chemist、chemistry、 electrochemistry、electrochemical、physicochemical、 thermochemistry等。
3.分析课题所需的信息类型
包括文献类型、年代范围、涉及语种、著者、机构 等。
4.确定课题对查新、查准和查全的指标要求
要了解某学科、理论、课题、工艺过程等最新进展和动态,要检 索最近的文献信息,强调“新”字。 若要解决研究中某具体问题、技术方案,要检索有针对性、能解 决实际问题的文献信息,强调“准”字。 若要撰写综述、述评或专著等,要了解课题、事件的前因后果、 历史和发展,要检索详尽、全面、系统的文献信息,强调“全” 字。
数据库是计算机信息检索系统的信息源,是按一
定方式存贮在磁盘、磁带或光盘上的相互关联的 数据集合。
数据库的结构
1、文档(File) 2、记录(Record) 3、字段(Field)
数据库的著录格式-中文
数据库的著录格式-外文
A finite-memory discrete-time convolution approach for the nonlinear dynamic modelling of S/H–ADC devices(1) Mirri, D.; Pasini, G.; Traverso, P.A.; Filicori, F.; Iuculano, G(2). Computer Standards and Interfaces (3) Volume : 25, Issue: 1, March, 2003, pp. 33-44 (4) Bibliographic Page(5) Article Full Text PDF (261 KB)(6) 注:(1)文献题名;(2)作者及链接;(3)刊名 及链接;(4)卷期、月年、页码;(5)文摘链接; (6)全文链接。
相关文档
最新文档