计算机检索基本知识

合集下载

第三章 计算机检索基础知识

第三章 计算机检索基础知识
在利用计算机进行信息检索的早期,人们只是用单台计
算机的输入输出装置进行检索,用磁带作存储介质,一般为 连续的顺序检索方式。检索部门把许多用户的检索提问汇总
到一起,进行批量检索,然后把检索结果通知各个用户,用
户不直接接触计算机。
联机检索(on-line retrieval)
60年代末,由于计算机软硬件技术的不断提高,出现了一台主机带 多个终端的联机信息检索系统。联机检索是用户利用终端设备,通 过通信网络或通信线路与检索系统联机,进行“人机对话”,从检 索中心的数据库及时查找所需要的文献信息过程。 80年代,发达国家的一些计算机信息联机检索系统,通过卫星通信
注意:这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。不同的检 索系统其位置算符的表示方法不尽相同。
截词检索
截词检索就是把检索词截断,取其中的一部分,在加
上截词符号一起进行检索。
• 主要用于检索词的单复数、词性的词尾变化、词根相同的一类词, 以及同一词的拼法变异等。 • 从本质上说,截词算符是一种逻辑“或”的关系。
对信息内容特征进行标引和对信息外部特征进行著录,形成 一条信息题录,并根据信息内容作出摘要,然后将上述检索标识 与著录项目一并填入工作单,就完成了数据库建设的“数据前处 理”工作。
数据库及其编排结构
• 数据库的类型
• 数据库的构成 • 数据库的记录格式 • 数据库的编排结构
数据库的类型
按照信息处理层次划分:
A AND B:检索词A和检索词B同时出现在一条记录中。 • 其作用是缩小检索范围,提高查准率。
例如:查有关“人口控制”的文献,检索式可写成: 人口 AND 控制
逻辑或(OR)
A OR B:记录中出现检索词A或检索词B或两词同时出现 在一条记录中。 • 其作用是扩大检索范围,提高查全率。

第三章 计算机检索基础知识

第三章 计算机检索基础知识

1. 2. 3. 4.
5.
在实践中,需要根据课题的具体要求,合理 调节查全率和查准率,保证检索效果相对较优。 通常采用以下方法进行调节: 若要提高查全率,进行扩检,可按如下方法 调整检索: 选全同义词并以“OR”方式与原词连接后加入到 检索式中; 降低检索词的专指度,找出一些检索词的上位词 或相关词; 采用分类号进行检索; 删除某个不甚重要的概念组面,减少“AND”运 算; 取消某些过严的限制符,如字段限制符等。
(4)同一事物名词的单复数、不同词性、英美语的不 同形式 单数 复数 名词 动词 computer computers composition composite 英拼 colour fibre 美拼 color fiber (5)隐含概念扩展 隐含概念是显见主题的更确切的表达。 “一个取代高残杀菌剂的理想品种” 隐含了“高效低毒杀菌剂”或“高效低毒农药”
下位词: 下位概念扩展法:概念分析的树形展开法 如:汽车 卡车 轿车 货车等
所有图书馆用户能够在校外使用天津高校文献信息 中心的电子资源,比如超星电子图书、维普期刊全文数据 库、EBSCO电子期刊等。 IP通远程访问系统已开通 IP通用户登录方法: 首先要确保您使用的网络是非教育网。 WEB方式用户请登录 / 客户端软件用户请登录
1. 2. 3. 4. 5.
提高检索词的专指度,找出一些检索词的下位词或 专指性较强的相关词; 增加概念组面,用“AND”连接一些进一步限定主 题概念的相关检索项; 限制检索词出现的可检字段; 利用文献外表特征限制,如:文献类型、出版年代、 语种、作者等; 用逻辑非“NOT”来排除一些无关的检索项。
截词检索
邻近检索 限制检索 加权检索 检索词的确定

计算机检索基础知识

计算机检索基础知识

14
这个阶段文献信息数据库不论从种类还
是规模上都远远超过了以往各个阶段, 全文数据库、多媒体数据库更是其中的 佼佼者;文献信息检索不再是单位内部 联机检索,价格昂贵的国际联机检索, 而是通过各个接入网、交换网检索互联 网各结点上的服务器的各类信息。
15
三、计算机信息检索的服务方式
计算机检索系统按其服务功能可分为回溯检索、定题
16
2、定题检索(Selective Dissemination of Information,SDI) 定题检索服务是根据用户检索课题的内容,一次性输 入事先确定好的检索提问式保存在检索系统中,检索 系统根据数据库更新周期,定期地对保存的检索提问 式进行检索,将检索出的最新文献信息提供给用户。 定题检索服务对于长期追踪某一领域的新颖信息很适 合。 3、人机对话检索 这是用户以交互方式直接访问系统及数据库、在线实 时进行的检索。用户一旦输入检索提问,计算机检索 系统就可立即执行,并在用户终端显示屏上输出检索 结果。
33
4、限制检索
限制检索是通过限制检索范围,达到优化检索结果的
方法。限制检索的方式有多种,例如:进行字段检索、 使用限制符、采用限制检索命令等。 1)字段检索 它是把检索词限定在某个/些字段中,如果记录的相应 字段中含有输入的检索词则为命中记录,否则不中。 例如:查找微型机和个人计算机方面的文章。要求 “微型机”一词出现在叙词字段、标题字段或文摘字 段中,“个人计算机”一词出现在标题字段或文摘字 段中,检索式可写为:microcomputer?/de,ti,ab OR personal computer/ti,ab
31
(2)按截断的字符位置划分: 前方一致:允许词尾有变化。如“Textile?”可 同时检出含有Textile和Textiles的文献。 后方一致:允许词头有变化。如“*polymer”可 同时检出含有有Homopolymer,Copolymer等词的 文献。 中间一致:词头、词尾都可变化。如: “*Wave*”可检出含有 wave,waves,wavelet,microwave,wavelength等词 的文献。 中间屏蔽:允许中间的某些字母有变化。如: “Fib??s”相当于查出含有Fibers和Fibres的文献

第六章 计算机信息检索基础知识

第六章 计算机信息检索基础知识

25

2
二,计算机信息检索的基本概念
利用计算机,根据用户的提问, 利用计算机,根据用户的提问,在一 定时间内, 定时间内,从经过加工处理并已存储在计 算机存储介质内的信息集合中查出所需信 息的一种方式. 息的一种方式.
3
三,计算机信息检索系统构成
1,硬件 , 2,软件 , 系统软件和应用软件. 系统软件和应用软件. 3,数据库 , 数据库是至少由一种文档组成, 数据库是至少由一种文档组成, 能满足特定目的或特定数据处理系统 需要的数据集合. 需要的数据集合.
19
第二节 DIALOG联机检索命令 联机检索命令
一,BEGIN(或B)选库命令 ( )
?BEGIN 文挡名 ?B 文挡名 ?BEGIN 文挡号 ?B 文挡号
20
二,sf调文档命令 sf调文档命令
只在打开411 库时有效 只在打开 ? 8,12,63,72…… , , ,
21
三,SELECT(或S)选词命令 ( )
23
六,DISPLAY SETS (或DS)联 或 联 机显示命令
用于显示相应的检索结果, 用于显示相应的检索结果,具体指令格 式与TYPE相同 式与 相同
七,LOGOFF结束检索过程命令 结束检索过程命令
24
第三节 联机检索的一般步骤
1,分析信息需求; 2,选择系统及数据库; 3,确定检索途径; 4,选择检索项; 5,编制检索式; 6,上机检索; 7,输出检索结果; 8,退出联机检索系统
22
STEPS( SS) 四, SELECT STEPS(或SS)命令
SS computer? and image? S1 597 computer? S2 176 image? S3 105 computer? and image?

计算机检索基础知识

计算机检索基础知识

“COTTON(2N)PROCESSING”时, 凡含有cotton processing,processing of cotton和processing of Egyptian cotton的文 献记录都算命中。
28
(5)(F)算符——含义为“Field”
这个算符表示其两侧的检索词必须在同一字段(文献著 录的基本单元,反映文献外部特征或内容特征的某一 个项目,如同在题目字段或文摘字段)中出现,词序 不限,中间可插任意检索词项。
34
又如:查找wang wei写的文章,可以输入检索式: au=wang wei(有时检索词须放在双引号内) /TI—篇名;如:S control(w)pollution/ti /DE—叙词;如:S aluminum compounds/de /ID—标引词;如:S soap/id /AB—文摘词;如:S computer/ab
31
(2)按截断的字符位置划分: 前方一致:允许词尾有变化。如“Textile?”可 同时检出含有Textile和Textiles的文献。 后方一致:允许词头有变化。如“*polymer”可 同时检出含有有Homopolymer,Copolymer等词的 文献。 中间一致:词头、词尾都可变化。如: “*Wave*”可检出含有 wave,waves,wavelet,microwave,wavelength等词 的文献。 中间屏蔽:允许中间的某些字母有变化。如: “Fib??s”相当于查出含有Fibers和Fibres的文献
33
4、限制检索
限制检索是通过限制检索范围,达到优化检索结果的
方法。限制检索的方式有多种,例如:进行字段检索、 使用限制符、采用限制检索命令等。 1)字段检索 它是把检索词限定在某个/些字段中,如果记录的相应 字段中含有输入的检索词则为命中记录,否则不中。 例如:查找微型机和个人计算机方面的文章。要求 “微型机”一词出现在叙词字段、标题字段或文摘字 段中,“个人计算机”一词出现在标题字段或文摘字 段中,检索式可写为:microcomputer?/de,ti,ab OR personal computer/ti,ab

计算机检索基础知识

计算机检索基础知识

第二章 计算机检索基础知识
第三节 计算机检索步骤
四.选择检索途径 确定检索词后,根据课题性质、 确定检索词后,根据课题性质、范围以及检索系统所提供的可检 标识等选择适当的检索途径,检索途径主要有以下几种: 标识等选择适当的检索途径,检索途径主要有以下几种: 以文献的著者(包括个人和团体著者、编者、 (1)著者途径 以文献的著者(包括个人和团体著者、编者、 ) 译者、专利权人等)姓名为检索标识来进行检索的途径。 译者、专利权人等)姓名为检索标识来进行检索的途径。 从文献信息内容相关的主题词角度来检索文献, (2)主题途径 从文献信息内容相关的主题词角度来检索文献, ) 这是一种常用的途径。 这是一种常用的途径。 从文献所属学科类别角度来检索。 (3)分类途径 从文献所属学科类别角度来检索。 ) 以文献所附有的号码特征来检索,如专利号、 (4)号码途径 以文献所附有的号码特征来检索,如专利号、 ) 报告号等。 报告号等。
A NOT B A―B 数据库中凡含词A 数据库中凡含词 而不含词B的记录 而不含词 的记录 被检出
逻辑关系 的说明
逻辑关系图 图中红色部分) (图中红色部分)
A
B
第二章 计算机检索基础知识
第二节 计算机检索技术
布尔逻辑算符的优先级顺序为NOT、AND、OR,另外可以使用 、 布尔逻辑算符的优先级顺序为 、 , 括号改变它们之间的运算顺序。 括号改变它们之间的运算顺序。 如可以编写( 如可以编写(A+B)*(C+D)检索式,先运算 A+B,C+D再运 )( )检索式, , 再运 )。但应注意 算(A+B)*(C+D)。但应注意,对于同一个布尔逻辑提问式 )( )。但应注意, 来说,不同的运算顺序会有不同的检索结果。 来说,不同的运算顺序会有不同的检索结果。

计算机信息检索基础知识

计算机信息检索基础知识

• 支气管扩张剂对肺的作用
– 分类标引:R974 呼吸系统药物 – 主题标引:肺/药物作用 支气管扩张剂/药理学
计算机信息检索系统组成
• 硬件:运算器、控制器、存储器、输入输出装置等 • 软件:系统操作程序、数据库管理程序、联机控制
程序、应用程序等。 • 通讯线路:电话通讯网、数据通讯网、卫星通讯网 等。 • 检索终端:信息用户与检索系统主机进行人机对话, 实现联机检索的设备。包括上网设备、调制解调器 等。 • 数据库:是计算机检索的对象。是由一个或数个文 档构成,并能够满足某一特定目的或某一特定数据 处理系统需要的一种数据集合。
光盘数据库检索
• 光盘 是80年代发展起来的激光存储载体,继 纸张感光材料、磁性载体之后问世的又一种 新型的信息存储介质。能存储数据、文字、 图形、图像、声音、动画等各种信息。一张 普通的光盘、信息存储量约为550兆。 • 光盘的分类:按存储方式分为
(1)只读型光盘:CD-ROM (2)写读光盘:WORM (3)可擦写型光盘:ERM
光盘检索的定义和特点
• 定义:
是一种用激光技术在特制圆盘上记录信息 的检索方式。 • 特点: (1)投资成本低; (2)价格低; (3)运行速度快; (4)检索效果好; (5)下载方便; (6)安全性能高。
光盘检索的系统组成
• 单机光盘检索系统组成: (1)数据库:光盘 (2)软件:系统软件和检索软件 (3)硬件:计算机、光盘驱动器、显示屏、打印 机等 • 网络光盘检索系统组成: (1)光盘塔 (2)光盘组网软件 (3)光盘塔服务器
NOT > AND > OR ( )号里的部分运算优先
截词检索
截词检索就是把检索词截断,取其中的一 部分,在加上截词符号一起进行检索。主要 用于检索词的单复数、词性的词尾变化、词 根相同的一类词,以及同一词的拼法变异等。 通用的截词符有:?和* ?代表一个字母;*代表两个或两个以上字母

计算机检索基础知识

计算机检索基础知识

(N)算符是“near”的缩写,表示此算符两边 的检索词必须紧密相连,此间不允许插入其他 单词或字母,但词序可以颠倒;
(nN)算符则表示在两个检索词之间最多可以 插入n个单词,且词序可以颠倒。如,?S econom?? ?(2N)recovery , 可 以 检 出 : economic recovery, recovery of the economy, recovery from economic troubles。 词位臵检索是很有用的检索技术,它可以规 定词组中各词的前后次序,防止错误的搭配和 输出。
第二节 计算机检索技术
一、基本检索技术 1 布尔检索 几乎所有的网络信息检索系统都支持布 尔逻辑检索,但不同的检索工具又有差别. 2 截词检索
3 短语检索
在网络检索工具中,
若在检索框内输入两个或两个以上的检 索词,且两个检索词之间没有任何其它符号, 该检索系统会将这两个检索词之间的关系设 为默认值(AND或OR);
目前加权检索在网络检索工具中的运用 还很不完善,尚不能根据用户的需求来确定 某一个具体语词的权值大小从而确定它对检 索结果的影响程度。
现在很多网络检索工具采用“+”、“-” 来表示检索词在检索提问中的分量。在某个 检索词前面带上“+”表示该检索词必须在检 索结果中出现,反之,若某个检索词前面带 上“-”,则表示该检索词一定不能出现在检 索结果中。 AltaVista、HotBot、Infoseek等都 支持这种形式的加权检索。
作者
文献类型 刊名 语种 出版年
4 位臵逻辑检索符
又称全文查找逻辑算符,相邻度检索算符, 原文检索符。由于布尔检索的“AND”运算要求 AND两边的检索词在同一记录中同时存在才能 命中文献,这就可能会引起误组配而造成大量 误检,而位臵逻辑检索是以原始记录中检索词 与检索词特定的位臵关系为逻辑运算的对象, 检索词用位臵算符相连,就可以弥补布尔检索 的缺陷。 位臵逻辑检索可分为词位臵检索、同句检 索、字段检索和记录检索。

计算机检索基础

计算机检索基础
是指对有关的一次文献和二次文献进行广泛深入
的分析研究之后综合概括而成的产物,具体包括 各种述评、综述、或进展性出版物,各种字典、 词典、手册(教科书)、百科全书、年鉴以及文 献指南(或书目指南)等。
1.3 文献的主要类型
印刷型、缩微型、声像型和电子型 文献是以载体的物理形态区分的四种文献类型。
1. 印刷型
2.7 政府出版物
政府出版物是各国政府部门及其所属机构所发表的
文件。可分为行政性文件和科技文件两大类。
政府出版物对了解一个国家的科学技术和经济政策
及其演变情况。有一定的参考价值。
2.8 学位论文
是高等学校学生为获得某种学位而撰写的科学论文。
一般有学士论文、硕士论文和博士论文之分。 学位论文的特点是:理论性、系统性较强,内容专 一,阐述详细,具有一定的独创性,是一种重要的 文献信息源。
零次文献一般是通过口头交谈、参观展览、参加报
告会等途径获取,不仅在内容上有一定的价值,而 且能弥补一般公开文献从信息的客观形成到公开传 播之间费时甚多的弊病。
一次文献(primary document)
是指作者以本人的研究成果为基本素材而创作(或 撰写)的文献,不管创作时是否参考或引用了他人 的著作,也不管该文献是以何种物质形式出现,均 属一次文献。一次文献中所记录的情报,一般比较 具体、详尽和系统化。 习惯上也称一次文献为原始文献。图书、期刊论文、 科技报告、会议论文、专利说明书、技术标准以及 部分学位论文等公开发表的文献都属一次文献。另 外,还包括一些不公开发表的文献。如:日记、内 部报告、技术档案等等。
式的长处。 科技会议是公布新的研究成果的重要场所。又是获 得难得文献的重要途径。另外也是及时全面地了解 有关领域发展情况的重要渠道。

计算机检索基本知识

计算机检索基本知识

超文本式:多用于网络信息检索,基于Web技术,可检 索多媒体信息
多为表单形式,有的直接输入检索词即可,如大部 分数据库的高级检索;有的既可输入检索词也可输入检 索式;如维普数据库的标准检索,有的必须输入检索式, 如EI数据库的高级检索。
计算机检索过程
词表
检索课题
主题分析
选择数据库 确定检索词 制定检索式 计算机处理
检索误区2——internet网上虽然有一些较好的资源,但是 与专业的网络数据库来比,无论是质量还是数量上都有 很大的差距,检索文献目前来说最主要的来源还应是专 业数据库,即正规的出版物上发表的文献。仅用搜索引 擎来查找文章 是非常不可取的。 检索误区3——不要忽略摘要数据库, 虽然检索摘要数据库不能马上得到全文, 但是摘要数据库的数据量大,范围广,是查找文章线索 极好的检索工具。就目前的情况而言,不可能全部都能 得到电子版的全文,先找到文章线索再根据线索查找印 刷版的全文是一项不错的组合。
限制检索
泛指检索系统中提供的缩小或约束检索结果的检索 方法。主要有以下方式: 字段检索——利用字段进行限制,如题名、摘要、全文等 通常的字段限制范围的大小顺序是: 题名<关键词<摘要<全文 二次检索——在前一次检索的结果中进行另一概念的检索
所有文章 经过一次检索后 在上一次检索结果 的范围内进行再次 检索
同句检索: 要求参加检索运算的两个检索词必须在同一 自然句中出现。 位置运算符: (S)--sentence 同字段检索:对同句检索条件进一步放宽,可以使用同字 段段检索。 位置运算符为: (F)——field (L)——link
词组的检索:通常用“”或()来表示两词是作为一个词 组来检索的 如:“hypermedia database” ;“profit and loss”将查 找profit and loss 禁用词:通常一些虚词(如冠词和连词不包含在检索范围 之内) 如:a about also and any as at be between by both for some so not this with 等将被自动忽略

计算机信息检索基础知识

计算机信息检索基础知识

信息检索的步骤
研究课题 用户
主题分析
选择检索系统或 数据库
选择检索途径:主题 词、作者、机构等
检索操作
制定检索策略和 检索方式
初始检索 结果输出 不满意
用户结果评价
满意
检索结果
索取原文
三、网络信息资源及其特点
网络信息资源又称为虚拟资源、数字资源、 电子信息资源、联机信息资源、万维网资源 等,是互联网上电子信息资源的统称,是以 数字化形式记录的,利用计算机技术、通信 技术及多媒体技术在网络上发布、查询与存 取利用的信息资源的总和。
追溯法:这是利用已有的文献后面的参考文 献进行追溯查找的方法,是在没有检索工具 或检索工具不全的情况下使用的一种方法。 但用这种方法查找的文献不全,有片面性, 文章漏检率高,知识陈旧的占多数,目前已 很少有人使用。
分段法(循环法):这是将常用法与追溯法 交替使用的一种方法,即利用工具书检索文 献,又利用文献后面的参考文献进行追溯, 两种方法交替使用,直到满足读者需要为止。 这种方法可根据文献和本单位工具书收藏的 情况分期分段交叉运用不同的查找方法,既 能获得一定时期内的文献,还可节约查找时 间。
(3)专门从事数据库制作和销售的数据库商 如EBSCO公司、ProQuest公司等;自己没有出 版物,但他们买出版公司的产品,然后建立检索 平台供读者检索,例如iGroup公司建立了 Scitation平台,在上面可以看到AIP(美国物理 学会)、ASME(美国机械工程师协会)等几十 个专业学协会的电子期刊。
2信息检索技术
布尔逻辑检索 截词检索 位置检索 字段限定检索
布尔逻辑检索
逻辑与AND(*)。 逻辑或OR(+)。 逻辑非NOT(-)。

计算机检索基本知识(一)

计算机检索基本知识(一)

特点:检索精确 适用:熟悉学科发展,熟悉检索方法
多个检索项,支持逻辑组配
【技术】逻辑组配 逻辑匹配又称布尔逻辑检索,是通过布尔 逻辑算符来实现的,这些运算符能把一些 具有简单概念的检索词(或检索项)组配 成为一个具有复杂概念的检索式,用以表 达用户的检索要求。是当今检索理论中最 成熟的理论之一,也是构造检索表达式最 基本、最简单的匹配模式。 逻辑运算符有三种:与、或、非
选择数据库
【技术】跨库检索
跨库检索,在几个数据库之间进行的检索。 优势:跨库检索使用方便,一次检索可在多个子 数据库查询 劣势:为了实现跨库检索,只能在数据库间寻找 共性,牺牲各个数据库的特色。
《中国学术期刊全文数据库》为我们提供了“跨 库检索”和“单库检索”两种模式
跨库检索的默认检索界面与跨 库初级检索界面基本相同
时间:1999年-博士论文
12月31日,累积硕士 学位论文全文文献37 硕士论文 万多篇。 时间:1999年--
学位论文的重要性 学位论文是高等院校或研究机构的学生为 取得各级学位、在导师指导下完成的科学 研究、科学试验成果的书面报告。 重要的内部文献,保存在各大学中。内容 专深,有一定的新颖性、独创性。 是一种非常有参考价值的文献信息源。 学位论文的整体水平要高于期刊论文 学文论文为内部文献,获取比较困难
登陆注意事项: 1、“中国知识资源总库”实行IP控制,校 园网以外不能使用
2、有并发用户限制400人
出现“最大并发用户数已满”的提示时,请耐心等待
了解一个数据库应该从以下三个方面入手
数据库内容: 可以从这个数据库中得到什么 数据库检索: 如何利用这个数据库 结果处理: 如何处理得到的结果
中文数据库

第四章 计算机信息检索

第四章 计算机信息检索

三.数据库
1.数据库的概念 数据库是按一定要求存贮在计算机中的相互关 联的数据集合。 数据库的发展是随着文献信息自动化管理的发 展而发展的。当今社会,随着信息量的剧增和计 算机的广泛应用以及人们对文献信息的迫切需求, 电子文献资源的产生与发展就成为必然。而数据 库建设是文献信息自动化管理的基础和核心,是 建立信息网络不可缺少的信息资源,是资源共享 的物质基础,是方便有效地为社会提供信息的重 要渠道。 因此,数据库的飞速发展是信息社会发展的 必然结果。
计算机信息检索
刘 锋
本课内容 一、计算机信息检索的基本知识 二、计算机信息检索系统的构成 三、计算机信息检索原理与技术 四、计算机信息检索策略 五、我校图书馆电子资源概况
一、计算机信息检索的基本知识
1.计算机检索的概念 计算机检索是指工作人员在电子计算 机或计算机检索网络的终端机上,使用特 定的检索指令或检索逻辑关系,由计算机 从数据库中检索出数据或文献的过程。 优势: 提高查全率、查准率,数据资源较全 面丰富,检索功能强,检索质量高,资源共 享 ,内容更新快,服务方式灵活方便。
一、布尔逻辑检索 二、截词检索 三、原文检索 四、加权检索和聚类检索 五、限制检索

六、区分大小写检索 七、短语检索(精确检索) 九、模糊检索 十、概念检索 十、相关检索
1、布尔逻辑检索
布尔逻辑是表达不同概念之间关系的符号逻辑 系统。 利用布尔逻辑运算符进行检索词或代码的逻辑 组配,是现代信息检索系统中最常用的一种方 法。 常用的布尔逻辑算符有三种,分别是逻辑或 “OR‖、逻辑与“AND‖、逻辑非“NOT‖。 用这些逻辑算符将检索词组配构成检索提问式, 计算机将根据提问式与系统中的记录进行匹配, 当两者相符时则命中,并自动输出该文献记录。

2.1.1 计算机检索基础知识.

2.1.1  计算机检索基础知识.

“计算机 AND 图书馆”
A CB
A and B 逻辑“与”运算
是用来组配具有同义或同族概念的词。如:检索提问式: “A OR B”或“A + B”其含义:是数据库记录中任何一条 记录,只要含有“A”或“B”中任何一个检索词即为命中的 文献。
“OR”的作用是扩大检索范围,
增加命中文献量,提高文献的
是一种概念相交和限定关系的组配。例如:“A AND B”
“A*B”,其含义:是检出的记录中必须同时含有“A”和“B”
两个检索项。
“AND”算符的作用是对检索词加以限定,逐步缩小检索范围, 提高检索结果的查准率。例如检索“计算机在图书馆中的应用” 方面的文献,其检索式可写成:
“计算机 * 图书馆”或
enzymes
color
enzymatic
colour
enzymic
grain$ 可查找:
Hof*man* 可查找: grain
Hofman
grains
Hofmann
Hoffman
Hoffmann
多通配符示例 organi?ation* 可 查找:
organisation organisations organisational organization organizations organizational
前截断:截词符放在被截词的左边,可与后截断一同使 用。例如输入*ware,可检software、hardware等。截 词符号可代表一个或以上字符。
()>NOT>AND>OR
如: 信息OR情报 NOT 经济 (信息OR情报)NOT 经济 检索结果不同。
所有可以使用单词和短语的检索字段均可以使用截 断运算符或通配符。它们可在检索式中表示未知字符。 • 星号 (*) 表示任何字符组,包括空字符。 • 问号 (?) 表示任意一个字符。 • 美元符号 ($) 表示零或一个字符。

计算机检索基础知识

计算机检索基础知识
2. 计算机信息检索的基本技术
①布尔逻辑检索(Boolean searching):是利用布尔逻辑符进行检索的方法,布尔逻辑符有三种,即逻辑"与"(AND)、逻辑"或"(OR)和逻辑"非"(NOT)。在一个检索式中如果含有两个以上的布尔逻辑符就要注意运算次序:()>NOT>AND>OR,即先算括号内的逻辑关系,再依次算"非"、"与"、"或"关系。
中国生物医学文献数据库
中国生物医学文献数据库 (CBMdisc) 收录了1978年至2002年1000多种中国生物医学期刊,以及汇编、会议论文的文献题录。
2002年中国生物医学文献数据库分为以下文档:
CBMdisc02 收录 2001-2002 年的文献题录。
检索途径多:除手工检索工具提供的分类、主题、著者等检索途径外,还能提供更多的检索途径,如题名途径等。
更新快:尤其是国外的计算机检索工具,光盘多为月更新、周更新,网络信息甚至为日更新。
资源共享:通过网络,用户可以不受时空限制,共享服务器上的检索数据库。
检索更方便灵活:可以用逻辑组配符将多个检索词组配起来进行检索,也可以用通配符、截词符等进行模糊检索。
检索结果可以直接输出:可以选择性打印、存盘或E-Mail甚至可以直接检索出全文。
在了解计算机信息检索服务的知识前,首先应了解计算机信息检索的相关知识。
1. 计算机信息检索系统的构成
计算机信息检索系统从物理构成上说,包括计算机硬件、软件和数据库、通讯线路和检索终端五个部分。一般而言,软件由计算机信息检索系统的开发商制作,通讯线路、硬件和检索终端只要满足计算机检索系统的要求都不需要检索者多加考虑。对检索者来说,他们必须了解的是数据库的结构和类型,以便根据不同的检索要求选择合适的数据库和检索途径。

2第二章 计算机检索基础知识

2第二章 计算机检索基础知识
数值数据库 图像数据库 源数据库 术语数据库 (一次文献) 文本- 数值数据库 全文数据库 混合数据库


按文献类型划分:

文献类数据库
书目数据库(二次文献) 全文数据库(一次文献)

库 数值数据库 非文献类数据库 图像数据库 术语数据库
按载体形式分为 :
单机版光盘数据库 数 据 联机数据库 光盘数据库 络版光盘数据库

网络数据库
镜像站数据库
三、数据库的文档结构
1. 顺排文档(linear file):是按记录的编号
顺序排列的文档。为主文档。顺排文档结构简 单,管理方便,节省储存空间,但检索速度较 慢。
2. 倒排文档(inverted file):是将数
据库中具有某些特征的字段值和具有该 字段值的记录号按顺序排列构成的文档, 也称为索引文档。
4.数据结构具有通用性、开放性、动态性 5.信息资源体积小,数量巨大
一座拥有百万册图书的图书馆,经过数字化处理后,只需 3400张光盘就可以全部存储下来。
6.传播方式的无限性
电子信息资源不受时间、空间的限制,实现跨时空、跨行业 的传播。
7.交互性
电子信息资源不是传统信息资源的复制,而是对传统信息 资源和信息交流渠道的补充。
2.2
数据库
一、 定义
数据库是可以共享的某些具有共同存取方 式的相关数据,以一定的组织方式的集合。 数据库本质的三个要素:相关数据、共同 存取方式和一定的组织方式、共享。 通俗地说,数据库是以某一特定方式组织 和存放的数据的仓库。
数据库与其他数据集合的主 要区别在于数据库中的各项 数据可以通过同一种方式进 行储存与查找,因此同一个 数据库中的记录格式都是一 样的。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档