信息检索语言及其利用.

合集下载

信息检索的方法

信息检索的方法

信息检索的方法
1. 通过关键词检索:将用户输入的关键词与文本中的内容进行比对,找出包含这些关键词的段落或句子,作为检索结果。

2. 通过全文检索:将用户输入的关键词在整个文本中进行匹配,找出与关键词相关的段落或句子。

3. 通过索引检索:建立一个索引库,包含文本中的关键词及其所在的位置信息。

用户输入关键词后,直接在索引库中查找,减少搜索时间。

4. 通过相似度匹配:将用户输入的关键词与文本中的内容进行相似度计算,找出与输入最相似的段落或句子。

5. 通过语义分析:利用自然语言处理技术,对用户输入的关键词进行语义分析,将其转化为与文本内容相匹配的查询语句,进行检索。

6. 通过文本分类检索:对文本进行分类,用户输入关键词后首先确定查询的文本类别,再在该类别下进行检索。

7. 通过专家系统检索:建立一个专家系统,根据用户输入的关键词,系统能够根据预先设定的规则和知识库提供相关的检索结果。

8. 通过链接分析:根据文本之间的链接关系,找出与输入关键词相关联的文本内容,作为检索结果。

9. 通过用户反馈的改进:根据用户对检索结果的反馈,不断优化检索算法,提高检索效果。

10. 通过深度学习方法:利用深度学习模型,对文本内容进行分析和建模,找出与用户输入关键词相关的内容。

第六章 文献信息检索与利用

第六章 文献信息检索与利用

第六章文献信息检索与利用第一节文献信息检索基础知识随着科学技术日新月异地发展,人类步入了信息时代,人们交流、学习及生活的方式已随之发生了巨大的变化。

在这些变化中,我们时刻感受着文献信息资源的多元化利用及信息的多样化服务。

如今,文献信息资源已同物质资源、能源资源并列成为现代社会资源的三大支柱。

文献信息作为一种资源在社会生产和人类生活中起着越来越重要的作用,特别是对中小学生进一步拓展知识视野,有效地提升自我学习能力方面成为了一项必备的基本素养。

为了更好地掌握这项技能,从小学起就对学生进行信息教育,提高利用信息意识和获取信息技能,掌握文献信息的相关知识是很必要的。

一、文献信息检索概述1.文献信息检索的概念文献信息检索是从文献信息资源集合中找出所需文献信息的过程。

从广义上讲,文献信息检索包括两个过程:一是文献信息的存储过程。

存储是选择文献信息、按规范化语言文本揭示与描述文献信息内、外特征并使其有序化。

即对大量有关信息集中起来,并对信息的外表特征和内容特征进行著录、标引和组织,经过整理、分类、归纳等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。

二是文献信息检索过程。

检索是系统根用户提问按规范化语言进行概念转换,经逻辑匹配输出与提问相关的文献信息。

即是指运用编制好的检索工具或检索系统,查找出满足读者要求的特定信息。

狭义的检索是指依据一定的方法,从已经组织好的大量有关文献集合中,查找并获取特定的相关文献的过程。

综上所述,文献信息检索就是将文献信息按照一定的方式组织和存储起来,并能根据用户的需求,找出其相关文献信息的过程。

2.文献信息检索类型文献信息检索按不同的标准可以划分为不同的类型,下面介绍两种目前比较普遍的划分方法。

(1)按文献信息检索存储和检索内容划分。

按文献信息检索存储和检索内容划分:可分为文献型检索、事实型检索和数据型检索。

①文献型检索:是指利用文摘、题录、索引、目录等二次文献信息,查找文献线索和根据文献线索查找原始文献。

2013最新信息检索与利用

2013最新信息检索与利用

一、判断题1.检索语言专门用于计算机的信息检索系统,其实质是表达一系列概括信息内容的概念及其相互关系的概念标识系统。

错2.检索系统通常以书本、卡片、表册的集合形式出现,如:书目、索引、文摘、年鉴、手册等。

错3.百科全书属于二次信息。

错4.在信息社会中,一个人如果不具备良好的信息素养、没有掌握现代信息技术的基础知识和基本技能,就会成为“信息盲”。

对5.信息检索就是所有信息用一定的方法被预先组织存储起来的,我们就用该工具和该系统提供的检索方法把它找出来。

检索工具和检索方法就是“索宝图”,帮助我们找到这些宝藏。

对6.相对于传统社会的信息环境来说,如今人类所面对的主要问题不是信息知识的匮乏和停滞,而是信息总量的无限膨胀。

对7.1989年,美国图书馆协会在一份《关于信息素养的总结报告》中提出,具有信息素质的学生必须具有的能力是:能够有效地、高效地获取信息;能够熟练地、批判地评价信息;能够精确地、创造地使用信息。

错8.美国未来学家阿尔温·托夫勒在《第三次浪潮》(1980年)中把第二次浪潮即工业化社会的特征归纳为规格化、专业化、同步化、集中化、最优化和集权化这6个相互联系的方面。

错9.后组式检索语言指表达文献主题概念的标识,在编制检索语言词表和标引文献时不预先组配,而是在检索时,根据实际需要,按照级配规则临时进行组配的检索语言。

对10.索引与目录的主要区别在于:目录是对某一种出版物作整体的著录,索引可将文献所包括的若干信息分析摘录出来作为排检标识。

对11.一般地说,仅文献信息的外表特征可成为检索的切入点。

错12.网络搜索引擎是一种专门为组织与检索网络信息资源使用的检索工具,也是数据库一种特殊形式。

对13.信息的查询首先需要人工或借助一些智能工具,如爬虫根据需要有目的地收集所需的信息资源。

错14.信息检索依据检索方式可以划分为:传统手工检索、计算机数字化信息检索和书目检索。

错15.检索语言是用来描述文献特征和表达检索提问的一种自然语言。

信息检索与利用. C doc

信息检索与利用. C doc

信息检索与利用_C一单选题1. 我国最早的词典是()《字林》《史籀篇》《说文解字》《尔雅》本题分值: 5.0用户得分: 5.0用户解答:《尔雅》标准答案:《尔雅》2. 现有文献记载中我国最早的群书目录是()《别录》《汉书·艺文志》《七略》《兵录》本题分值: 5.0用户得分: 5.0用户解答:《兵录》标准答案:《兵录》3. 根据用户提出的课题,提供某一时间以前文献的检索方式称为()回溯性检索定题检索顺排档检索机械检索本题分值: 5.0用户得分: 5.0用户解答:回溯性检索标准答案:回溯性检索4. 用户在与检索系统交流时,常常不能正确而完整地描述出自己的信息需要,这种状态即是“知识的非常状态”。

提出该观点的学者是()。

R.莫里斯N.J.贝尔金P.英格维森M.陶伯A.肯特本题分值: 5.0用户得分: 5.0用户解答:N.J.贝尔金标准答案:N.J.贝尔金5. 信息素质这一概念最早是由美国信息产业协会主席()于1974年在给美国政府的报告中提出来的。

Paul ZurkowskyV. BushC.N.MooersF.W.HortonC.E.Shannon本题分值: 5.0用户得分: 5.0用户解答:Paul Zurkowsky标准答案:Paul Zurkowsky6. 我国第一部有系统的字典是()。

《尔雅》《说文解字》《康熙字典》《字林》《史籀篇》本题分值: 5.0用户得分: 5.0用户解答:《说文解字》标准答案:《说文解字》7. ()是有语法、语义关联的信息结构。

符号数据信息知识本题分值: 5.0用户得分: 5.0用户解答:知识标准答案:知识8. 情报是激活了的()。

信息数据知识符号本题分值: 5.0用户得分: 5.0用户解答:知识标准答案:知识9. 共性最强的一种检索途径是()分类途径主题途径著者途径专用途径本题分值: 5.0用户得分: 5.0用户解答:著者途径标准答案:著者途径10. 揭示文献外表特征的是()书目文摘索引题录本题分值: 5.0用户得分: 5.0用户解答:书目标准答案:书目二判断题1. 随着缩微文献、声像资料以及大量电子文献的发展,传统的纸质文献将会迅速地退出历史舞台。

信息检索语言

信息检索语言

中图法分类简表
(/view.do?id=516)
A B C D E F G H I J K 马克思主义、列宁主义、毛泽东思想、邓小平理论 哲学、宗教 社会科学总论 政治、法律 军事 经济 文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
中国情报检索语言之近代阶段的特点
①从分类体系来看,冲破了四部分类法的束缚,提出了 新的分类理论,能尽量建立在科学的基础之上,为新 旧书籍、中外图书的统一分类开辟了可行的途径; ②从类目设臵与标记制度来看,比较简单、科学、准确、 便于利用,是中国图书分类法史上的一次重大变革; ③从类分表的结构来看,分类法已经形成为一个完整的 系统,并且有一定的科学理论作为其指导依据及一 定的使用范围作为其实践基础; ④从编制技术上看,既继承了古代分类法的优良传统与 经验,更吸收了国外的先进技术,具有科学性;
信息检索语言的类型
分类语言
分类语言是用分类号和相应分类款目来表达 各种概念的,它以学科体系为基础将各种概 念按学科性质和逻辑层次结构进行分类和系 统排序。分类语言能反映事物的从属派生关 系,便于按学科门类进行族性检索。按照分 类方式的不同,分类语言又分为体系分类语 言、组配分类语言和混合分类语言。
中国情报检索语言之近代阶段的特点(续)
⑤受杜威分类法带来的局限与影响,在类目体系的确立 上表现有机械、呆板、生硬的一面; ⑥对分类法理论中的一些重大问题与实践中出现的情 况未能展开充分的讨论并科学的加以解决,从而在 实际操作中各行其是,影响了图书分类法理论研究 的整体性进展; 在主题法方面:我国近代图书馆的主题编目技术也是于 20世纪初由西方传入的。继而从30年代到50年代, 我国虽然有三、四部中文标题表问世,但是都未能 得到实际的应用。

信息检索与利用教程电子教案

信息检索与利用教程电子教案

表谱:以列表形式揭示有关知识内容 的参考工具书称为表谱。例《中国医 史年表》与《实用中医内科表典》。
图录:以图形画像掲示事物形象,并 配以文字说明的参考工具书称为图录。
表谱、图录能直观、形象与简明地反 映了事物原貎,是一种实用价值很大的 参考工具书。
2020/5/8
信息检索与利用教程
19
(6)、名录
以《全国报刊索引》为例,熟悉并认识手 工检索工具的编排结构、正文格式及查 找方法。
例:
2020/5/8
信息检索与利用教程
8
2.1.2 参考工具书
工具书是一种依据特定的需要,广 泛汇集相关的知识或文献资料,按一定 的体例和检索式编排,专供查资料线索 的图书。
2020/5/8
信息检索与利用教程
9
工具书的编排结构
《中国卫生年鉴》
《中国中医药年鉴》
《中国百科年鉴》
2020/5/8
信息检索与利用教程
14
(4).手册
手册或称指南,是汇集有关学科或 领域的基本知识、资料和数据,以 供人们随时方便地查检的参考工具 书。 如:《家庭医护手册》、《医学实用 数据手册》(三楼参考工具书)
2020/5/8
信息检索与利用教程
2020/5/8
信息检索与利用教程
23
2.2.2 年度资料的检索
年度资料——年鉴
年鉴是及时报道某国家、地区或行 业/领域最新信息的工具书, 一年 出版一次,通常分门别类,按时 间顺序,以短文形式记录过去一 年有重大影响的人物和发生的重 要事情。最有代表性的是统计年 鉴
2020/5/8
信息检索与利用教程
12
(2).百科全书
以词条形式系统介绍各学科基 本概念、基础理论、重要事实及数 据、历史人物等的参考工具书。

网络环境下信息检索的方法与技巧.

网络环境下信息检索的方法与技巧.

参考工具书是根据一定的需 要汇集有关方面资料,并按特 定方式编排,以供读者检索事 实性和数据性信息的图书。根 据所收录的内容及所具备的功 能,参考工具书可分为:字典、 词典,百科全书,年鉴,名录 等类型。
1、字典、词典
字典、词典是我们最熟悉、最常 使用的工具书。字典、词典的种类 很多,图书馆收藏有不少印刷型的 字典、词典,如辞海、英汉词典等 等。随着Internet的快速发展,网 上也涌现出了越来越多的字、词典 检索网站,数百种字词典在网上可 免费获得
1、手工信息检索:通过人脑的思维判断从书本式
的检索工具(《全国报刊索引》、《中国生物学文 摘》)中查找出自己所需要的信息。 2、联机信息检索:利用终端设备,通过国际通讯 网络和计算机检索系统连接,远距离地从国际联机 检索系统的数据库中检索出所需信息。最著名的国 际联机检索服务系统有美国的DIALOG,ORBIT和欧 洲的ESA-IRS等。 3、光盘信息检索:光盘检索是指利用光盘数据库 检索文献信息。目前的光盘检索有两种形式:—种 是利用自己购买的光盘版的数据库进行检索;另一 种是在联网环境下利用网络版的光盘数据库进行检 索。我们工大图书馆就订购了许多光盘数据库,如:
网上年鉴类站点主要有:
(1) 中华人民共和国统计局:设有统计数据、统计信息、 统计分析等栏目,可查到我国各行各业的最新统计数 据,还可链接到我国各省、市和国务院所属部委、直 属机构的网站(/ ) (2) 中国网 -- 中国统计数据:该网站提供了 2000-2004 年 工 业、投资、国内外贸易、物价、进出口、金融财政 等方面的及时、可靠、权威的中国宏观经济月度统计 资料,所有资料都来自中国国家统计局。 (/ch-company/index.h (3)浙江统计信息网:该网站设有浙江省情、统计数据、 统计信息、统计公布、统计法规等栏目,有地区生产 总值、工业、农业国内贸易、财政金融、物价、居民 家 庭 收 入 等 方 面 的 最 新 统 计 数 据 。 (/)

信息检索与利用

信息检索与利用

信息检索与利用一、解释Internet的概念Internet的全称是Inter-network,中文译成因特网、互联网或网际网,是通过通信媒介连接的世界性计算机网络的总称。

二、陈述接入Internet的基本方式1.利用电话线和通讯软件拨号连接;2.利用SLIP或PPP协议与一台上网主机连接;3.网络连接三、熟悉Internet提供的服务1.电子邮件(E-mail) ;2.文件传输(FTP);3.远程登录(Telnet);4.网络新闻(USENET);5.网络检索工具Gopher、WAIS、Archie等;6.万维网(WWW);7.电子公告栏(BBS);8.网上寻呼(ICQ);9.网上聊天(IRC)。

四、熟悉E-mail、FTP、Telnet、WWW的基本概念及使用(一)电子邮件1.概念:一种通过Internet与其它用户进行联系,方便、快捷、价廉的现代化通信手段。

2.电子邮件系统的功能:邮件起草与编辑、发送邮件、收信通知、读取与检索邮件、答复与转发邮件、退信说明及邮箱管理等。

3.电子邮件的地址:userid@hostname,地址中不能有空格。

4.电子邮件的格式:邮件头(mail header)和邮件体(mail body)。

(二)FTP1.概念:提供了任意两台计算机之间相互传输文件的功能。

2.常用命令:put和Mput命令;Ascii和Binary命令;(三)Telnet是指在网络通讯协议Telnet的支持下,用户的计算机通过Internet暂时成为远程计算机终端的过程。

(四)WWW1.概念:WWW是World Wide Web的缩写,也被简称为3W或Web,通常译为全球网、万维网。

它是一个把信息检索技术与超文本(Hyper Text)技术相融合而形成的环球信息系统。

超文本有两个含义:其一是信息的表达形式;其二是信息间的连接方式。

2:URL:URL(Uniform Resource Locator)是指统一资源定位器,实际是一个标识文件类型及所在WWW地址的字符串。

信息检索

信息检索

确定信息检索方法
掌握获取原始信息的线索
获取原始信息
一、手工检索的技术与方法
1.手工信息检索工具
(1)目录 (2)索引 (3)文摘 (4)年鉴 (5)手册 (6)百科全书
2.手工信息检索工具的排检技术
(1)字顺排检技术 (2)分类排检技术 (3)主题排检技术 (4)时序排检技术 (5)地序排检技术
全文检索、多媒体检索、超媒体检索。
(3)按检索性质分:
定题检索和回溯检索。
(4)按检索方式的不同分:
手工检索、机械检索、计算机检索。
2.信息检索的特性
(1).信息检索的相关性
相关性表明信息集合中的一条信息与提问集合中的一个 提问的吻合程度。
(2).信息检索的不确定性
信息检索系统不直接处理原始信息和原始的用户需求, 它提供的只是信息表示和查询表示之间的匹配关系,这就 涉及到标引与检索词选用的准确度问题;而实际上,标引 和检索词的选用本身就存在不确定性。
布尔逻辑检索模型采用布尔代数的方法,用布尔表达 式表示用户提问,通过对信息标识与提问式的逻辑比较 来检索文献。 每个提问表示为标引词的布尔组配,组配符号有逻辑 “与”、逻辑“或”、逻辑“非”。 检索系统对提问的响应式输出一个包含了该提问式的 组配元,且符合组配条件的信息集合。
某一信息Infor,可表示为
(1)传统信息检索向全文文本、多媒体、多 原理等新型信息检索的发展,从深度上提高信 息的管理和组织能力; (2)信息资源的网络化与分布化,面向互联 网中海量的信息资源在广度上提高信息的管理 和组织能力。
四.信息检索的模型
最简单的检索模型——单项检索模型。
它将信息集合中的每一信息用1个或多个主题词标引, 提问式由单个主题词构成。

信息检索与利用(第六组案例分析)

信息检索与利用(第六组案例分析)

如果你是试验小组成员,除了
摩托车你还会搜集哪些信息?
1、销售地区的气候情况:既然是想做出驰骋全世界 的产品,那么就要明白不同地区因为气候因素,对 产品的构造是有要求的。比如说某地方下雨频繁, 那么就会将排气孔、引擎安排在高的地方。某地区 冬季较长,那么就会考虑附带防滑轮胎。
2、不同国家的尾气排放标准:产品出口,势必需要 境检。这就需要了解不同国家的排放标准,对摩托 车的内燃机,排气孔中的催化剂等等进行适应改造, 这样才能顺利通过境检,进入地区销售。
例子中,日本从世界各地带回
来的摩托车是否属于信息?
经过小组讨论,属于信息,并且为信息 源。其原因在于:在广义的信息源的类型中, 类似于案例中的“摩托车”,属于实物信息 源的范畴,那么,实物信息源的存在方式有: 文物、产品样本、模型、碑刻、雕塑等形式。 “摩托车”根据其具有消费性以及使用用性, 可以算作实物信息源中的“产品样本”。特 点大致为:直观性强、感觉实在、信息量大, 但需要通过知识、智慧、经验和工具挖掘大 量隐含的信息。
3、当前时代流行潮流:一个时代有一个时代的流行 潮流,只有符合当前消费者的审美需求,才能将产 品更好地销售。
案例二
在图书情报部门流传着这样一个有 趣的故事:美国某轧钢厂的一位化学家 曾对该厂的图书管理员说,他们花费1 万美元完成了一系列实践,并解决了一 个问题。而这个图书管理员却告诉他, 图书馆藏有一份德国人的报告,表明德 国人已经研究过这个课题,而且得出了 相类似的结论,得到这项报告只需花5 美元。
6.案例分析
组长(主讲人): 组员(补充人):
案例一
为了在极短的时间内尽快开发出一 系列驰骋全球的名牌摩托车产品,1968 年,日本集中了全国各摩托车修理厂 200名具有丰富专业知识和研究能力的 工程技术人员和情报人员,分成12个小 组,用了一年时间,走遍世界上所有重 要的摩托车生产厂家,对世界摩托车工 业进行了有史以来最广泛的全球性调查。 在订货、帮助建厂的幌子下,他们搜集 了大量信息,并带回了170多部样机。

网络信息检索方法与应用

网络信息检索方法与应用

网络信息检索方法与应用网络信息检索方法与应用摘要随着Internet在全世界范围内迅猛发展,使人们获得有用信息越来越困难,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。

因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。

本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。

关键词检索方法工具重要性翻译summary With the rapid development of Internet in the world, to make people more and more difficult to obtain useful information, online information and huge numbers of people to obtain information contradiction between the increasingly prominent.Therefore, the retrieval of information technology and its development trends of the network to explore and research, is both urgent and practical issues.In this paper, the basic principle of network information retrieval techniques and toolsof network information retrieval, information retrieval network status and other aspects of analysis, and the development trend of network information retrieval predicted, the network aims to find ways to improve information retrieval by means of and effective way to approach, and ultimately improve the effect of network information retrieval, making the network information resources can be fully effective use.Keyword Retrieval means Importance一信息检索技术信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。

文献信息检索与利用

文献信息检索与利用

文献信息检索与利用信息检索与利用是信息领域的一项重要任务,涉及到检索和利用各种类型的信息源,包括文献、数据库、网络资源、社交媒体等,以满足信息需求和支持决策。

本文将着眼于文献信息检索与利用,介绍文献检索的基本概念、检索工具和检索技巧,并探讨文献利用的方法与技巧,以提高文献检索与利用效率和实用价值。

一、文献检索的基本概念1. 文献定义及其分类文献是指以书写形式记载下来的各种信息,包括书籍、期刊、报纸、学位论文、研究报告、专利、标准、技术资料等,其特点是具有较高的准确性、权威性和可信度。

文献按照出版载体、出版形式和内容特征划分,可以分为印刷文献、电子文献、政府文件、商业文献、学术文献、非学术文献等。

2. 文献检索的定义及意义文献检索是指通过一系列的检索策略和工具,筛选和获取与特定研究主题相关的文献信息的过程。

文献检索的意义在于:可以快速获取大量的相关文献信息,提高研究的效率和准确性;可以发现新的知识点和研究趋势,有助于科学研究和学术交流;可以拓宽学术信息来源,增加研究的深度和广度。

3. 文献检索的基本步骤文献检索一般包括以下基本步骤:(1)明确研究主题和目的,制定检索计划和策略;(2)选择合适的文献检索工具和数据库,如中英文文献数据库、学位论文数据库、专利数据库等;(3)设置检索关键词和检索语法,如采用布尔运算符(AND、OR、NOT)或括号来组合检索词;(4)执行检索操作,并对检索结果进行筛选和评估,包括去重、排除不相关文献、确定重要文献等;(5)阅读和理解检索到的文献内容,提取有用信息和数据,支持自己的研究和决策。

二、文献检索工具文献检索工具是实现文献检索的重要支撑,常见的文献检索工具有以下几种:1. 图书馆目录图书馆目录是指图书馆所收藏的各种文献信息,如书名、作者、出版社、题名、分类号等,通过书名、作者、题名等关键词来检索和查找相关文献。

图书馆目录的优点是全面性强,对于印刷文献和中文文献的获取有很好的覆盖率;缺点是速度慢,检索方式单一,难以处理大量文献信息。

网络信息的检索与利用~

网络信息的检索与利用~

第一章1.信息检索(information retrieval)是指将新鲜一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程.全称又叫信息存储于检索(information storage and retrieval).狭义的信息检索则仅指从信息集合中找出所需信息的过程.信息检索的分类:A根据检索手段的不同,可分为:手工检索、光盘检索、联机检索和网络检索。

(网络检索式信息检索的发展方向,因而本书以网络检索为主)。

B根据检索对象形式的不同,可分为:①文献信息检索:是以文献(包括题录、文摘和全文)为检索对象的检索。

②数值型信息检索:是以数值或数据为对象的一种检索,包括文献中的某一数据、公式、图表,以及某一物质的化学分子式等,数据检索分为数值型和费数值型。

③事实型信息检索:是以某一客观事实为检索对象,查找某一事物发生的时间地点及过程的检索,其检索结果主要是客观事实或为说明事实而提供的相关资料。

2.检索语言是把信息的存储与检索联系起来,把标引人员与用户联系起来,以便取得共同理解,实现交流的语言. 目前使用的检索语言包括:人工语言(分为主题语言和分类语言)和自然语言(可以为那些不懂人工语言的网络用户提供极大的便利).3.数据库是“至少由一个文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合”. (通俗)数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。

数据库是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源,也是信息检索的重要资料来源.根据载体不同可分为:联机数据库(online database),光盘数据库(CD-ROM database)和网络数据库(networked database).根据内容与功能可划分为:指南数据库(directory database),交易(执行)数据库(transactional database),全文数据库(full text database),书目数据库(bibliographic database),字(词)典数据库(dictionary database),数值数据库(numeric database)与统计数据库(statistical database)和图像数据库(image database).4.检索词是用户或检索人员给出的字,词,字符或短语,用于查找含有它们的记录.检索式也称检索提问表达式,是要求系统执行的检索语句.检索策略是就一个问题检索一个或多个数据库所输入的全部检索式的集合,是为满足信息需求所制定的一系列检索式.5.查全率(recall ratio)与查准率(precision ratio)是检索质量的两个重要的评价指标.查全率是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例.查准率是指检出文献中合乎需要的文献数量占文献全部数量的比例.6.布尔逻辑检索的主要运算符是:①逻辑”与”,用AND(或*)表示.②逻辑”或”,用OR(或+)表示.③逻辑”非”,用NOT(AND NOT,BUT NOT)(或-)表示.7.邻近检索:又称位置算符检索,文献记录中词语的相对次序或位置不同,所表达的意思可能不同,而同样一个检索表达式中词语的相对次序不同,其表达的检索意图也不一样.位置算符检索是用一些特定的算符来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用, ,BDS拥有的国内信息库主要有:中国国防科技信息、中国军工报、网上新闻库、国防科技成果综合推广库、现代军事、中国工程院士学术报告、国防科技简讯、国内成果交流库、国防科技报告中文馆藏库、国防科技中文文摘库、中国经济信息库、中国科技期刊题录库、中国专利文摘库。

信息检索与利用-题库(史上最全)

信息检索与利用-题库(史上最全)

A按不同载体形式,文献信息源可分为(D.印刷型和非印刷型)两种。

A按信息源的表现形式分类,可将信息资源分为:文献型信息源.数据型信息源.(B.声像型信息源)和多媒体信息源。

A按照主题词的选词方式习惯上可分为标题索引.单元词索引.关键词索引.叙词索引。

请问,将“经济核算”拆分为“经济”和“核算”属于其中的哪种呢?(B.单元词索引)B(D.Wn)表示前后两个检索词之间最多可插入n 个单词,且前后两词顺序不变。

B百度提供一个基于搜索的互动式知识问答分享平台,这个平台是:(A.百度知道)B北大方正阿帕比数字图书馆中,读者每周可以下载借阅电子图书的数量一般为50本,阅览室机器不受下载数量的限制;下载借阅的电子图书借阅时间一般为(C.7)天,到期后需重新续借。

B被超星数字图书馆收录图书的作者可获得(D.10)年期免费读书卡。

B毕业论文答辩的一般程序是?(B.②③①④)B标题词语言.体系分类语言属于(A.先组式检索语言)。

C操作练习:要想把酒长久贮存最理想的温度应该是多少?(B.华氏55度)C操作练习:中国一些历史悠久的中药店,都喜欢叫“某某堂药店",象“同仁堂”.“九芝堂”.“达仁堂”……那么,人们是为了纪念哪位医生才这么叫的呢?(C.张仲景)C操作练习:自由女神像矗立在哈得孙河与纽约湾入口处的自由岛上。

是法国人民纪念美国独立100周年赠给美国人民的礼物,神像由法国建筑家(D.弗雷德里克.奥古斯特.巴托蒂)设计,1885年自法国运来纽约。

C查找所有链接到的网页,应在搜索引擎中输入:(C.link:)C查找中国教育网上关于“e-learning”的word 文档,应在搜索引擎中输入:(B.e-learningfiletype:docsite:)C超星数字图书馆有四种检索方式,除了超星会员检索方式之外,下列选项中不属于超星数字图书馆的检索方式的是(B.期刊文献检索)。

C除提供全文电子图书外,NetLibrary还提供全文电子期刊和完整版的(D.有声电子图书)。

信息检索与利用 名词解释

信息检索与利用 名词解释

文献(document)指的是在存贮、检索、利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存贮有信息或数据的载体。

以文字、图形、符号、声频、视频、电磁信号等手段记录和传播知识的载体就是文献。

检索策略检索策略(Retrieval Strategy),是指为实现检索目标而制定的全盘计划或方案,是对整个检索过程的谋划与指导。

数据库数据库(Database)是至少由一种文档组成的,能够满足某种特定目的或特定数据处理系统需要的数据集合。

通俗地讲,数据库就是按照一定方式存贮的相互关联的信息集合。

目录目录(Catalog)是以完整的出版单元(如一种图书、一种期刊)为单位,按照一定次序编排的对文献信息进行描述和报道的工具,也称书目。

目录对文献的描述比较简单,每条记录的字段主要包括:文献题名、责任者、出版事项、分类号、主题词等。

禁用词禁用词(STOP WORD)是指不表达实际意义的虚词,如冠词、介词、连词等。

通常在检索系统生成索引的过程中会忽略这些虚词。

所以,检索时如关键词中间出现这些禁用词,会被检索系统忽略。

1.信息检索答:信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程,又叫信息储存与检索,这是广义的信息检索。

狭义的信息检索则是仅指该过程的后半部分,即从信息集合中找出所需信息的过程。

2.追溯法(引文法)答:利用参考文献进行深入查找相关文献的方法。

追溯法包括两种方法: 一种是利用原始文献所附的参考文献进行追溯;另一种是利用引文索引检索工具进行追溯。

3.三次文献答:是在对有关的一次文献和二次文献进行分析研究的基础上,通过综合概括而编写出的文献,是文献信息研究的成果和产物,具有参考性和指导性。

如教科书、综述、工具书、进展、调查报告、标准等。

4.目录答:是对图书、期刊或其他单独出版物特征的揭示和报道。

目录以单位出版物为著录对象,一般只记录其外部特征。

如题名、著者、出版事项、载体形态等。

信息检索与利用(1)

信息检索与利用(1)
三次信息(参考性信息):是指对有关的一次信息和二次 二次进行分析、研究、对比、综合、评述、概括而撰写的 信息,如综述、述评、年度进展报告、百科全书、手册、 年鉴、辞典等。其特点是文字精炼、叙述简明扼要,具有 系统性、综合性、知识性和工具性等特点。
信息资源的类型
2、按信息加工层次分类(续2)
以上三级信息资源的关系: 零次信息是一次信息的素材; 一次信息是二次、三次信息的来源和基础; 二次、三次信息是对一次信息进行组织、加工、综合后形成的
标准的主要特点
(1)标准的制订、审批程序有专门规定,并有固定 的代 号,格式整齐划一; (2)一个标准一般只能解决一个问题; (3)时效性强; (4)不同种类、不同级别的标准在不同范围内执行; (5)有一定的法律效力和约束力; (6)有自身的检索系统。
中国标准概况
* 1957年中国成立了国家标准局,并于1958年颁布了第一批国家标准; * 1978年成立国家标准总局,1979年颁布“中华人民共和国标准管理条例” * 1978年中国标准化协会(CAS)加入了国际标准化组织(ISO) * 中国标准的等级:国家标准、行业标准、地方标准、企业标准 * 中国标准的分类:按《中国标准文献分类法》
会议信息
会议信息是指国内外各种学术会议上宣读或交流 的论文、报告、会议记录等信息资料
价值 会议信息是公布新研究成果的重要场所,大 约30%的科技成果首次公布在科技会议上 对本领域重大事件的首次报道率最高,一些 新的理论、方案和重要发现、发明等往往首 先在会议上发布并交流 及时全面了解有关领域发展情况的重要渠道
所谓“信息检索”主要是对二、三次信息的检索。
信息资源的类型 以信息的逻辑意义和利害关系划分
有益信息:对社会发展有积极作用的、能够消除人们对未知事物不 确定性的信息,它是人类社会的资源和财富。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(二)间接法 是指必须借助于二次信息资
源(检索工具)或检索系统来获取所需信息的 一种检索方法,又可分为顺查法、倒查法和抽 说明文字 查法三种方法。
顺查法 这是一种 按时间顺序 查找文献信 息的方法。
倒查法 倒查法与顺 查法相反, 是一种逆时 间顺序查找 文献信息的 方法。
抽查法 这是一种利 用信息检索 系统查找文 献信息的方 法。
第三讲 信息检索语言
主题词确定的处理技巧:
5. 主题概念的分析与转换 ③ 注意英文同义词(解剖名词)的主题词 胃 gastric ,stomach 心 heart, cardio眼 eye ,ocul-,ophathalm肝 liver,hepat-
第三讲 信息检索语言
主题词确定的处理技巧:
5. 主题概念的分析与转换 ④ 不忽略缩略语、元素符号及简单化合物分子式的选用 例: 磷酸一铵:分子式- NH4H2PO4;缩略语MAP 断层摄影=CT 核磁共振=MRI
3. 利用MeSH表等将非主题词转换成可供检索使用的正 式主题词。包括同义词、近义词、简称与繁称和俗名与 学名等。 例:cancer neoplasms 怀孕 妊娠 子宫纤维瘤 子宫平滑肌瘤
第三讲 信息检索语言
主题词确定的处理技巧:
4.要注意主题词的倒置形式。 例:过敏性休克 休克,过敏性
第三讲 信息检索语言
第三讲 信息检索语言
7. 可使用副主题词与主题词进行组配, 但要注意主题词与 副主题词组配范围的限定; 医学信息主题规律 疾病 / 药物疗法 应用关系 药物 /治疗应用 疾病 / 化学诱导 药物 / 副作用 疾病 / 并发症 因果关系
并列关系
例:主题词 / 副主题词组配标引与检索
第三讲 信息检索语言
复习信息检索原理
信息检索系统由文献的存储和检索两个部分组成。
信息 存储 收集 选择 著录 加工 标引 加工 存储 标识
存储与检 索系统进 行匹配
检索 语言
信息 检索 分析 需求 检索 提高 提供 标识
输出
检索 标识
信息检索原理示意图
第三讲 信息检索语言
一、检索语言的定义
检索语言是文献信息的加工、存储和检索的共同编制的 专门语言,是表达一系列概括文献信息内容和检索需要而 编索课题内容的概念及其相互关系的一种概念标识系统。 是用来描述信息源特征和进行检索的人工语言。
(二)主题检索语言
第三讲 信息检索语言
(二)主题检索语言
非主题词:单车、脚踏车 主题词:自行车 用单车检索:会漏检脚踏车和 自行车的文献 用脚踏车检索:会漏检单车 和自行车的文献 如果用自行车检索:会检索 较全面
第三讲 信息检索语言
(二)主题检索语言
第三讲 信息检索语言
检索时主题词的处理技巧:
(一)直接法 直接法是指不利用二次信息资源(检索工具)或检索 系统,直接通过浏览或查阅一次信息资源或三次信息 资源来获取所需信息的方法。 可以明确判定所查的文献信息是否具有针对性和实用 性,因此,又称为“直查法”。 存在着很大的盲目性、分散性和偶然性,查全率无法 保证。
第三讲 信息检索语言
三、信息检索方法
第三讲 信息检索语言
三、信息检索方法
(四)综合法
分段法 核心期刊浏览法
又叫循环法,是常用法和 追溯法的结合。就是先利 用二次信息资源(检索工 具)或检索系统查找一批 有用的文献,然后再利用 这些文献后所附的参考文 献进行追溯查找,由此获 得更多的相关文献,直到 满足需要为止。
是指检索系统或检索工 具在报道原始文献信息 时,通常存在一定时差 ,为了获取检索课题的 最新文献信息,直接浏 览尚未收到信息检索系 统中的现期刊刊文的检 索方法。
(一)分类检索语言
《中图法》的结构
R 医药卫生
“类” R5 内科学 R51 传染病
“类名”
“类目” “上位类” “下位类” “同位类”
R54 心脏、血管(循环系)疾病
R57 消化系及腹部疾病 R571 食管疾病
R575 肝及胆疾病
R575.2 肝硬变 R6 外科学
(一)分类检索语言
类目级别划分
第三讲 信息检索语言
二、检索语言的种类
[课堂讨论]主题词与关键词的区别
第三讲
信息检索语言
[主题词与关键词对照举例]
关键词
冠心病
冠状动脉粥样硬化性心脏病 治疗
主题词
冠状动脉疾病
治疗
冠状动脉疾病
冠状动脉心脏病
文献
第三讲 信息检索语言
二、检索语言的种类
[课堂讨论]分类检索语言与主题检索语言特点
第三讲 信息检索语言
三、信息检索方法
(一)分类检索语言 [难点释疑]
第三讲 信息检索语言
(一)分类检索语言
(一)分类检索语言
类目级别划分
第三讲 信息检索语言
二、检索语言的种类
(二)主题检索语言 主题检索语言是直接以代表文献内容特征和科学概 念的概念词作为检索标识,并按其字顺组织起来的 一种检索语言。 以揭示事物对象及其特征为出发点的。 分类:标题词语言、叙词语言、关键词语言和单元 词语言。目前常用的有:关键词语言、叙词语言。 特性检索能力较分类语言强,专指度高,可以提高 查准率。所有该主题词有关的内容都集中在该主题 词下,适合特定的课题检索。
第三讲 信息检索语言
二、检索语言的种类
(二)主题检索语言 1. 关键词语言 关键词语言是一种自然语言,是
指出现在文献题名、文摘、章节标题或正文中,能表
征文献主题内容具有实质意义的 非规范化语词。它是 一种后组式检索语言,一般不进行规范化处理,表达
事物概念直接、准确,便于标引和检索文献。每个关
键词都可以作为检索“入口词”。因此,专指性强, 查准率高,但易出现误差。
(二)主题检索语言
工具:主题词表 国内: 《中国中医药学主题词表》 《医学主题词注释字顺表》 国外: 《Medical Subject Headings》
MeSH,医学主题词表 万方 MeSH主题词检索系统采 用美国国立医学图书馆发布 的2011版《医学主题词表》 通过人工翻译,实现 MeSH主 题词检索功能,能提高检准 率和检全率。
主题词确定的处理技巧:
6. 没有相应主题词时,可采用靠词或上位词检索 例: “上消化道出血” “胃肠出血” 例: “红细胞存活” “红细胞衰老”
第三讲 信息检索语言
主题词确定的处理技巧:
7. 可使用副主题词与主题词进行组配, 但要注意主题词 与副主题词组配范围的限定; 例:“肝疾病的早期治疗” “肝疾病/治疗” 例: 肺/诊断 Χ 肺炎/诊断 √ 例:甲状腺炎 甲状腺炎 ,自身免疫性 甲状腺炎 ,亚急性 甲状腺炎 ,化脓性
第三讲 信息检索语言
(二)主题检索语言 [关键词语言举例]
冠心病 治疗
第三讲 信息检索语言
二、检索语言的种类
(二)主题检索语言 2. 叙词语言 是一种人工语言 ,经过规范化和优选 处理 的语言。选做的叙词具有概念性、描述性、组配 性,还具有语义的关联性、动态性、直观性。 以规范化的标引词形成词表,如我国编制的《汉 语主题词表》,就是典型的叙词语言。词表中各词独 立,标引时根据需要进行组配,可表达文献内容方面 的复杂概念,适用于机检和手检。
第三讲 信息检索语言
主题词确定的处理技巧:
5. 主题概念的分析与转换 可用成熟商品名、药名、或形容词等 例: 商品名:老干妈、舒利迭、茅台酒等 药名:六味地黄丸、妇科再造丸、康妇炎胶囊等 形容词:用于白酒的酱香型、醇香型等 病名:SARS、禽流感、 Ilizarov=伊利扎诺夫等
第三讲 信息检索语言
[难点释疑]检索语言与检索途径的关系 检索语言通过检索途径来实现其要表达的意义,二者是 一 一对应的关系。
《医学信息检索》
梁瑜
LOGO
第三讲
信息检索语言
掌握信息检索语言的类型;
掌握信息检索语言的原理及特点 重点掌握中国图书馆分类法 重点掌握主题概念分析法 掌握信息检索的方法、途径。
信息检索语言
一、检索语言的定义和作用 二、检索语言的种类 三、信息检索方法 四、信息检索途径
第三讲 信息检索语言
1. 选用主题词,应从事物的“专有名词”来考虑,不要 从“过程词”来考虑。 例:肾结石的诊断 肾结石/诊断 2. 选用主题词的概念要恰如其分,不能太广或太狭。 例:肺腺癌 肺 + 腺癌+ 治疗(错) 肺腺癌/ 治疗 (检索点少) 肺肿瘤 + 腺癌+ 治疗 (概念全面准确)
第三讲 信息检索语言
主题词确定的处理技巧:
第三讲 信息检索语言
(一)分类检索语言 《中国图书馆图书分类法》 (简称《中图法》)是我国文献分类标引工作的国家推 荐标准,被我国图书信息行业广泛应用,它是一部综合 性的分类法。 始编于1971年,到目前已出版至第五版。 体系分类法:由五大基本部类、二十二个基本大类、简 表、详表及复分表五个部分组成。 每个大类采用拉丁字母和阿拉伯数字相结合的混合号码 ,并以层累制(等级制)为标记制度。
外概法: 即从题意中概 括出检索点
主题词确定的处理技巧:
5. 主题概念的分析与转换 ① 隐性主题分析 例:“办公室吸烟对他人有害” “吸烟污染” 例:网络资源的知识产权保护 网络资源/网络信息资源/知识产权保护/版权/ 著作权限/合理使用 例:家庭、婚姻裂变和青少年犯罪的内在联系 离婚(不完整家庭、单亲家庭) 青少年(未成年人)犯罪
分类号
A
内容
分类号
内容
自然科学总论
马克思主义、列宁主义、毛泽东思想、邓小平 N 理论
B
C
哲学、宗教
社会科学总论
O
P
数理科学和化学
天文学、地球科学
D
E F G H I J K
相关文档
最新文档