信息资源检索部分知识点
信息检索的基本知识
⑵信息检索系统的类型 〔续〕
④索引型检索系统: 索引是根据一定的需要,把特定范围内的
某些重要文献中的有关款目或知识单元,书 名、刊名、人名、地名、语词等,按照一 定的方法编排,并指明出处,为读者提供 文献线索的一种检索系统。
索引不仅广泛存在于各种书刊等文献 中,而且更多见于作为辅助检索系统而附 在不同类型的检索工具之后,为检索工具 提供了更多的检索途径。
信息的存储过程就是按照主题词表或 分类表及使用原那么对原始信息资源
一、信息检索原理〔续〕
2、信息检索系统〔续〕
一、信息检索原理〔续〕
⑵信息检索系统的类型
按信息处理手段划分有 ①手工检索系统。又称传统检索系统 是使用人工来查找信息的检索系统。 其主要类型有各种书本式的目录、题 录、文摘和各种参考工具书等。优点: 方便、灵活、 断准确。缺点:检索速 度太慢
2、信息检索系统〔续〕
按著录和标引方式划分 ④文摘型检索系统是以简练的文字将文献
资料的主要内容准确、扼要地摘录下来, 并按照一定的著录规那么和编排方式系统 地组织起来的检索 工具。 主要包括:报道性文摘
指示性文摘 如:美国的?化学文摘?英国的?科学文摘〉
中国的〈中国数学文摘〉〈海洋文摘〉
2、信息检索系统〔续〕
按著录和标引方式划分
⑤全文型检索系统 全文检索是指在文献资料的标题、目录、作
者、内容中检索 指定的字符串。 全文检索系统是指将文章 中所有的文字处理序列 都作为检索对象进行索引,并根据需要找出包含 有欲检索词的文献的系统。
作用:它能提供快捷的数据管理工具和数据 查询手段,帮助人们进行了大量文献数据的整理 和管理工作,使人们能够快速、方便地查到想要 的任何信息。
第二章 信息检索的根本知识
信息检索知识点
信息检索知识点信息检索是指从大规模的信息资源中,通过利用各种信息检索工具和技术,准确和高效地找到用户所需要的信息的过程。
信息检索技术在现代社会中扮演着重要的角色,它不仅广泛应用于互联网搜索引擎,还在图书馆、数据库、企业信息管理等领域发挥着重要作用。
本文将介绍信息检索的定义、关键概念和一些常用技术。
一、信息检索的定义和目标信息检索是指通过计算机等工具从大规模的信息资源中,按照用户的需求进行检索,提供相关性高、准确性好的信息结果。
它的目标是帮助用户快速地找到所需的信息,提升信息搜索效率和准确性。
二、关键概念1. 查询:用户提交的检索请求,通常由一系列关键词组成。
2. 检索词:查询中使用的关键字或关键词短语。
3. 检索结果:根据查询返回的与之相关的文档或信息。
4. 相关性:衡量检索结果与查询之间相关程度的指标,通常使用相关性排序算法进行排序。
5. 文档:信息资源的基本单位,可以是网页、文章、图片、音频等形式。
三、信息检索的主要技术1. 分词技术:将文本数据按照一定规则分割成有意义的词语,是信息检索的基础步骤。
2. 索引技术:将文档中的关键词与其所在位置进行索引,以提高检索效率和准确性。
3. 倒排索引:根据关键词构建索引表,记录关键词与文档之间的对应关系,常用于搜索引擎等场景。
4. 相似度计算:根据查询和文档的相似性,为检索结果进行排序。
5. 结果评估:通过评估检索结果的质量,改进检索算法和模型。
四、常用的信息检索模型1. 布尔模型:将查询和文档转化为布尔表达式,按照布尔运算进行检索。
2. 向量空间模型:用向量表示文档和查询,通过计算向量之间的相似度进行检索。
3. 概率检索模型:基于统计方法,利用概率模型进行信息检索。
五、信息检索的挑战和发展方向1. 大规模数据处理和存储:随着互联网的快速发展,信息资源呈指数级增长,如何高效地处理和存储大规模的数据成为了一个挑战。
2. 多语言检索:不同语言的信息检索在跨语言信息检索中面临很大的难度和挑战。
信息资源检索基础知识 检索基本原理
各种位置算符可以混合于一个检索式中,它们都隐含
有AND功能,由于不同的位置算符对两个词相对位置的要
求不同,在同一个检索式中若有两种以上的位置算符时,
应把要求严格的放在前面,从而提高查准率,节省查找时
间。运算符按照检索精度排序为:(W)>(nW)>(N)
>(nN)>(L)>(S)>(F)>(C)。位置检索对提高
② (L)算符
例如,“information system(L)system design”, 表示“system design”是“information system”的下一 级主题词。
15
信息资源检索基础知识
返回目录
2.1.1 传统的信息资源检索技术
3. 位置检索
除了上述介绍的词位置检索、同句检索和同字段检索 3个级别的位置检索外,还有一级位置检索叫做同记录检 索,它所用的位置算符为(C),(C)要求它两侧的检 索词同在一条数据库记录中出现。
18
信息资源检索基础知识
返回目录
2.1.1 传统的信息资源检索技术
4. 限制检索
➢ (2)限制符检索
限制符检索是使用AU(作者)、CS(作者单位)、 JN(刊物名称)、PY(出版年份)、LA(语言)等限制 符号从文献的外部特征方面限制检索范围和检索结果的一 种方法。限制符的用法与后缀符相同,而它的作用则与前 缀符相同。
句或者全文数据库的一个段落中出现,检索词的先后顺序 和插入词的个数不受限制。同句检索中用到的位置算符主 要是(S),是“Sentence”或“subfield”的缩写。
例如,“electronic(S)optical”,可以检索到题名 为“Cutting and Polishing Optical and Electronic Materials”的文献。
信息检索知识点
信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进展相符性比较,但凡信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,那么具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体.检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进展标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进展标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进展比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法〔1〕顺查法〔2〕倒查法〔3〕抽查法〔4〕追溯法〔5〕循环法5.信息检索的途径〔1〕部特征途径a)分类途径b)主题途径〔2〕外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:〔1〕简单,形式简洁,易于理解;〔2〕可操作性强,应用广泛;〔3〕构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常准确的语义概念;〔4〕能处理构造化提问。
缺点:〔1〕表达用户复杂需求效果欠佳〔2〕准确匹配无法提供定量比较〔3〕匹配标准不尽合理〔4〕检索结果不易控制7.概率排序原那么:如果一个检索系统对用户的每个检索提问的反响是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
8.什么是计算机信息检索.所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那局部信息的过程。
信息检索重点知识
信息:信息是事物存在的方式,运动状态及其特征的反映,是事物发出的信号,消息信息的特征:载体依附性无线共享性永不枯竭性开发增值性应用时效性存在普遍性知识:知识是信息的升华和结果,系统化理论化的的信息就称为就称为知识文献:用一定的方式记录在一定的载体上的知识都称之为文献信息源:个人为满足信息的需要而获得信息来源称之为信息源信息源类型:①个人信息源②组织机构信息源③实物型信息源④文献信息源⑤电子型信息源①及时、新颖、传递迅速、但带有主观随意性,久传易出错②内部信息源,共管理人员分析③直观性强,信息量大,有一定隐蔽性④当今数量最大,利用率最高的信息资源⑤内容广泛、使用简便信息资源:即作为资源的信息。
信息资源的构成要素: 信息生产者,信息,信息技术。
文献信息源分为:图书期刊学位论文科技报告专利文献标准文献产品样本会议文献政府出版物零次文献:未经出版发行或者未进入社会交流的最原始的文献一次文献:以作者本人取得的成果为依据而创作的作文报告等公开发表或出版的各种文献二次文献:按照特定的目的进行筛选,即所谓用一定的检索工具进行过加工的文献三次文献:根据二次文献提供的线索,选用大量一次文献的内容,经过筛选分类综合和浓缩而再度出版的文献信息素养DY:能认识到何时需要信息和有效的搜索评估和使用所需要信息的能力医学信息素养内容:信息意识信息知识信息能力信息道德(DY以医学信息获取、评价和利用等处理能力为核心)信息检索DY:信息检索包括信息储存和信息获取两个过程,信息的存储:根据信息的外表和内部特征,按照一定的组织编排,使之成为有序化信息集合的过程。
信息的获取:根据特定的需要,运用组织好的检索系统和工具,将特定信息找出来的过程。
信息检索的类型:文献检索事实检索数据检索信息检索原理:是通过对大量分散无序的文献信息进行收集,加工,组织,存储,建立各种各样的检索系统。
并通过一定量的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效的获取和利用信息源。
第1章_信息资源及检索基础知识
2013-6-17 2
信息的特征*
(1)客观性(本质属性) 地震,海啸,花草树林的发芽、生长和枯萎,广播电 视、网络的新闻、广告等等发出的信息,不管你知道 不知道,感知不感知,它都是客观存在。 只要有物质存在,就有信息的存在——不以人们的意 志为转移的。它是现实世界中各种事物运动与状态的 反映,它可以被人们所感知、处理、存储和使用。它 的客观性还表现在反映客观世界变化的信息包含在各 种物质之中。
信息F5:照片中王进喜身后反应塔、所握手柄的架式和井架密度。 知识K3:以扶手栏杆和反应塔的直径相比,推断出油井的 直径是5 米;井架密度推断出油田的大致储量和产量。。 知识K4:圆柱体的体积计算公式为: 柱体积= 底面积× 高
情报T2: 南北400 公里的范围—— 大庆油田的规模 情报T3:推出大庆 油田的年产量约 为100万吨——大 庆油田的产量
不同的情报对应不同的用户:科技部门——科技情报(信息);决策部 门——决策情报(信息);军事情报;经济情报„„
● 在西语中信息和情报都是“information”,不加以区别。
● 原国家科委于1992年决定用“科技信息”取代“科技情报”。
2013-6-17 8
1.4 基本概念-文献
文献:以文字、图形、符号、声频、视频等方式记录有知识的一切载体 载体:具备记录和传播知识信息的物质材料。如甲骨、青铜器、纸介型 、 胶片,磁带,磁盘,光盘等。 记录:构成文献的重要手段 文献的基本要素: (1)信息内容—文献的核心。 (2)信息符号—揭示和表达知识和信息的标记符号。 (3)载体材料—承载文献信息符号的物质材料。 (4)记录方式—将包含信息内容的信息符号存储到载体材料上去的方法。 知识、文献、情报间的关系
网络信息资源检索与利用 知识点
第一章1、情报定义:情报室人们用来解决特定问题所需要的,经过激活过程活化了的,具有使用价值的知识或信息。
2、文献定义:文献是记录知识的一切载体,即用文字、图形、符号或者声频等技术手段记录知识的物质载体。
或固化在物质载体上的知识。
文献具有三个属性即文献的知识性、记录性、物质性。
3、信息、知识、情报和文献的关系信息是物质存在的方式、形态和运动规律的表征,人脑对物质属性的感知形成信息,信息是起源,是基础;文献是信息、知识、情报的存储载体和重要的传播工具,信息知识和情报的内容只有记录在物质载体上才能构成文献;文献通过传递、应用于理论和实践又会产生新信息。
4、文献信息源文献信息也称文献资源,是用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息源。
5、文献信息源类型按照信息源的载体类型划分:印刷型缩微型声像型电子型按照信息源的加工程度划分:1)零次文献:零次文献是指尚未经过系统整理形成正式文献的零散资料或最原始的记录,如书信、手稿、笔记等。
2)一次文献:一次文献又称原始文献,是作者对自己研究的成果或创造性活动成果的直接记录。
一般是指公开出版的著作,期刊论文、科技报告、会议文献、学位论文、专利文献等。
3)二次文献:二次文献是将大量分散、无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,并按照一定的逻辑顺序和科学体系编制而成的系统化的文献。
二次文献包括目录、文摘、索引等,它们是二次文献的核心。
4)三次文献:三次文献是通过二次文献提供的线索,对某一范围的一次文献进行分析、综合研究、归纳、整理等深加工所生成的文献,包括素萍,百科全书、报告、年鉴、手册、字典等。
6、信息检索:广义上说信息检索是指将信息按照一定的方式组织和储蓄起来。
并根据信息用户的需求查找出相关信息的过程。
7、著录:是根据一定的规则,对文献的内容和形式特征进行分析、选择和记录的过程。
8、标引:1)按照标引的的工作方式分类:分为人工标引、计算机辅助标引、自动标引。
信息检索基础知识
例如:缩微平片、缩微胶片等。
声像型:
定义: 也称视听型,是指通过特定设备,使用光、声、
磁、电等技术将信息转换为声音、图像、影视和动 画等形式,给人以直观、形象感受的知识载体。 (一种非文字形式的文献) 优点:
信息存储密度高,形象直观、生动、逼真。 缺点:
成本高,不易检索和更新。 例如:录音带、唱片等。
专著(原始文献)
•ISBN号*
期刊
定义:
期刊一般是指名称固定、开本一致的定期或不定期 出版的汇集许多个著者论文的连续出版物。(期刊上刊 登的论文大多数是原始文献)
按内容分:学术性期刊、通讯性期刊、述评性期刊等。
例如:
按时间长短分:周刊、月刊、双月刊、季刊、年刊等。
ISSN号*
报纸
定义:
报纸是以刊载新闻和时事评论为主的定期向公众发 行的印刷出版物。是大众传播的重要载体,具有反映和 引导社会舆论的功能。
广义:信息、信息生产者、信息技术和设备。
二、信息资源(文献)的类型
(一)按文献的载体不同划分: 1、手写型 2、印刷型 3、缩微型 4、声像型 5、电子型 6、多媒体型 (二)按文献的出版形式不同划分: 1、图书 2、期刊 3、报纸 4、会议文献 5、学位论文 6、科技报告 7、专利文献 8、标准文献 9、产品样本 10、档案 11、政府出版物 (三)按文献的加工程度不同划分: 1、零次文献 2、一次文献 3、二次文献 4、三次文献
知识固化在纸张上的一类文献。 优点:
便于阅读、传递,便于大量印刷,成本低。 缺点:
信息存储密度低、分量重,体积大,收藏空间大, 保存期短,管理困难。
例如:图书、期刊、报纸以及各种印刷材料。
缩微型:
信息检索基础必备知识点
1、信息检索的定义:是指将信息按一定的方式组织和存储起来,并根据信息用户的需求找出相关的信息的过程和技术。
信息检索的作用:a:节省查找文献的时间。
b:有利于文献专题查找。
c:克服语言障碍。
2、信息:所有事物的存在方式和运动状态以及关于所有事物的存在方式和运动状态的陈述。
信息的特征:普遍性、客观性、抽象性、依附性、可加工性、传递性、共享性。
信息的作用:(1)信息是人类社会生存的条件,信息是人类社会发展的资源(2)信息是主客体的中介,信息是思维的材料(3)信息是组织的保证,信息的管理的基础(4)信息是决策的依据,信息是控制灵魂文献的特点:(1)数量急剧增长(2)内容交叉重复(3)专业文献出版分散(4)文献老化加快(5)文献语种繁多(6)文献载体形态增加文献类型:(一)按照载体的形式不同,文献可分为:1、印刷型2、缩微型3、声像型4、电子型(二)按照内容、性质和加工深度的不同,文献可分为:1、一次文献2、二次文献3、三次文献4、零次文献(三)根据性质、特点和出版形式的不同,文献可分为:1、科技图书2、科技期刊3、科技报告4、政府出版物5、会议文献6、专利文献7、学位论文8、标准文献9、科技档案10、产品样本a、主题语言主题检索语言是用语词来表达文献主题概念,它不管各语词之间相互关系如何,一律按字顺排列成主题词表,故称主题检索语言。
分为标题词语言、关键词语言和叙词型语言三种。
○2关键词语言:由于关键词语言能适应使用计算机的需要,因而大大加速了文献标引过程,缩短了检索工具出版的时间,便于用来检索最新文献,大大增加了检索点,使用灵活方便。
查准率和查全率较低。
○3叙词型语言:用途较广,既适合于手工检索,又适合计算机检索语言。
6、信息检索的途径:书名途径,著者途径,序号途径,分类途径,主题途径。
7、信息检索方法:(一)常用法所谓常用法,顾名思义是检索中最为常用的方法,指利用成套的检索工具检索文献信息的方法,也称之为工具法。
大一信息检索知识点总结
大一信息检索知识点总结信息检索是指通过计算机技术和各种检索方法,从大规模文献资源中快速、准确地获取用户所需信息的过程。
在大一学习信息管理与信息系统专业的过程中,我们需要了解一些关键的信息检索知识点。
本文将对大一信息检索的相关知识进行总结,帮助同学们更好地理解和掌握这一领域的基础知识。
一、信息检索的基本概念与原理(1)信息检索的定义:信息检索是指根据用户的需求,在文献、数据库和其他信息资源中寻找与之相符合的信息的过程。
(2)信息检索的基本原理:包括索引构建和检索处理两个阶段。
索引构建阶段将信息资源进行结构化整理,并建立相应的索引表;检索处理阶段通过用户提供的检索词,结合索引表,通过匹配算法找到与之相关的信息资源。
二、信息检索的关键技术(1)词项选择与权重计算:根据用户需求,选择合适的检索词,并使用权重计算方法为词项赋予合适的权重,提高检索效果。
(2)检索模型:包括布尔模型、向量空间模型和概率模型等不同的模型,用于描述检索系统中信息资源与用户需求之间的匹配关系。
(3)评价指标:用于评价检索系统的性能,常见的指标包括召回率、准确率以及F值等。
(4)查询扩展:通过对用户查询词进行扩展,提高检索系统的召回率和准确率。
三、信息检索的常用工具和技术(1)搜索引擎:如百度、谷歌等,通过互联网收集、分析并索引网页信息,为用户提供搜索服务。
(2)数据挖掘:通过对大规模数据进行模式识别和深入分析,挖掘其中有价值的信息,为决策提供支持。
(3)文献管理工具:如EndNote、NoteExpress等,用于管理、组织和检索学术文献。
(4)信息可视化技术:通过可视化手段,将海量的信息以直观的方式展示给用户,提高信息的理解和使用效率。
四、信息检索的应用领域(1)图书馆信息服务:包括文献检索、馆藏资源管理、读者咨询等。
(2)企业信息管理:包括企业知识管理、产品信息检索、竞争情报等。
(3)科学研究与学术交流:通过信息检索工具,快速获取相关领域的最新研究进展和学术成果。
信息检索知识点范文
信息检索知识点范文信息检索是指从大量的信息中找到与用户需求相关的信息的过程。
以下是信息检索的一些重要知识点:一、信息需求分析:1.了解用户需求:包括明确用户的信息需求,了解用户的背景和需求的具体要求。
2.制定信息策略:确定的关键词、限定范围、排除冗余和无关信息的策略。
二、信息源:1.内部信息源:组织内部的数据库、档案等。
2.外部信息源:包括互联网上的网页、文档、图片等。
三、信息检索模型:1.自动索引:使用关键词或主题对文档进行描述和索引,并建立索引词表,方便用户检索。
2.布尔模型:将检索式表示为逻辑表达式,利用逻辑运算符对检索词进行组合,实现精确的文档检索。
3.向量空间模型:通过计算文档和查询的向量空间相似度,将文档按相关性排序。
4.概率检索模型:通过统计分析文档和查询的概率模型,计算文档的相关性概率。
5.链接分析模型:根据页面之间的链接关系和链接的权重等信息来评估页面的相关性。
四、检索评价:1.检索精度:通过计算检索结果的相关文档和非相关文档的比例,来评估信息检索系统的精确性。
2.检索效率:评估信息检索系统执行查询的速度和资源消耗程度。
3.检索一致性:评估系统在连续多次查询时的稳定性和一致性。
五、信息检索技术:1.关键词:通过输入关键词进行检索,系统会返回与关键词相关的文档。
2.高级:包括利用限定符进行、布尔逻辑、通配符等。
3.相关性反馈:根据用户的反馈信息,调整检索结果的排序,提高检索的准确性。
4.语义分析:通过对查询语句和文档的语义进行分析,找到语义上的相关性。
5.分布式检索:将索引和查询分发到多个节点上进行检索,提高速度和可靠性。
六、信息检索系统的应用:1. 网络引擎:例如Google、百度等,为用户提供互联网上的信息服务。
2. 文献检索系统:用于科研人员查找相关文献,例如PubMed、IEEE Xplore等。
3.图像检索系统:通过图像的内容特征进行检索,例如相似图片、人脸识别等。
4.音乐、视频检索系统:通过音乐或视频的特征进行检索,例如识别歌曲、相似视频等。
信息资源检索基础知识
记录号
•题录著录格式 如下:
题名
著者姓名
030301007 网络时代的管理创新/高维钫(北京 邮电大学文法经济学院)//经济管理.—— 2002,13(6),53-55
著者可单编辑位版
原文出处
11
与目录区别 目录 题录
著录对象不同 单位出版物
单篇文献
可编辑版
12
不仅描述文献的外表特征,而且
文摘
还揭示文献的内容特征,是带有 文摘内容的、扩展了的题录 。
可编辑版
7
2、信息资源检索系统的类型
目录、题录、文摘、参考工具、全文数据库和搜索引擎
按著录方式划分 手工检索系统、计算机检索系统、 按存储介质划分 穿孔卡片系统、缩微品检索系统
按检索手段划分
脱机检索系统、联机检索系统、 光盘检索系统、网络检索系统
可编辑版
8
目录
是对一批相关文献外表特征的揭示 和报道,是有序的文献清单。
U 交通运输
I 文学
V 航空、航天
J 艺术
X 环境科学、安全科学
K 历史、地理
Z 综合性图书
可编辑版
35
C 社会科学总论
C8 统计学
C91 社会学
C92 人口学
C93 管理学
C931 管理技术方法
.1
管理数学
.2
管理的方式方法
……
C933 领导学
C934 决策学
C935 管理计划和控制
C936 管理组织学
可编辑版
48
一、检索策略与检索步骤
1、检索策略
广义
为实现检索目标而制定的全盘计划或
方案
狭义
检索式
可编辑版
信息检索知识点
计算机检索1.信息素养(信息素质、信息能力):作为具有IL(information literacy)能力的人,必须能够充分地认识到何时需要信息,并有能力去有效地发现、检索、评价和利用所需要的信息,从而具有终身学习的能力,总能够为任何任务和决策找到所需信息。
2.信息检索广义:指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。
包括存储和检索两个过程。
狭义:从信息集合中找出所需信息的过程。
信息查找(Information Search,Information Seeking)2.1信息现状分析1)信息爆炸导致文献量急剧增加,容相互渗透,语种增多;文献分布异常分散;文献寿命愈来愈段;2)由于条件限制,人们吸收和利用信息的能力并未得到相应的提高。
3.检索的作用1)促进智力资源的开发;2)协助管理者做出正确的决策;3)帮助科研人员借鉴前人的研究成果,避免重复劳动;4)信息检索是知识更新的手段。
4.数据库类型(1):作为图书馆数字资源的数据库特指为科学、教学、学习所需各种参考资料的集合,以数据库的形式管理和利用。
自建数据库:馆藏目录(OPAC),本校学位论文数据库。
商业性数据库:数据库商、出版商和其他机构以商业化方式提供的各种电子资源,图书馆需要支付一定的费用购买数据库的使用权再提供给一定的读者群。
免费数据库:开放获取资源、机构典藏和其他免费的网络资源。
5.数据库类型(2)从收录文献的容分,有综合性数据库和专业性数据库之分;从收录文献的类型分,有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、标准数据库等;从提供文献的形式分,有全文数据库、文摘数据库、引文数据库;各数据库举例:专业数据库:Petroleum Abstract(PA)、EnCSciFinder Schoiar(CA) 综合性数据库:读秀、Scopus、EI、SCI特定文献类型,如图书、期刊、学位论文等:超星、EIsevier ScienceDirect、PQDT全文数据库:CNKI、维普、SPE摘要性数据库:EI、PA引文数据库:Web of Science、CSSCI(中文社会科学引文索引)6.Science Citation Index Expanded(SCI-E)是个什么样的数据库?它是ISI检索平台中Web of Science核心合集中的一个子库它是一个摘要型数据库它是一个引文数据库它是一个期刊数据库它收录的学科围包括科学、技术的各学科7.查文献应该如何选择数据库?学科专业:有专业型数据库时,首选专业型数据库;数据量:选择数据量大的;文献类型:根据研究的需要。
信息检索知识点
信息检索知识点 Revised by Liu Jing on January 12, 2021信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)着者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
信息检索基本知识
琼州学院 胡爱民
Logo
检索结果
急性胰腺炎、急性重症胰腺、急性胆源性 胰腺炎、急性出血坏死型胰腺炎等急性胰腺炎
琼州学院 胡爱民
Logo
使用MEDLINE(06/7-06/10)查找免疫相关 的文献结果
琼州学院 胡爱民
Logo
应用举例(二)
“?”的应用
例如:拉米?定:可检出含拉米夫定和拉米呋定
定的文章; Protein?:可检出含 Proteins 和 Protein的所有文章
狭义的信息检索是指根据用户的需求,利用检索 工具或检索系统,查找出符合用户特定需要信息 的过程。
琼州学院 胡爱民
Logo
2.类型
检索手段
手工检索
计算机检索
联机检索 光盘检索 网络检索
琼州学院 胡爱民
8
Logo
第二节
信息检索原理
一、信息检索工具
定义:又称信息检索系统,是指累积文献 信息并提供检索途径的工具。 类型:
A
B
例如:用CBM查找1978年以来有关艾滋病的文献
检索式为:艾滋病 OR 爱滋病 OR AIDS OR 获得性免疫缺陷综合征
琼州学院 胡爱民
Logo
例1:用CBM查找1978年以来有关艾滋病的文献
AIDS
5574篇
爱滋病
469篇
艾滋病
19869篇 22834篇
艾滋病 OR 爱滋病 OR AIDS OR 获得性免疫缺陷综合征
琼州学院 胡爱民
数据库处 理
中国 图书馆 分类法
字段名
格式规 范 医学 主题词表 (MeSH)
琼州学院 胡爱民
Logo
两大外文保障中心
外文文献
信息检索基本知识
叙词
•叙词是主题语言的高级形式。是以较正规和正式的 科学名称为基础组织而成一种主题法检索标识系统。 •由在概念上不可再分的基本概念单元词汇组成,检 索时可以利用这些单元词进行组配,以表达一个复杂 的概念。
•如课题: 太阳能热水器研究 汉语主题词表中正式主题词是太阳能利用、太阳 能加热等代替。
标题词
中国图书馆图书分类法
• 简称《中图法》,由中国图书馆图书分类法编辑委 员会编。1975年科学技术文献出版社出版第一版。 • 使用字母与数字相结合的混合号码,基本采用层累 制编号法。 • 《中图法》主要供大型图书馆图书分类使用。另外 为适应不同图书信息机构及不同类型文献分类的需 要,它还有几个配套版本:《中国图书资料分类 法》、《中国图书馆图书分类法(简本)》和 《〈中国图书馆图书分类法〉期刊分类表》等。 • 自1988年起,中国出版图书的标准书号中采用《中 图法》的大类号。
关规定和格式撰写的,能完整而真实地反映其所从事科 研活动的技术内容和经验的特种文献。具有内容翔实、 具体完整,技术含量高,实用意义大,便于交流,时效 性好等特点。做好科技报告工作可以提高科研起点,大 量减少科研工作的重复劳动,节省科研投入,加速科学 技术转化为生产力。
•会议文献:指学术会议文献。
•学位论文:是高校研究生、毕业生为获得学位进行 科学研究而写出的学术性论文中,常含有独创性的学 术性文献资料。 •专利文献:专利是与产业活动密切相关的,实用性 非常强。根据专利的技术水平和应用情况,其类型有 invention(发明)、utility patent(实用新型)、和 design patent(外观设计)等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息资源检索部分知识点
据等。
事实检索:就是对特定的事件或事实的检索。
事实内容包括大量的科学事件和社会事件。
例如:我国建成最早的高速公路是哪条?何时建设?
概念检索:就是查找特定概念的含义、作用、原理或使用范围等解释性内容或说明。
最常见的概念检索是查找各种参考工具书,例如字词典、百科全书、名录、手册、指南等参考工具书。
4、经常使用的检索语言有哪些?主题检索包括哪几种检索?
答:检索语言:分类语言,主题语言(标题词、单元词、叙词、关键词),引文语言,代码语言。
书名、刊名、篇名等、著者名称、号码(如报告号、专利号、文献序号等)、文献类型。
主题检索:标题词、单元词、叙词、关键词
二章
1、计算机检索有哪些特点?
答:检索速度快,效益高;
检索功能强,数量大;
检索途径多,手段灵活;
检索范围广;
服务方式多。
2、数据库的类型有哪几种?
答:参考(文献书目型)数据库:是指包含各种数据、信息或知识的原始来源和属性的数据库;是机读的目录、索引和文摘检索工具,检索结果是文献的线索而非原文。
存储的是二次文献,包括文献的外部特征、题录、文摘和主题词等。
这类数据库占用很大的比例
全文数据库:存储的是原始文献的全文,如杂志论文、报纸新闻、法院案例等。
全文检索可直接获取原始资料,而不是书目检索时的线索,提高了用户的检索效率。
事实数据库:存储的是用来描述人物、机构、事物等信息的情况、过程、现象的事实数据。
数值数据库:主要包含的是数字数据,如各种统计数据、科学实验数据、科学测量数据等。
3、信息检索的方法和步骤?
4、答:信息检索的方法:检索方法是指查寻文献信息的具体方法。
选择科学有效的检索方法,对广、快、精、准地获取文献信息,提高检索效率,是非常重要的。
直査法:指直接从有关的一次文献中获取所需
信息的检索方法。
追溯法:指利用引文关系获取所需文献信息的检索方法。
工具法:利用检索工具或检索系统获取所需文献信息的检索方法。
顺查法、倒查法、抽查法综合法:又称循环法,是指直査法、追溯法、工具法综合运用的检索方法。
交替检索、分段检索、间隔检索。
1、分析课题,确定检索目标:明确检索的目的、课题分析(1)分析主题内容。
通过主题分析,形成检索需要的主题概念,以便确定检索途径。
(2)分析课题所涉及的内容及学科范围,以便确定有关检索标识(分类号)及选择合适的检索工具或检索文档。
(3)分析课题所需信息的类型,包括文献媒体、出版类型、所需文献量、年代范围、涉及语种、有关著者、机构等。
(4)确定课题对查新、查准和查全的指标要求。
2、选择检索词,制定检索策略
方法一:切分
以词为单位,对课题语句进行拆分
方法二:删除
去除禁用词及不具检索意义的词汇
方法三:置换
用含义明确的词汇替换原课题用语
方法四:增补
分析隐含概念,挖掘潜在的主题词
就是指计算机信息检索系统中用来表达检索提问的逻辑表达式,由检索词和各种运算符及系统规定的其它组配符构成。
合理运用逻辑运算符构造检索式。
符号的使用一定要正确、符合概念逻辑,并力求简洁、优化,还应注意运算符的优先级和括号的使用。
3、选择数据库或检索工具
⏹选择数据库根据检索目标,确定检索目的、涉及的学科范围和信息类型,选择合适的数据库。
⏹具体选择过程中还应考虑数据库的类型(参考、全文还是电子期刊)、内容(专利、标
准、会议)、收录的数据学科范围、数据库
的更新周期,收录文献的语种等因素。
⏹例如,要看全文就要选用全文数据库或电子
期刊;要查标准或专利就要选择标准库或专
利库
4、上机检索及调整检索策略:文献内容特征的检索途径包括:分类途径、主题途径(标题、关键词、主题词、文摘、全文)
表达文献外部特征的检索标识有:著者、著者单位、文献出处、专利号、报告号等。
5、输出和分析结果
⏹检索完成后,采用一定的输出方式(套录或
打印)和格式输出检索结果。
各个数据库提
供了多种输出格式,每种格式能得到的文献
内容特征和外表特征都不一样,一般情况
下,文献检索中篇名、作者、出处、文摘等
字段是不可缺少的,因为这些字段有一定的
参考意义。
⏹结束检索后,对结果进行分析,也是完整检
索过程中不可缺少的一步,有助于提高检索
质量。
三章
⏹熟悉“中国学术文献网络出版总库”平台的
检索方法
⏹你利用CNKI的数字出版平台关注的板块
和功能有哪些?
资源整合
⏹创建个人数字图书馆并对你的课题建立订
制服务。