信息检索资料
信息检索复习资料
信息检索公选课复习资料1.信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。
2.知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。
3.情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。
4.文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。
5.会议文献是指在国内外学术或非学术会议上发表的论文或报告。
6.学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。
7.著录是对文献内容和形式特征进行选择和记录的过程。
8.数据检索是指特定的数值型数据为对象的检索。
9.按信息的加工层次分类:(含义)一次文献:原始文献,图书、报纸、期刊、会议纪录、专利报告等二次文献:目录、题录、索引、文摘三次文献:论文丛集、综述、年鉴百科全书一次信息资源 (原始文献):以作者本人在生产和科研中所取得的成果为依据而创作的原始文献所传递的信息资源。
二次信息资源(检索工具):将分散的、无组织的一次信息资源,按一定的原则加工、整理、简化、组织成为系统的、便于查找利用的信息资源。
三次信息资源(参考性文献):在合理利用二次信息资源的基础上,选用一次信息资源的内容,根据一定的需要、目的进行分析、综合或浓缩重组而得到的信息。
二次信息资源与三次信息资源的区别:对象不同:二次信息资源以“篇”或“本”为单位进行加工;三次信息资源则归纳了较多的一次信息内容用途不同:二次信息资源为检索一次信息的工具;三次信息资源能直接提供检索答案.10. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。
11. 文献检索方法:指文献信息资源的一般检索方法,也是利用各种检索工具检索文献信息资料的最常用的方法。
信息检索复习资料(有答案版)
1.请说明一次文献、二次文献和三次文献的特点和功用。
(1)一次文献(Primary Document):通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。
如期刊论文、科技报告、会议论文、专利说明书(2)二次文献(Secondary Document):是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。
二次文献的重要性在于可以帮助人们查找一次文献。
如目录、题录、文摘、索引、各种书目数据库(3)三次文献(Tertiary Document):是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。
包括综述研究和参考工具两类。
如综述、述评、词典、百科全书、年鉴、指南数据库、书目之书目2.请说明题录目录文摘的特点以及区别(1)题录是揭示和报导单篇文献外表特征的工具。
特点:以单篇文献为著录对象(2)目录是系统积累和提供图书、期刊和其它单行本的名称、收藏单位和索取号等外表特征的揭示和报导的工具。
特点:以单位出版物为著录对象,反映馆藏情况,主要揭示文献外部特征(3)文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。
特点:带摘要的题录3. 布拉德伏特文献文献分散定律和期刊影响因子的概念(1)布拉德福文献分散定律:本专业文献的1/3刊登在本专业核心期刊上,另外的2/3则分散在其他的相关期刊和边缘期刊上。
如果将科技期刊按其刊载某专业论文数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个领域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2......的关系。
(2)期刊影响因子的概念是:某一种期刊在第三年得到的前两年的引文数与该刊前两年的总论文数之比。
4. 请阐述信息、知识、情报的概念,并分析它们三者之间的关系。
查找资料的方法
步骤4 制定检索策略
你所要的资料可能好几个地方都有,
或详或略,或深或浅,同时,还有一
个时间和精力的因素,你必须综合起
来加以考虑,制定恰当的工作策略。
如果查原始资料,就要找
;如果查出处或注释最好找
;
如果只了解一般情形梗概,找 。
步骤5 实际检索操作
在实施既定的检索策略中,要注意修改 检索策略,及时记录检索到的新信息, 补充到下一步的检索过程中。
• 根据步骤l中的问题或信息的性质选择检 索工具,确定是通过百科全书等参考性 工具书,还是通过报刊索引等检索性工 具书进行查找;确定是使用手工检索, 还计算机检索。
步骤3 确定检索途径
按照先近后远,先易后难的原则。即是 去本校的图书室,还是去本地区的图书 馆;是向教师请教,还是向有关专家咨 询;是采用分类、主题途径检索,还是 采用著者、号码、题名途径检索。
查找资料的方法
信息检索的类型:
• (信息检索(information retrieval)是指从 任何信息集合中查出所需要信息的活动。 (1)以内容区分的信息检索类型 ①文献检索(document retrieval) ② 数据检索(data retrieval) ③事实检索(fact retrieval)
资料,如果检索速度慢了,耽误了时机,就会 失去它的应有价值。
文献信息检索的一般步骤 • 步骤1 研究课题分析
• 对研究课题提出问题,然后分析这些问题与课 题的关系,以确定想要查询的信息或问题的类 型。
• 弄清楚在课题研究中存在的问题是什么,从而 确定需要查找的是数据,是概念,还是基本事 实。
步骤2 选择检索工具
• (2)以方式区分的信息检索类型
手工检索
计算机检索
信息检索重点复习资料 2
第一章信息检索概述信息检索(IR):将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
信息素养:人们在解答问题时利用信息的技术和技能。
信息检索与文献检索的主要区别:文献检索是以获取文献信息为目的的检索,信息检索是收集,组织,存储一定范畴的信息,并根据用户需求查询文献中的信息或知识单元,比文献检索更深入。
信息检索的分类:1、根据检索手段不同可分为1)手工检索2)光盘检索3)联机检索4)网络检索 2根据检索对象形式不同可分为文本检索、数值检索、音频与视频检索。
信息检索的原理:通过对大量的分散无序的文献信息进行收集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储和检索这两个过程所采用的特征标识达到一致,以便有效的获得和利用信息源。
存储是检索的基础,检索是存储的目的。
信息检索语言是人们在加工、存储和检索信息时用来描述信息内容喝信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。
信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。
其物理结构:是信息检索所用的硬件资源、系统软件以及信息资源集合(数据库)的总和。
信息检索语言的主要目的:把存储和检索联系起来,把标引人员和用户联系起来,以便取得共同理解,实现交流。
信息检索的历史:最早的信息检索主要依靠信息分类。
1手工检索 2机械信息检索。
3脱机批处理检索是计算机初期使用的一种检索系统 4联机检索 5光盘检索 6 网络信息检索后四者统称为计算机信息检索信息检索的三个经典模型:1布尔模型 2向量空间模型 3概率模型1浏览型模型:扁平式模型、结构导向模型、超文本模型 2检索型模型:结构化模型、基于内容的检索型模型。
信息检索模型是信息检索的核心。
信息检索系统:是具有信息存储和信息查询功能的一类服务设施。
信息检索系统按功能划分5种类型:文献检索系统DRS、数据库管理系统DBMS、自动问答系统QAS、管理信息系统MIS、决策支持系统DSS.信息检索物理结构1计算机硬件2软件3数据库信息检索的逻辑结构是指系统所包括的功能模块或子系统及其相互关系。
文献检索复习资料
第一章网络信息概述一. 基本概念1信息狭义:信号和消息广义:是物质的存在方式和运动方式的体现,是物质的一种客观存在,它反映了物质客体及其相互作用、相互联系过程中表现出来的种种状态与特征。
2 知识按照表述方法可以分为两类:显性知识和隐性知识显性知识,又称可编码的知识,是记录于一定物质载体上的知识,可以看得见,摸得着的,可以通过正常的语言方式传播的知识。
以文字、语言、图像的形式保存下来,如专利、商标、计划、软件设计报告等等。
显性知识是可以编码和表述的,有载体的。
隐性知识又可称为不可编码的知识,是存储在人们大脑里的经历、经验、技巧、体会、感悟、智能等尚未公开的秘密知识,就是你看不见、摸不着,只可意会不可言传,难以直接交流和表达出来的知识。
隐性知识的特点是不易被认识到、不易衡量其价值、不易被其他人所理解和掌握3文献是记录有知识的一切载体。
精确描述:凡是用文字、图形、代码、符号、音频、视频等方式记载在一定载体上的每一件记录,均称为“文献”。
构成文献要素有三,知识、记录与载体方式。
4情报是人们在一定时间内为一定目的而传递的有使用价值的知识或信息。
钱学森:“情报是激活了的知识”情报是对特定的人而言的,对需要它的人而言是情报,对不需要的人而言它只是信息与知识。
知识与信息转化为情报必须经过传递、只有将特定的知识与信息传递到特定需要的人那里,它们才能成为情报。
传递是情报的一个基本特征。
二. 网络信息的特性1 性质客观性寄附性传递性共享性衍生性时效性2 特点数量大来源广语种多多媒体传播快跨国界内容杂更新快三. 网络信息的资源1 知识信息网站教育和科技部门网站,如:学校、科研单位、学术团体、政府部门等。
2 文献信息网站出版和收藏文献网站。
有数字图书馆,如:超星、书生之家等;数字平台,如:中国知网、万方、维普等。
四. 网络信息的检索主要信息网站种类:政府网站(.gov)免费教育机构(.edu)科研部门(.ac)商业网站(.com)收费社会组织(.org)互联网络(.net)五.图书馆印刷型文献:图书、期刊、工具书、报纸电子型文献:随书光盘、电子期刊数据库、电子图书及其他数据库1. 按文献内容性质划分(不同加工深度)零次文献(Zeroth Litterature) 是指非正式出版或非正式渠道交流的文献,未公开于社会,只为个人或某一团体所用。
《计算机基础》信息检索资料
组
纸质书刊、资料 件、信息存储数据库、 检索软件、联机数据库、 端、通讯网络、网络数
成
通讯网络
通讯网络
据库
检索方法较简单,检索
设备简单,检索费用 检索范围广泛,检索速度
优 直观,信息存储
较灵活、方便,及时性
低,检索技术容 易掌 快,检索功能强,及时性
点 与检索费用低
好,检索费用和速度均
握
好
低
缺 检索入口少、速 点 度慢、效率较低
天网除提供WWW主页检索外,还提供FTP站点搜索(“天网文件”),为 高级用户查找特定文件提供方便。同时,天网将FTP文件分为电影和动画片、 MP3音乐、程序下载及文档资源共4大类,用户可以像目录导航式搜索引擎那样 层层深入、查找自己需要的FTP文件。
8.5 常用搜索引擎使用介绍
2.使用方法
(1) 启动方法
更新不够及时
检索技术复杂,设备要求 高、检索费用昂贵。
8.3 网络检索系统
1. 用户如何在网络上找到信息?
解决之道:搜索引擎
2. 搜索引擎的分类:
目录(Directory,或 Catalog); 基于Robot的搜索引擎; 元搜索引擎 (用得较少)。
8.3.1 目录
目录:目录方式所使用的数据库是依靠专职编辑或志愿人员建立起来的。 目录的用户界面基本上都是分级结构。有两种使用方式:
当用户只知道需要检索的大致内容,而没有明确的关键词时,可以使用分类检 索。
【例8.1】:查找西 安交通大学的网页。
方法: • 从“网站分类”逐步查找
8.5 常用搜索引擎使用介绍
• 找到目的网页, 双击打开。其中 名称后面的@号 表示还有下一级 目录。
启动IE浏览器,在地址栏输入:
信息检索资料类型
信息检索资料类型
信息检索是一种通过计算机检索技术,从大量信息资源中获取需要的信息的过程。
在信息检索中,可用的资料类型有很多,包括文字、图片、音频、视频等。
下面是一些常见的信息检索资料类型:
1. 文字资料:指以文字为主要形式的资料,如电子书、论文、新闻、博客等。
文字资料在信息检索中占据了非常重要的地位,因为大部分的信息都是通过文字表述的。
2. 图片资料:指以图像为主要形式的资料,如照片、插图、地图等。
图片资料在信息检索中也很常见,特别是在需要获取视觉信息的场景中,如设计、建筑、地理等领域。
3. 音频资料:指以声音为主要形式的资料,如音乐、电台广播、讲座、语音识别等。
音频资料在信息检索中也非常重要,特别是在需要听觉信息的场景中,如语言学、音乐学、语音识别等领域。
4. 视频资料:指以视频为主要形式的资料,如电影、纪录片、演讲、广告等。
视频资料在信息检索中也很常见,特别是在需要获取视听信息的场景中,如电影、电视、教育、演讲等领域。
综上所述,信息检索中可用的资料类型非常多样化,根据不同的需求和场景,可以选择合适的资料类型来进行检索和获取信息。
- 1 -。
信息检索 复习资料
第一部分:基本常识1.文献按照出版形式可分为哪几种类型?举例。
图书、期刊、报纸、特种文献。
图书:专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等期刊:化学学报、煤炭学报、电工技术学报、高等教育研究、建筑工程与科学在CNKI 期刊全文数据库中检到共209条记录:国际城市规划、建筑结构学报、交通运输工程学报、建筑经济、土木工程学报、岩土工程学报、岩土力学、空间结构、地震工程与工程振动、中国给水排水、工程力学世界建筑工业建筑工程勘察中外建筑工程建设等。
报纸:人民日报特种文献:科技报告、会议文献、专利文献、学位论文、政府出版物、标准文献、产品资料、科技档案美国政府的四大报告1、国防部的AD报告2、商业部的PB报告3、国家航空及宇航局的NASA报告4、能源部的DOE报告。
2现代科技文献具有的特点哪些?答:(1)数量多、增长快, (2)出版形式多、文种多,(3)文献异常分散, (4)文献失效加快, (5)报道内容重复交叉, (6)文献总体质量下降3什么是核心文献、相关文献和边缘文献?答:核心文献通常是指与本学科发展水平、发展动向密切相关的一些文献。
如核心期刊等。
相关文献和边缘文献是指内容与学科的关系相对疏远一些的文献。
相关文献和边缘文献是本学科和其它学科相互渗透、互相结合的结果。
4 什么是文献?构成文献的有哪四个要素?答:文献的定义是记录有知识的一切载体称为文献。
构成文献的四要素是:知识内容,信息符号,载体材料,记录方式。
5 电子文献的主要类型和文件格式是什么?答:(1)按照载体的形态,电子文献可以有软磁盘(FD)、只读光盘(CD-ROM)、可擦写光盘(CD-RW )等之分;(2)按照文献的电子格式,电子文献有文本格式的txt文件、doc文件、pdf文件,图像格式的 gif文件、jpg文件以及标记文件格式的 html文件和xml文件之分;(3)按照出版周期和内容特点,电子文献可以有电子期刊,电子图书,电子报纸以及数据库等之分;(4)按照内容的性质和时效性,电子文献可以有论文文献和动态消息之分;(5)按照版权状况,电子文献又可分为有版权电子文献和无版权电子文献两类;(6)从文献信息利用的角度来看,可分为有版权的电子期刊、电子图书、报告的学术价值相对较高,而单篇论文和动态性的电子文献有时虽然没有注明版权,也有相当的参考价值。
信息检索考试学习资料
第二章信息与信息资源第一节信息、知识、情报和文献一、信息、知识、情报和文献的1、信息信息是客观存在的事物现象,是生物体或具有一定功能的机器可以感知的客观事物发出的一切有意义的信号和信息。
2、知识知识就是人类认识的成果或结晶,知识也就是信息,是信息的高级形式。
3、情报情报是指用不同的方法和手段,在有效的时间内所获得的有针对性和有价值的知识。
4、文献人们用文字、图形、符号、声频和视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或设置在感光胶片上,或录制在胶片上,或存储在磁带、磁盘上。
这种附着在各种载体上的知识,统称为文献。
文献就是记录有知识的一切载体。
5、信息社会建立在以知识生产、分配、加工和利用基础的新型社会。
第二节信息资源的类型一、按出版形式分1、图书2、期刊3、科技报告4、会议文献5、学位论文6、专利文献7、标准文献8、技术档案9、产品资料10、政府出版物二、按加工内容的深度分1、零次文献未经公开发表或未交流的文献2、一次文献是指以作者本人的研究成果为依据而创作的原始文献。
如学术报告、报刊论文、科研报告、学位论文、档案资料、会议论文等。
3、二次文献二次文献是对具有信息检索价值的一次文献进行搜集、整理、加工、提炼,按一定顺序组织起来的文献。
主要包括书目、索引、文摘、题录等。
是用来报道和检索一次文献的检索工具或检索系统。
4、三次文献是指利用二次文献,搜集大量一次文献进行研究,经过系统整理综合分析而撰写出来的文献。
主要包括综述、年鉴、词典、手册等。
第三章信息检索第一节信息检索概述一、信息检索的定义广义的讲,信息检索就是将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
它包括信息存储和检索两个过程。
狭义的讲,信息检索是从信息集合中找出所需要的过程,即信息的检索过程。
二、信息检索原理信息检索的基本原理就是将信息存储和检索两个过程中的存储特征标识和检索提问标识进行对比,二者匹配达到一致,即可获取符合条件的信息。
信息检索基础知识
通识课课程图书类别
课程名称
思想道德与法治
中国近现代史纲要 马克思主义基本原理 毛泽东思想和中国特色社会主义理论体系
习近平新时代中国特色社会主义思想概论
形式与政策 大学生心理健康教育与安全教育 大学体育 大学英语 大学计算机 军事理论 军事技能 大学生国家安全教育 python程序设计 大学生创新创业教育 职业生涯与发展规划 就业指导 劳动教育 大学数学
查全率recall ratio:从检索系统中找到的相关结果量与检索系统中相关结 果量的比率。
查准率precision ratio:从检索系统中找到的相关结果量与找到结果总量 的比率。
漏检率、误检率、检索速度等
(1)逻辑“与”: 用AND(或*)表示) (2)逻辑“或”: 用OR(或+,或l)表示) (3)逻辑“非”: 用NOT(或-)表示
存储过程
分析 分析
文献信息 特征
标引著录
选用
题名:信息素养与信息检索 作者:周建芳
检索 语言
和
名称 规范
形成
文献信息 标识
形成
(标引词)
形成 检索提问
标识 (检索词)
输出 检索系统 (标识匹和类名来表达信息内容的主题概念, 并将各种概念按学科性质和逻辑层次结构进行 分类和系统排序的语言。(中国图书馆分类法)
统计分析,得出结论
调整检索方式
健康服务与管理 CNKI,VIP,万方……
主题检索 循环法 实施检索 查找信息 获取原始文献 定行定量分析 统计分析,得出结论
扩大检索范围: 1.使用布尔逻辑检索“或”“OR” 2.使用模糊检索 3.改为上位词 4.减少限制条件 5.使用多个检索数据库
信息检索复习资料
信息检索复习资料1、信息是客观事物经过感知或认识后的再现2、知识是人们通过实践对客观事物及其运动过程和规律的认识3、知识、载体和记录是构成文献的三个基本要素4、信息资源是经过人类筛选、组织、加工,并可以存取和能够满足人类需求的各种媒介信息的集合。
5、连续出版物是一种具有统一名称、固定板式、统一开本、连续编号,汇集多位著者的多篇著述,定期不定期编辑发行的出版物6、学位论文是大学生或研究生为取得学位资格而提交的学术论文7、会议文献主要是指在国内外各类会议上宣读或交流的论文、报告或其他有关资料8、专利文献是实行专制制度的国家和地区以及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。
主要有专利申请、专利说明、专利公报等9、标准文献是为了一定范围内获得最佳秩序,经协商一致制定并由公认机构批准,共同使用和重复使用的一种规范性文件10.信息素质是利用大量的信息工具及主要信息源使问题得到解答的技术和技能:信息能力指人们有效利用技术和信息工具获取信息加工处理信息以及创造和交流新信息的能力信息需求分析和表达能力、信息获取能力、信息分析和处理能力、信息利用能力12、Internet应用:①信息获取:搜索引擎网络新闻②交流沟通:即时通信博客社交网站电子邮件论坛③网络娱乐:网络游戏网络文学网络视频网络音乐④商务交易:网络购物旅游预订网上支付网上炒股13、信息检索的广义含义:是将信息按一定的方式组织和存储起来,并根据信息用户的需要要找出相关的信息过程,全称“信息的存储和检索”14、信息检索过程:①分析检索需求②确定检索标识③选择检索系统和检索工具④实施检索操作⑤索取原始文献15、信息检索按检索对象内容划分:文献检索、数据检索、事实检索、多媒体检索16、手工信息检索直接发明于图书馆的参与咨询和文摘索引工作17、分类语言是一种按学科范畴和体系来划分事物的语言,它是从数字字母符号对类目进行标识的一种语言体系,也称分类法。
信息检索知识点
计算机检索1.信息素养(信息素质、信息能力):作为具有IL(information literacy)能力的人,必须能够充分地认识到何时需要信息,并有能力去有效地发现、检索、评价和利用所需要的信息,从而具有终身学习的能力,总能够为任何任务和决策找到所需信息.2.信息检索广义:指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术.包括存储和检索两个过程.狭义:从信息集合中找出所需信息的过程。
信息查找(Information Search,Information Seeking)2.1信息现状分析1)信息爆炸导致文献量急剧增加,内容相互渗透,语种增多;文献分布异常分散;文献寿命愈来愈段;2)由于条件限制,人们吸收和利用信息的能力并未得到相应的提高.3.检索的作用1)促进智力资源的开发;2)协助管理者做出正确的决策;3)帮助科研人员借鉴前人的研究成果,避免重复劳动;4)信息检索是知识更新的手段.4.数据库类型(1):作为图书馆数字资源的数据库特指为科学、教学、学习所需各种参考资料的集合,以数据库的形式管理和利用。
自建数据库:馆藏目录(OPAC),本校学位论文数据库.商业性数据库:数据库商、出版商和其他机构以商业化方式提供的各种电子资源,图书馆需要支付一定的费用购买数据库的使用权再提供给一定的读者群。
免费数据库:开放获取资源、机构典藏和其他免费的网络资源。
5.数据库类型(2)从收录文献的内容分,有综合性数据库和专业性数据库之分;从收录文献的类型分,有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、标准数据库等;从提供文献的形式分,有全文数据库、文摘数据库、引文数据库;各数据库举例:专业数据库:Petroleum Abstract(PA)、EnCSciFinder Schoiar(CA)综合性数据库:读秀、Scopus、EI、SCI特定文献类型,如图书、期刊、学位论文等:超星、EIsevier ScienceDirect、PQDT全文数据库:CNKI、维普、SPE摘要性数据库:EI、PA引文数据库:Web of Science、CSSCI(中文社会科学引文索引)6.Science Citation Index Expanded(SCI—E)是个什么样的数据库?它是ISI检索平台中Web of Science核心合集中的一个子库它是一个摘要型数据库它是一个引文数据库它是一个期刊数据库它收录的学科范围包括科学、技术的各学科7.查文献应该如何选择数据库?学科专业:有专业型数据库时,首选专业型数据库;数据量:选择数据量大的;文献类型:根据研究的需要。
信息检索复习资料
一、名词解释1.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。
2.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。
3.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
4.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。
5.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词某一部分允许有一定词形变化。
6.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识原始来源和属性的数据库。
7.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。
8.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。
9.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。
10.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。
11.电子报纸—多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。
12.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。
13.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。
信息检索复习资料
A卷一、名词解释:1.信息资源 2.信息检索3.著录法4.关键词标引5.知识发现二、填空1.按组织方式分,信息检索有()、()、超媒体检索。
2.信息检索策略有两种方式即()和()。
3.表示主体的检索词有标题词、()、()关键词。
4.常用的逻辑运算符有:()、OR或+、()。
5.信息检索工具常用的排检方法有字序法、()。
6.中国特有的工具书是()、()。
三、问答1. 信息检索的研究内容有哪些?2. 数据库有哪些类型?3. 搜索引擎的类型有哪些?四、论述1、试例说明传统检索型工具书和参考型工具书的使用。
2、如何利用检索工具查找历史类文献?参考答案:一、名词解释(30%)1.信息资源。
是人类存储在载体(包括大脑)上的已知或未知的可利用的资源。
信息中的载体信息和主题信息资源的最基本的组成部分。
2.信息检索。
是从大量相关信息中利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。
3.著录法。
是对信息与文献的形式特征和内容特征进行分析、选择和记录的方法。
4.关键词标引。
使用非规范化的自然语言——关键词来表达文献或信息资源主题内容的过程。
5.知识发现。
是从数据中发现有用知识的整个过程,使多个步骤相互连接,反复进行人机交互的过程。
二、填空(20%)1.按组织方式分,信息检索有全文检索、超文本检索、超媒体检索。
2.信息检索策略有两种方式即手工检索策略和计算机检索策略。
3.表示主体的检索词有标题词、单元词、叙次、关键词。
4.常用的逻辑运算符有:AND或*, OR或+, NOT或-。
5.信息检索工具常用的排检方法有字序法、类序法。
6.中国特有的工具书是类书,政书。
三、问答(24%)1.信息检索的研究内容有哪些?检索理论研究、检索语言研究、数据库研究、著录法研究、检索系统研究、检索策略研究、检索服务研究。
2.数据库有哪些类型?传统数据库(情报数据库、图形数据库等);专门应用领域的数据库(统计数据库、工程数据库、空间数据库;新一代数据库(分布式数据库、多媒体数据库、面象对象数据库、实时数据库等)。
信息检索-检索基本知识
19.6.22
排列举例:
1. H1、H12、H、H134、H2、H219、H0、 H-44、 H 2-44 2. TP311.1、F0、G624、F2、O-44、I2457 、 TN912、TP319、
F 181、O13-43 、O-62 3. I247.5/J3、 I247.5/G5、F0/L21、FO/L12
1:H、H-44、H0、H1、H12、H134、H2、H 2-44、H219、 2:F0、F 181、F2、G624、I2457 、O-44、O-62、O13-
43、 TN912、TP311.1、 TP319 3:F0/L12、F0/L21、 I247.5/G5、 I247.5/J3
19.6.22
《科图法》
早,只好用倒查法,新兴学科,起始年代不远,可 用顺查法,波浪发展的学科,可选择发展高峰,用 循环法
19.6.22
检索语言
信息检索要克服的三个语言障碍: ★自然语言障碍 ★学科专业语言障碍 ★检索语言障碍
19.6.22
又称文献存储和检索语言,是根据文献信 息存储与检索的需要而创制的一种人工语言, 是汇集、组织、存储、检索文献信息的工具和 手段。
19.6.22
★00 马列、毛泽东思想 ★10 哲学 ★20 社会科学
21 历史、历史学 … 48 艺术 49 无神论、宗教学 ★50 自然科学 51 数学 … 54 化学 65 农业科学 71 技术科学 ★90 综合性图书
以字符构建主题语言:
1.关键词:直接从文献信息的标题、摘要或内 容本身抽取出来的用于揭示信息主题内容的自 由词。
磁盘式
19.6.22
19.6.22
信息检索期末复习资料
信息检索一.名词解释1.索引(P150):索引是将书籍、期刊等文献所刊载的论文题目、作者,以及所讨论的或设计的学科主题、名词术语、所引用的参考文献等,根据一定的需要,经过分析分别摘录出来,注明其所在书刊的页码,按一定的原则和方法排列起来的一种检索工具。
2.回溯检查法:又称追溯法、引文法、引证法,是一种跟踪查找的方式。
即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。
通过回溯法所获得的文献有助于对课题的主题背景和立论依据等内容有更深的理解。
该方法获得文献针对性强、数量较多,在没有检索工具或检索工具不齐备的情况下,利用此法能够获得一些所需要的文献资料。
3.可视化:将数据库中不可见的语义关系以图像的形式可视化显示,并表达用户检索过程。
一个可视化的环境为用户展示更丰富、更直观的信息,一个透明的检索过程使检索更容易、更有效。
它包括检索过程的可视化和检索结果的可视化。
可视化信息检索技术缩短了用户理解信息的时间,提供了感觉和思考之间的有效反馈机制,它代表着信息检索的未来,将会取代以布尔逻辑为基础的、传统的信息检索系统。
4.自动标引:是指直接通过计算机的操作处理,自动实现赋予检索标志的活动。
分为自动主题标引和自动分类标引,即根据计算机内信息(标题、摘要或全文),借助算法自动给出反应主题内容的标引词和自动分配分类号。
5.全文扫描:是以从文本文档中找出与查询表示的字符串完全一致的部分为目的,检索结果返回包含查询字符串的文本及其位置的检索技术。
6.查全率:查全率是指从检索系统检出的与某课题相关的文献信息数量与检索系统中实际与该课题相关的文献信息总量之比。
对于数据库检索系统,查全率为检索出的款目数与数据库中满足用户检索式需求的款目数之比;而对于互联网信息检索系统来说,文献总量是很难计算的,甚至连估算都困难。
在这里人为因素的影响比较大。
相对查全率=(专业人员检出文献的数量数/全部实际检出文献集合并集中文献数量) *100%7.图像信息抽取:是指从数字图像中抽取包括基于文本的特征(说明,注释等关键词)和视觉特征或底层特征(颜色,文理,形状等),作为图像的特征描述,支持信息检索。
信息检索知识点
信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
8.什么是计算机信息检索?所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学信息检索1、信息素养(Information Literacy):是指一个人“能认识到何时需要信息,和有效地搜索、评估和使用所需要的信息的能力。
”2、信息素养的内涵:包括信息意识、信息知识、信息能力、信息伦理。
四者互为基础、相辅相成、相互促进。
3、ACRL标准(USA):①有信息素养的学生有能力决定所需信息的性质和范围;②有信息素养的学生可以有效地获得需要的信息;③有信息素养的学生评估信息和信息的出处,然后把挑选的信息融合到他(她)们的知识库和价值体系中;④不管个人还是作为一个团体的成员,有信息素养的学生能够有效地利用信息来实现特定的目的;⑤有信息素养的学生熟悉许多与信息使用有关的经济、法律和社会问题,并能合理合法地获取信息。
4、全球医学教育最低基本要求(GMER):包括7个宏观的教学结果和能力领域:①职业价值、态度、行为和伦理;②医学科学基础知识;③沟通能力;④临床技能;⑤群体健康和卫生系统;⑥信息管理;⑦批判性思维和研究。
5、信息:是物质的一种方式、形态或运动状态,是事物的一种普遍属性、一般指数据、消息中包含的意义,可以使消息中所描述事件的不定性减少。
分类:自然信息、生物信息、机器信息、社会信息。
6、知识:是人们在认识和改造客观世界的实践中所获得的的认识和经验的总和,是人类通过对信息的感知、获取、选择、处理和加工等一系列思维过程,形成的对客观事物的本质和规律的认识。
分类:知道是什么的知识、知道为什么的知识、知道怎么做的知识、知道是谁的知识。
7、情报:是“为了解决某一个特定问题去搜寻所需要的知识,它事激活了的知识。
”三个基本属性:知识性、传递性、效应性(经智力加工的知识和信息,通过传递后,使问题得到了解决,产生了效用,即为情报的效用性)。
8、文献:是记录有知识的一切载体。
四个基本要素:①文献以知识为内涵;②知识以符号来表现;③符号以一定手段来记录;④以一定的物质载体魏文献的外在表现。
文献根据对知识的加工深度划分:一次文献、二次文献、三次文献、零次文献。
9、信息、知识、情报与文献的相互关系:信息是知识的源泉,知识是系统化的信息,情报是活化的知识和信息,情报应用于时间,解决实践中存在的问题,创再出物质财富或精神财富,产生新的信息,这样就形成了一个无限循环的过程。
10、医学文献发展的特点:①数量庞大、增长速度快;②内容交叉渗透、分散重复;③文种繁多;④更新周期缩短、失效期加快;⑤交流传播及变化速度加快;⑥日益向多元化发展。
11、信息检索:是通过一定的方法和手段,是信息存储和检索这两个过程所采用的特征标识达到一致,一边有效地获取和利用文献信息的过程。
广义的信息检索包括信息的存储和检索两个过程;狭义的信息检索则主要是指信息的检索过程。
12、信息检索主要类型:《中图法》由五大部类、22个大类组成。
(在“R 医药、卫生”这一级类目下又分出17个二级类目)。
13、医学主题词表(MeSH):是美国国立医学图书馆(NLM)由1960年起编制的一部规范化的可扩充的动态性词表。
MeSH表具有以下特点:对医学文献中的自然语言进行规范,使概念和主题词单一对应;保证文献的标引和检索过程在用词上的一致;可以对主题词进行扩检和缩检;具有动态性。
14、主题词:是规范化的、用以描述文献主题(内容特征)的有检索意义的词或词组。
15、入口词:也称款目词,不属于MeSH词表中规范化的主题词,但与主题词有同义关系,准同义关系,祖代关系,等同关系。
16、副主题词:无独立检索意义,但与主题词组配使用,目的在于提高对文献主题标引及检索的专指度。
17、树状结构表的作用:①可帮助从科学体系中选择主题词;②可帮助进行扩检和缩检;③可帮助确定词的专业范围。
18、MeSH参照系统:目前有四种参照:Entry Term(入口词)、See Also(主题词:指引主题概念相关的其他主题词)、Consider Also(指引同义不同源的词)、Entry Combination(主题词:指引主题概念相关的其他组合形式的其他主题词)。
19、数据库的结构:①文档:顺排文档、倒排文档;②记录(数据库的记录越多,数据库的容量就越大);③字段(字段的数量越多,说明记录包含的信息就越多,该数据库就越加完备)。
文档、记录、字段的关系可描述为:文档是一个表,表中的每一行就是一个记录,行数就代表了记录的数量,而表中的每一列就是一个字段,每一个字段就是一个文献的特征标识,指向文献特征所在位置。
20、数据库类型:文献型、事实型、数据型、多媒体型。
21、检索提问表达式=检索词+运算符22、布尔逻辑检索:①逻辑乘:运算符为“AND”或“*”,是表达概念交叉关系和限定关系的一种组配。
AND两侧的检索词必须同时出现在同一条记录中,该记录才会命中,常用于缩小检索范围;②逻辑加:运算符为“OR”或“+”,是表达并列关系的一种组配。
OR 两侧的检索词只要有一个出现在同一条记录中,该记录命中。
常用于扩大检索范围,提高查全率;③逻辑非:运算符为“NOT”、“AND NOT”或“-”,是表达排斥关系的一种组配,即从检索结果中剔除不需要的概念。
一般用于缩小检索范围,增强专指性。
23、字段限定检索:①精确限制符“=”;②模糊限制符“in”、“[]”、“/”。
24、加权检索:是一种定量检索技术,其实质是判定检索词对文献是否命中的影响程度。
25、短语检索符:用于检索圈定短语或专有名词,常用“”。
26、调整检索策略:(1)认真检查所确定的检索方法、检索系统、检索途径是否对口,是否符合课题的要求;(2)修改检索提问式:当检出文献量小于期望时,试用一下方法来扩大检索范围:①删除某些用AND链接的不重要检索词;②增加用OR连接的检索词;③位置运算符放款;④检索词后用截词符;⑤多用几个副主题词,甚至选用所有副主题词;⑥选用上位主题词扩检,或选用扩展全部检索;⑦同时用主题词自由词检索,用OR链接;⑧从在某个学科范围中输词检索改为在所有学科中输词检索;⑨多拥挤中检索系统进行检索。
当检出文献量过多,其中一部分文献并非真正需要时,试用一下方式进行检索:①增加用AND链接的检索词,或用“二次检索”;②用特定的副主题词进行限定;③用字段限定检索;④使用主要主题词进行加权检索、下位主题词检索或不扩展检索;⑤进行文献类型、语种、重要核心期刊、年份等限定检索;⑥用逻辑非NOT来排除无关检索词。
27、检索效果评价:查全率:是指系统在进行检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索了出来。
查准率:是指在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库实际检出的全部文献中有多少是相关的。
28、Sino Med检索新功能:①智能检索;②限定检索;③链接检索;④结果分析;⑤我的空间;⑥原文获取。
29、Sino Med数据库的检索方法:(1)基本检索:①默认字段检索(“缺省”状态检索是同时在中文标题、摘要、作者、关键词、主题词和刊名字段中进行检索);②全部字段检索;③指定字段检索;④二次检索;⑤通配符建多次可使用单子通配符“?”和任意通配符“%”。
(2)主题词检索;(3)分类检索;(4)期刊检索;(5)作者检索;(6)限定检索:可以在检索前限定(“先限定”),或者对已有检索式做限定(“后限定”)。
取消限定检索前,限定设置始终有效;(7)检索历史。
30、中国国家知识基础设施工程(CNKI)与维普、万方、Google学术均可查被引次数。
中国生物医学文献数据库(CBM)是我国最早的生物医学文献数据库之一,为二次文献数据库;CNKI为综合性数据库;维普期刊资源整合服务平台(VIP)只收录期刊;万方数据知识服务平台(W ANFANG DA TA)资源类型主要包括:期刊论文、学位论文、会议论文、科技成果、报告、标准、专利等,与CNKI不同的是,对所有医学主题词进行PubMed标准。
31、PubMed收录了来自以下四个数据库的数据:MEDLINE:是世界公认的最重要、最具权威性、使用频率最高的生物医学文献数据库;PreMEDLINE;Publisher Supplied Citation;PubMed-OLDMEDLINE。
32、在PubMed主页的检索提问框中键入检索词,系统将按顺序使用如下4种表或索引,对检索词进行转换后再检索:①MsSH转换表;②刊名转换表;③短语表;④著者索引:姓(全称)在前,名(首字母缩写)在后。
33、临床咨询是专为临床医生设置的循证医学证据检索界面。
34、搜索引擎使用高级检索的限定:①语种限定;②位置限定;③网站或域名限定;④类型限定。
Google学术搜索结果提供:标题、作者、简介及被引用次数、相关文献、版本信息、引用链接。
35、HONselect:是一个针对医药卫生领域的不同种类的网络信息资源的多语种搜索引擎,功能很强大。
浏览主题词表(Explore the 33000 separate MeSH terms):单击链接,可检索33000个医学主题词的完整的树状结构表。
36、开放存取(OA):发端于20世纪90年代,是全球科技界、学术界、出版界、信息传播界为推动科研成果的自由传播和利用而发起的运动。
开放存取(OA)期刊:即可以通过网络免费阅读和下载的期刊。
37、医学图像资源:①通过综合性的图片搜索引擎获得:Baidu图片、雅虎图片搜索、有道图片搜索;②通过专业搜索引擎获取:HONmedia;③通过专业图库获取:Nucleus。
38、循证医学(EBM):慎重、准确和明智地应用当前所有能获得的最好的研究证据,同时结合临床医生的个人专业技术和多年临床经验,考虑病人价值和愿望,将三者完美结合制定出最佳的诊疗措施。
39、循证医学基本步骤:①提出问题;②查找证据;③评价证据;④应用证据;⑤总结提高。
40、实践循证医学医学对临床医生的要求:①熟悉循证医学实践的每一个过程要求;②掌握计算机检索之时和技术,能从数据库和网上获得相关证据;③了解临床流行病学知识,特别是对病因、危险因素、诊断、治疗和预后文献的评价标准和方法,会对已获得证据进行严格评价,考察其真实性、有效性和可靠性;④了解医学统计学、医学伦理学知识,充分考虑病人的价值,从病人实际出发,全心全意为病人服务。
41、证据的分类:①系统评价;②随机对照试验;③临床实践指南;④卫生技术评估。
证据的分级:分为8级,质量依次降低。
42、著名的循证医学数据库(二次研究证据库):Cochrane Libuary:①Cochrane系统评价全文库;②Cochrane疗效评价文摘库;③Cochrane临床试验中心注册库;④Cochrane评价方法数据库。