第一章 信息存储与检索
信息检索
![信息检索](https://img.taocdn.com/s3/m/4dddc0d626fff705cd170a03.png)
2、 报刊 报刊是一种以印刷形式或其它形式逐次刊行的,通常 有数字或年月日顺序编号的,并打算无限期地连续出 版下去的出版物。 报刊特点:数量大、品种多、内容丰富多样;出版周 期短,报道速度较快;发行、流通广泛、连续性强, 伴随着相应的学科领域发展而发展。 在检索工具的文摘中,往往有卷、期、页的标志(如 Vol. 10, No. 2, 201-209 )
信息检索(Information Retrieval):是指将信息按一 定的方式组织、存储起来,并根据用户的需要找出有 关信息的过程。它的全称又叫做“信息存储与检索” (Information Storage and Retrieval),这是广义的 信息检索。狭义的信息检索仅指该过程的后半部分, 从信息集合中找出所需信息的过程。
4、一、二、三次文献之间的关系 一次文献带有创造性;二次文献是在一次文献基础上 形成的,具有选择性、浓缩性;三次文献是在一、二 次文献基础上经过分析、提炼、总结形成的,具有概 括性。从一次文献到三次文献,是一个由分散到集中、 由无序到有序的过程。
三、按信息的表现形式划分
1、 文献型信息源 存储语言文字形式信息的各种载体的集合。 2、 非文献型信息源 数值型信息源、 声像型信息源、 多媒体信息源、 实物及口头信息源。
三、文献
1.文献的含义 在《文献情报术语国际标准(草案)》 (ISO/DIS5127)中对文献是这样定义的,即“为 了把人类知识传播开来和继承下去,人们用文字、 图形、符号、声频、视频等手段将其记录下来,或 写在纸上,或晒在蓝图上,或摄制在感光片上,或 录到唱片上,或存储在磁盘上。这种附着在各种载 体上的记录统称为文献”。 在《信息与文献术语》(GB/T4894— 2009)中对文献是这样定义的,即“文献,在 文献工作过程中作为一个单位的记录信息或实物对 象”。这里文献工作指的是为了存储、分类检索、 利用或传递而对记录信息所进行的连续和系统的汇 编和处理。
信息检索技术
![信息检索技术](https://img.taocdn.com/s3/m/b37782eec5da50e2534d7f17.png)
第一章信息检索概述1,什么是信息检索?它有哪些主要类型?信息检索指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。
有目的和组织化的信息存取活动,其中包括“存”和“取”两活动。
旧分类方法:文献检索、事实检索、数据检索新分类方法:文本检索、数值检索、音/视频检索2,试分析阐述信息检索的基本原理,信息集合、需求集合、匹配与选择,信息检索三阶段及期特点?答:即信息集合与需求集合的匹配与选择。
(1)信息集合是指有关某一领域的,经采集、加工的信息的集合。
形成可供用户访问与检索的对象,在某种意义上说,它是以一种公共知识结构,它有可能弥补某个特定用户的知识结构缺陷,即可以向用户提供所需要的知识或信息,或是获取知识的线索,或者提供某种信息区激活人脑中存储的知识。
(2)需求集合:用户的信息需求是在社会实践活动中产生的。
众多用户不同形态的信息需求的汇集,就形成了需求集合的存在。
信息需求的产生与满足,是实施信息检索行为的前提与基础,也是实施信息检索行为的目的所在。
(3)选择与匹配:面对信息集合与需求集合,如何在两者之间建立起了解与沟通的桥梁,以便能够从信息集合中快速获取用户所需要或所缺少的信息与知识呢?这就需要信息检索提供一种“匹配”机制。
它的主要功能在于:能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。
这里,我们要求匹配机制至少包括两个要素:一是匹配标准,即相似性标准;二是执行匹配的动因。
3,信息检索主要经历了哪些不同的发展阶段?各阶段有何特点?(1)手工检索阶段,主要特点可以概括为印刷文献(图书、期刊、会议、专利、学位论文)为主要检索对象;以各类文摘、题录、和目录性工具书为可利用的主要检索工具;以图书馆的参考咨询部门为开展信息检索服务的中心机构。
(2)计算机化检索阶段(脱机批处理检索时期、联机实时检索时期、联机网络化与多元化检索时间),主要特点:以各类机读数据库为检索对象;各类信息中心,联机服务中心作为新兴的信息服务部门而存在;信息检索用户逐渐由专业检索人员(检索中介)向个人终端用户转移和扩散。
信息存储与检索(第1章)
![信息存储与检索(第1章)](https://img.taocdn.com/s3/m/f97c04035f0e7cd184253684.png)
《信息存储与检索》
1.1.2 信息检索的原理 从由此可见,信息存储和信息检索的直接交汇处 是至关重要的,由此形成了信息检索的一致性匹配 作用机理,如图1-2所示。 信息检索的一致 性匹配作用机理 包括5个机理: (1)提取机理 (2)表示机理 (3)比较机理 (4)判断机理 (5)选择机理
符号化表示 比较 符号化表示 判断 现 实 的 信 息 信息特征提取 选择 需求特征提取 现 实 的 需 求 输出检索结果 图1-2 信息检索的一致性匹配作用机理
《信息存储与检索》
1.1.3 信息检索的类型 (一)按照信息检索的对象性质划分 (2)数值检索 (3)事实检索 (二)按照计算机检索技术划分 (1)脱机检索(Off-line Retrieval) (2)联机检索(On-line Retrieval) (3)光盘检索(CD-ROM Retrieval) (4)网络检索(Internet Retrieval)
《信息存储与检索》
1.1.1 信息检索的概念
第二类是狭义的。对于普通用户来说,在大多数情况下, “信息检索”可以用英文Information Searching来表达, 其准确的含义是“信息查询”或“信息搜索”。也就是说, 所谓信息检索,是指按照一定的方式从现有的信息集合或数 据库中,找出并提取所需要的信息。可见,狭义的信息检索 仅指检索这一个过程,而不关心信息是如何存储的。
《信息存储与检索》
1.1.2 信息检索的原理
(3)比较机理。在检索项类型(如提名、作者、分类、关键 词)相同的情况下,对代表特定信息的特征符号与代表特定 需求符号进行对比。比较的实质是相似性比较或一致性比较, 即包括完全一致、部分一致和不一致,也包括等于、不等于、 大于、小于。比如,对于两个词或词组来说,它们可以是完 全一致、前方一致、后方一致、中间一致;对于两个编号来 说,它们可以是相等、大于、小于。 (4)判断机理。在比较的基础上,对信息是否符合需求以及 符合的程度加以判断。两者相符合的信息被检索出来(命 中),不相符合的信息被拒绝(不命中)。从符合程度来看, 可以是完全符合,也可以是部分符合。在部分符合中,还可 以进一步细化。原则上,凡是符合需求的,尽管它们符合的 程度有所不同。
文献检索复习资料
![文献检索复习资料](https://img.taocdn.com/s3/m/308eacc0a1c7aa00b42acb04.png)
第一章网络信息概述一. 基本概念1信息狭义:信号和消息广义:是物质的存在方式和运动方式的体现,是物质的一种客观存在,它反映了物质客体及其相互作用、相互联系过程中表现出来的种种状态与特征。
2 知识按照表述方法可以分为两类:显性知识和隐性知识显性知识,又称可编码的知识,是记录于一定物质载体上的知识,可以看得见,摸得着的,可以通过正常的语言方式传播的知识。
以文字、语言、图像的形式保存下来,如专利、商标、计划、软件设计报告等等。
显性知识是可以编码和表述的,有载体的。
隐性知识又可称为不可编码的知识,是存储在人们大脑里的经历、经验、技巧、体会、感悟、智能等尚未公开的秘密知识,就是你看不见、摸不着,只可意会不可言传,难以直接交流和表达出来的知识。
隐性知识的特点是不易被认识到、不易衡量其价值、不易被其他人所理解和掌握3文献是记录有知识的一切载体。
精确描述:凡是用文字、图形、代码、符号、音频、视频等方式记载在一定载体上的每一件记录,均称为“文献”。
构成文献要素有三,知识、记录与载体方式。
4情报是人们在一定时间内为一定目的而传递的有使用价值的知识或信息。
钱学森:“情报是激活了的知识”情报是对特定的人而言的,对需要它的人而言是情报,对不需要的人而言它只是信息与知识。
知识与信息转化为情报必须经过传递、只有将特定的知识与信息传递到特定需要的人那里,它们才能成为情报。
传递是情报的一个基本特征。
二. 网络信息的特性1 性质客观性寄附性传递性共享性衍生性时效性2 特点数量大来源广语种多多媒体传播快跨国界内容杂更新快三. 网络信息的资源1 知识信息网站教育和科技部门网站,如:学校、科研单位、学术团体、政府部门等。
2 文献信息网站出版和收藏文献网站。
有数字图书馆,如:超星、书生之家等;数字平台,如:中国知网、万方、维普等。
四. 网络信息的检索主要信息网站种类:政府网站(.gov)免费教育机构(.edu)科研部门(.ac)商业网站(.com)收费社会组织(.org)互联网络(.net)五.图书馆印刷型文献:图书、期刊、工具书、报纸电子型文献:随书光盘、电子期刊数据库、电子图书及其他数据库1. 按文献内容性质划分(不同加工深度)零次文献(Zeroth Litterature) 是指非正式出版或非正式渠道交流的文献,未公开于社会,只为个人或某一团体所用。
信息检索基础知识
![信息检索基础知识](https://img.taocdn.com/s3/m/de4b0d26af45b307e871972e.png)
第一章信息检索基础知识一.概述1.信息与文献信息知识的分类:已掌握的知识和需查询的知识。
信息的定义:信息是事物运动的状态与方式,是物质的一种属性,并且借助于一定的物质载体传输和储存。
这里有几个词组需说明:事物:泛指一切可能研究的对象(包括物质的和精神的)。
运动:泛指一切意义上的变化(机械运动、化学运动、思维运动和社会运动)运动方式:在时间上所呈现的过程和规律:运动状态:在空间上所展示的形状和态势。
信息已成为与物质、能量同样重要的三大资源之一。
信息是一种原料,人类接受外界大量信息后,经过实践活动和大脑的思维机制加工提炼后变成有用的知识(知识的认识程度)。
文献:将知识记录并保持在一定的载体上,就形成了文献。
文献信息是文献所表达的内载信息,以文字、符号、声像信息为编码的人类精神信息,也是经过人们筛选、归纳和整理后记录下来的信息。
科技文献是科学技术研究成果的记录,积累了许多有用的事实、数据、理论、方法和科学假设,反映了科学技术研究的进展和水平,是科学信息的主要来源。
2.信息的特点(1)普遍性;信息是无处不在,无时不在的,c从宏观的宇宙天体到微观粒子,从自然界到人类社会,万事万物都是信息的母体;(2)时效性:信息的获得和传送需要时间,信息反映的总是特定时刻事物的运动状态和方式,当人们获得信息后,它反映的是某段时间的事物,是一种历史纪录,如果传递很慢,信息就会失去应有的价值;(3)传递性:指信息的空间和时间效应,信息可以从一个地方传到另一个地方,从一个时期传到另一个时期;信息的传递决定了信息的可扩散性,信息是通过各种渠道、媒介传播和扩散;(4)共享性:信息在传播和使用的过程中,载体本身的信息并不因此而减少,信息资源的共享将极大地推进人类文明的发展;(5)可转换性:信息的物质载体形态是可以相互转移变换的;信息在一定条件下可以转化为物质、能量、时间、金钱、效益、质量等;(6)可伪性:在人们得到信息后,必须进行分析判断和筛选,以便正确享用信息。
信息存储与检索
![信息存储与检索](https://img.taocdn.com/s3/m/883d07f17c1cfad6195fa7d8.png)
课件第一章1 纸质文献资源的存储与组织的4个基本要素:信息内容、载体材料、记录符号和记录方式2 零次文献、一次文献、二次文献、三次文献的区分(课本P23)零次文献:尚未经过系统整理形成正式文献的零散资料,包括草稿、记录和谈话等。
它与一次文献的重大区别在于前者没有形成正式文献,没有正式发表。
一次文献:作者最初发表的原始文献。
主要类型有期刊论文、专利文献、科技报告、会议录、学位论文等等,这些文献具有创新性、实用性和学术性等明显特征,是科技查新工作中进行文献对比分析的主要依据。
二次文献:对一次文献进行加工整理后的产物,用做文献检索工具。
它是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储文学类型,如书目、索引、文摘等都是二次文献。
三次文献:在运用一次文献成果并借助二次文献检索的基础上,用科学的研究方法,对一次文献进行综合分析、比较研究,从而揭示某种规律性认识的文献类型。
如综述、述评、百科全书等。
从零次文献、一次文献、二次文献到三次文献,是一个由分散到集中,由无序到有序,由博而精的对知识信息进行不同层次的加工过程。
它们所含信息的质和量是不同的,对于改善人们的知识结构所起到的作用也不同。
零次和一次文献是最基本的信息源,是文献信息检索和利用的主要对象;二次文献是一次文献的集中提炼和有序化,它是文献信息检索的工具;三次文献是把分散的零次文献、一次文献、二次文献,按照专题或知识的门类进行综合分析加工而成的成果,是高度浓缩的文献信息,它既是文献信息检索和利用的对象,又可作为检索文献信息的工具。
3 (课件第二章)信息存储与检索定义信息存储与检索是信息检索的全称形式或广义的信息检索,又称为信息存取,它既包括采用多种形式记录信息、排序信息的信息存储过程,也包括通过一定的设备、采用一定的手段与技巧从信息系统中快速、准确地搜寻所需信息的方法与活动。
广义的信息检索包括信息的存储和检索两个过程。
信息存储与检索(第1章)
![信息存储与检索(第1章)](https://img.taocdn.com/s3/m/ee0bf6b0c9d376eeaeaad1f34693daef5ef713da.png)
互联网的普及推动了搜索引擎的快速发展,信息检索进入全新时代。
大数据与人工智能驱动的信息存储与检索
利用大数据分析和人工智能技术,实现更高效、智能的信息检索。
02
CATALOGUE
信息存储技术
直接附加存储
定义
直接附加存储(DAS)是 一种将存储设备通过电缆 直接连接到服务器的方法 。
优点
简单易用,检索速度快,适用于大量数据的快速筛选。
缺点
关键词匹配可能存在误匹配,无法理解语义,无法处理同义词和歧义 词。
语义检索
原理
语义检索基于自然语言处理和人 工智能技术,通过理解用户输入 的语义,自动识别用户意图,并 从存储的信息中提取出相关内容 。
优点
能够理解用户意图,减少误匹配 ,提高检索准确率。
缺点
技术难度较大,需要大量的训练 数据和模型优化。
图像检索
原理
图像检索通过提取图像中的特征信息,将用户输入的图像与数据 库中的图像进行相似度匹配,从而找到相似的图像。
优点
能够快速找到相似的图像,适用于图片搜索和版权保护等领域。
缺点
对于复杂的图像和动态场景,特征提取难度较大,需要更高级的技 术支持。
边缘计算
在物联网设备端进行数据处理和分析,减轻中心服务器的负担。
信息共享
实现物联网设备之间的信息共享和交流,促进设备间的协同工作。
THANKS
感谢观看
访问控制
实施严格的访问控制策略,对不同用户设定不同的权限级别,防止 未经授权的访问。
隐私保护
采用匿名化、去标识化等技术手段,保护用户隐私信息不被泄露。
大数据处理与分析
数据清洗
对数据进行预处理,去除无效、错误或不完 整的数据。
信息存储与检索 - 第一章信息存储与检索的基本概念
![信息存储与检索 - 第一章信息存储与检索的基本概念](https://img.taocdn.com/s3/m/d24707c3482fb4daa58d4bf8.png)
同一关系 从属关系 交叉关系
第三节 信息的揭示与组织
一、检索语言及其作用 二、信息的揭示与组织的方法
一、检索语言及其作用
1、检索语言的概念
检索语言是应文献信息的加工、存储和检索的共同需要而 编制的专门语言,是表达一系列概括文献信息内容和检索课题 内容的概念及其相互关系的一种概念标识系统。简言之,检索 语言是用来描述信息源特征和进行检索的人工语言,可分为规 范化语言(例如,用词表来规范)和非规范化语言(自然语言) 两类。
例:学科体系分类
根据科学学科之间的逻辑归属关系,采用层次型或树杈型结构,列 举人类所有的知识类别,并对每一知识分别标以相对固定的类码, 从而形成类表。
学科体系分类分类表通常指一种从总到分、从一般到具体、层层划 分、逐级展开并具有某种符号代码体系的知识体系表。
学科体系分类是以数字、字母或字母与数字结合作为基本字符,采 用字符直接连接并以圆点(或其它符号)作为分隔符的书写法, 以基本类目作为基本词汇,以类目的从属关系来表达复杂概念。
ISO 9000-2-97.IDT 质量管理,质量保证,质量 QUALITY ASSURANCEQUALITY MANAGEMENTQUALITY 中国 98249276
20191209
20191110
20191110
学位论文著录
论文题目:
自控式同步电机机端电压位置监测器数字控制
刘波
授予学位:
硕士
的叙词具有概念性、描述性、组配性,还具有语义的关联性、动态性、 直观性。
主题法的优点
1)直接、直观。直接利用反映主题内容的词进行检索; 例:轴承 可直接用其检索 如果用分类语言,则应考虑“轴承”属于“机械”大类下的“机械
零件”小类,再下属的“旋转机械零件”小小类 2)准确、灵活。是建立在文字基础上的,不像分类号是个代码;最新的
信息存储与检索复习资料PPT课件
![信息存储与检索复习资料PPT课件](https://img.taocdn.com/s3/m/5dedd25bccbff121dd3683cf.png)
❖ 人工采选:信息资源的采集和录入均由人工完成。
❖ 人机结合采选:人机合理分工——大量的采集任务可以通 过计算机的扫描、复制、链接、合并、格式转换等处理来完 成
❖ 自动采选:即在无人工干预的情况下由计算机自动完成。
22
可编辑
1.2.4 信息检索系统的逻辑结构
2.词语子系统 功能:对采用规范化词语的系统在标引和查询时所使
(1)目标 (2)功能 (3)资源 (4)设备 (5)方法 (6)人员 概括地说,信息检索系统就是专门进行信息的收集、处理、存
储、检索并满足用户信息需求的系统。
16
可编辑
1.2.2 信息检索系统的类型
见P9 (1)书本式检索系统。 (2)卡片式检索系统。 (3)机械式检索系统。 (4)缩微式检索系统。 (5)计算机检索系统。 (6)网络检索系统。
9
可编辑
1.1.2 信息检索的原理
5、课程内容安排 第一章 信息检索概述(教材第一章) 第二章 信息检索模型(教材第二章) 第三章 文本信息处理技术(涉及到本教材第三章) 第四章 文本信息存储技术(涉及到本教材第三章) 第五章 文本信息检索技术(涉及到本教材第三章) 第六章 Web信息存储与检索(教材第五章)
❖ 搜索器(Spider或Robot); ❖ 索引器(Indexer); ❖ 检索器(Searcher)。
从检索效率上讲,联机检索与光盘检索的检索效率比较高,与网络检 索(搜索引擎检索相比),它们的检索指令完备、检索功能强大、支持 多种检索技术,提供跨库检索手段,查全率和查准率都比较高。但搜索 引擎胜在用户界面友好、使用方便简单。
23
可编辑
1.2.4 信息检索系统的逻辑结构
3、信息标引子系统 功能:按照一定的词表,对信息赋予标引词,以表征信息的特征,形成信
信息存储与检索PPT课件
![信息存储与检索PPT课件](https://img.taocdn.com/s3/m/41953d63284ac850ac024211.png)
4
科技信息是科学技术的直观体现,它 反映了科学研究和生产技术领域的成 果、经验、动态、政策、规划等。
包括科学信息和技术信息两部分。
5
科学信息:一般是指自然科学方面的信 息,与基础理论研究关系密切。
技术信息:主要指应用技术方面的信息, 与生产部门关系密切。
信息存储与检索
课时分配
共32课时 理论课:26课时 实践课:6课时
2
第一章 概 论
信息检索是一门古老的技术,它伴随 科技工作的进行而产生;
不论过去还是将来,都是工程技术人 员及科技工作者所必需具备的基本技 能之一。
3
第一节 科技信息的特点
国外一些专家、学者关于科技信息的论 述的三种观点:
6
科技信息包括的主要内容:
(1)科技成果,即已经完成的科学技术研究成果。 (2)科技工作和科研管理的经验教训。 (3)科技动态,包括科技进展情况、预测性论断、
科技成果推广情况、科技合作情况等。 (4)科技政策、科技规划与计划。
7
科技信息发展态势显示出如下特点:
1. 文献数量巨大
科技知识数量的翻番周期对照表
50 40 30 20 10
0 19世纪
20世纪50-60 年代
20世纪90年代
科技 知识 数量 翻番 周期
8
2. 涉及面广,文献分布分散 3. 更新速度加快,文献寿命缩短 4. 对经济、社会的影响日益显著
9
第二节 信息检索的作用和意义
信息检索(Information Retrieval):将信息按 一定的方式组织和存储起来,并根据信息用户的 需要找出有关的信息的过程和技术。
信息存储技术与信息检索方法
![信息存储技术与信息检索方法](https://img.taocdn.com/s3/m/6aab2796a48da0116c175f0e7cd184254b351b81.png)
信息检索方法广泛应用于图书馆、档案馆、博物馆、新闻媒体、电子商务、社交网络等领域,为用户提供快速、 准确的信息获取服务。
信息检索方法挑战与趋势
挑战
随着互联网信息的爆炸式增长,信息过 载、信息质量参差不齐等问题给信息检 索带来巨大挑战。同时,用户需求的多 样性和个性化也对信息检索提出了更高 的要求。
目录标签
为每个目录添加简短的描述性标签,以便用户快 速了解目录的主题和内容。
目录导航
提供目录导航功能,帮助用户在目录结构中定位 和浏览。
全文检索方法
全文索引
对文档集中的所有文档进行全文 索引,以便快速定位包含用户查 询关键词的文档词进行高亮显示,以便用户快 速浏览和定位关键信息。
信息存储技术与信息检索方法
目 录
• 信息存储技术概述 • 传统信息存储技术 • 现代信息存储技术 • 信息检索方法概述 • 传统信息检索方法 • 现代信息检索方法 • 信息存储技术与信息检索方法融合应用
01 信息存储技术概述
信息存储技术定义与发展
定义
信息存储技术是指将数字、文字、图像、声音等多媒体信息以数字化的形式存 储在计算机硬件设备上,并通过相应的软件进行管理、访问和共享的技术。
02 传统信息存储技术
磁带存储技术
01
02
03
磁带存储原理
利用磁带的磁性材料来记 录数据,通过磁带机读写 数据。
磁带类型
包括数据流磁带、备份磁 带、归档磁带等。
磁带存储优缺点
优点是存储容量大、成本 低、可长期保存;缺点是 读写速度慢、易损坏、管 理复杂。
光盘存储技术
光盘存储原理
01
利用光盘表面的光敏材料来记录数据,通过光盘驱动器读写数
第一章 文献信息检索基础知识
![第一章 文献信息检索基础知识](https://img.taocdn.com/s3/m/ad90e431dd36a32d7375813a.png)
2. 微缩型
定义:以感光材料为载体,利用光学技术以缩微照相为记录手段,
如缩微胶卷、缩微胶片等。
优点:存贮密度大、体积小,便于保存和远距离传递; 缺点:不能直接阅读,必须借助缩微阅读机才能阅读。
著者
书名
代码
出版地
出版社
出版时间
Horst, R., Pardalos, P. M. 1994, Handbook of global optimization, Kluwer, Dordrecht.
10
(三)文献类型--按文献出版划分:
国际标准书号(International standard book number, ISBN) P7
ultrasound and pulsed-vacuum treatments on the dehydration kinetics, distribution and status of water in osmotically dehydrated strawberry: a combined NMR and DSC study[J],Food and Bioprocess Technology ,2014, 7(10): 2782-2792.
1.图书(Book)
定义:指对某一领域的知识进行系统阐述或对已有研究成果、技术
、经验等进行归纳、概括的出版物。包括专著、汇编、丛书等。
特点:图书的内容比较系统、全面,论点成熟、可靠,但传统印刷 业图书的出版周期较长,传递信息速度慢,电子图书的出版发行可
第一章-文献信息检索概论
![第一章-文献信息检索概论](https://img.taocdn.com/s3/m/c2ebc407360cba1aa911da68.png)
• 特点:具有新颖性、创造性(是人类创造 性劳动成果)和先进性(内容上是新成果, 新发明);
• 缺点:数量大,分布散,难以查找。
• 二次文献: 报道和查找一次文献的检索工 具书、书刊。
• 它是按照一定的目的对一定范围或学科领 域的一次文献进行鉴别、筛选、分析、归 纳、加工整理重组,使之有序化后出版的 文献。如各种索引、题录、文摘。形式上 有卡定义为文献是记录有知识的一切载体。
• 文献的基本构成要素
第一,知识内容 第二,记录载体 第三,记录符号 第四,记录手段
• 随着生产力的发展,存贮和表达人们思想的物质 载体不同了,从金石、竹简、羊皮、丝帛、纸张 发展到用感光介质和磁性介质。从非人工材质的 泥版、岩石、石板、兽骨、木板、竹片、 兽皮、 树叶、桦树皮等到各种人工材质,如无机材质 (陶、砖瓦、瓷,玻璃等)、金属材质(青铜、 铁、铝、金银等)、高分子材质(帛、纸、胶片、 醋酸纤维等)、复合材质(磁带、光盘等)。纸 质文献已经多得不便于快速传输信息、高效查阅 和高密度存贮了,于是其他介质的文献应运而生, 这些文献主要包括:纸质文献具有价格低廉、质 地柔软、易于书写、携带和收藏等其它一些载体 所无法比拟的性能而成为文献家族的主干。
• 特点:汇集性、工具性、系统性
• 三次文献:根据二次文献提供的线索,选 用大量一次文献,根据一定的需要和目的 进行筛选、分析、综合和浓缩而再出版的 文献。
• 如词典、手册、指南、年鉴、百科全书、 大全、综述、工具书目录、书目之书目、 专题述评、进展报告等。
• 特点:综合性、 价值性、 针对性
/
• 序号途径:
• 许多文献除普通的外表特征外,还具有序 号特征,如,专利文献有专利号、标准文 献有标准号、馆藏文献有索书号。序号索 引一般按照文献序号的大小顺序排列。
信息检索学习笔记
![信息检索学习笔记](https://img.taocdn.com/s3/m/e0d1ce2bcc17552707220859.png)
信息检索第一章信息检索的基础理论第一节基础概念一、信息概述(一)信息的定义:信息指的是事物的存在方式和运动状态,是对客观世界中各种事物变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。
世界三大基本要素:信息物质能量(二)信息的特征1.客观性①信息来源于物质,又不是物质本身;它从物质的运动中产生出来,又可以脱离物质相对独立地存在。
②信息业来源于精神世界,但又不限于精神的领域。
③信息是具体的,并且可以被人所感知、提取、识别,可以传递、存储、变换、显示、检索和利用。
2.普遍性3.可存储性4.可传递性5.扩散性6.共享性7.时效性(三)信息的功能1.经济功能①运用信息可以使非资源转化为资源创造财富。
②使用信息取代劳动力、资金、材料等资源创造财富,实现经济效益倍增。
③直接让信息作为商品在市场流通中创造财富。
④通过信息进行科学决策,减少失误,创造财富。
2.管理与协调功能5M资源:人、财、物、设备、管理办法信息的管理与协调功能在组织活动中的作用:①传递整个组织的运行目的,有效管理5M资源。
②调节和控制物质流和能源流的数量、方向和速度。
③传递外界对系统的作用,保持组织的内部环境稳定。
3.选择和决策功能4.研究与开发功能二、知识1.知识的概念:知识是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映,是人类对自然界、人类社会以及思维方式与运动规律的认识。
2.知识的类型①显性知识和隐性知识。
②实体知识和过程知识。
③核心知识和非核心知识。
三、情报1.情报的概念:情报是具有特定传递对象的特定知识货有价值的信息。
2.情报的特征①动态性②按特定的方式传递③为特定目的服务的④常常有一定的时效性和机密性3.情报的类型零次情报:私人笔记、手稿、设计草图、会议记录、口头言论等。
一次情报:调查报告、研究报告、科学论文、专利说明书、会议文献、专著等。
二次情报:书目、索引、文摘等三次情报:综述、专题评论、年度总结、研究进展报告、数据手册、专业年鉴等。
信息检索第一章
![信息检索第一章](https://img.taocdn.com/s3/m/1ad7514abe1e650e52ea99da.png)
会议文献的特征:(a)一般带有会议特征的词,如 Conference(会议)、Congress(大会、集会);(b)有主 办会议的机构特征,如Society(团体)、Association (协 会);(c)有会议文献类型的特征,如会前出版的Paper (论文),会后出版的Proceedings(会议录)等等。根据 这些特征,可以判定上述文献来源于会议文献。 • 如: Range-free localization using dynamic hop size computation in wireless sensor networks Tay, Jeffrey H.S. (Department of Computer Science, National University of Singapore); Chandrasekhar, Vijay R.; Seah, Winston K.G. Source: 2006 IEEE International Conference on Industrial Informatics, INDIN'06, 2006 IEEE International Conference on Industrial Informatics, INDIN'06, 2007, p 126-131
二、信息检索的作用
• 1.有利于减少课题的重复研究、提高科 研成功率 • 2.有助于节约时间、提高科研效率 • 3. 是科学决策的必要前提。 • 4.有利于培养复合性、开拓性人才
• • • •
1. 科研中--为科研开路 2 .生产中--新产品开发的向导 3 . 技术贸易中--引进技术的参谋 4 .针对大学生,还要学会利用文献跟踪学 术动态、寻找科研课题、撰写毕业论文、 科技论文,申请专利。
文 献 检 索(课程)
![文 献 检 索(课程)](https://img.taocdn.com/s3/m/ef186fd184254b35eefd3413.png)
• 科技报告 科学研究和开发调查工作成果的记录 或正式报告,也称技术报告、研究报告。 内容新颖、详细、专业性强、出版及时、 传递信息快,发行范围控制严格,保密 性强、不易获取原文 。美国政府四大报 告。
• 政府出版物 政府部门及其所属机构发布的行政政 策性文件和科技文件等,是了解国家科 技政策、经济发展政策、社会发展动态 的重要信息源。 • 技术档案 生产、科研部门在实际工作中形成的 有关工程或课题的文件、图纸、照片、 图表等,内容准确、可靠,是生产和科 研活动的过程与结果的真实记录。
• 动态性:信息是对事物存在方式及运动方 式的反映,随着事物的变化,信息也将 变化,动态性指信息时效性。 • 可再生性:不同于一次性消耗资源,信息 资源可反复利用而不失去其价值,信息 资源的使用,不但不会使信息资源减少, 再利用中还会产生更多信息。
• 共享性:使用同一种信息资源,均不需要 任何的限制条件,信息资源共享的双方 或多方均不会损失信息内容,相反还会 产生新的信息。 • 规模性:信息资源作为整体要有一定的量, 分散、片面地信息不能较好地反映事物 的情况。
五、信息资源类型
1、按载体形式划分
• 印刷型 载体:纸张 记录手段:手写、打字、印 刷等。便于直接阅读,使用方便,较笨重、存 储密度低,不便于加工、整理和收藏。 • 缩微型 载体:感光材料 记录手段:缩微照相。存 储密度较大、体积小、便于收藏保存、便于 远距离传递,需借助缩微阅读机才能阅读。
• 视听型 载体:磁性和感光材料 记录手段:借 助于摄像机、录像机等设备记录声音、 图像。如唱片、录音带、录像带、幻灯 片、电影片、多媒体资料等。直观、生 动,制作成本较高,阅读需借助一定设备。
• 零次信息:未正式发表或未进入学术交 流的信息,如书信、手稿、笔记、实验 记录、会议记录等。 • 一次信息:又称原始信息,是指作者以 其本人研究成果为素材写成的原始创作, 如专著、期刊论文、科技报告、学位论 文等。一次信息是信息检索的直接对象, 信息检索的直接目标就是找出所需的一 次信息。
信息检索第1单元信息检索基础知识
![信息检索第1单元信息检索基础知识](https://img.taocdn.com/s3/m/275d436a0722192e4536f69d.png)
第一节 信息存储的基本程序与方法
五、信息的存储
分类: 手工信息检索系统和计算机信息检索系统
发展: 手工信息检索系统 计算机信息检索系统
信息检索基础知识 C_Zhangyh
一、信息检索的概念
广义的信息检索,包括: 各类信息检索系统的建设(信息存储) 特定信息的检索(信息检索)
信息检索基础知识 C_Zhangyh
4 2020/5/12
第一节 信息存储的基本程序与方法
一、信息检索的概念
信息存储就是利用检索语言对文献信 息进行标引,形成文献标识并输入检 索系统,为检索者提供有规律的检索 途径。
四、信息的描述(著录与标引)
信息著录与标引的标准格式: 1、传统著录 2、机读目录(MACR) 3、元数据著录(Metadata)
信息检索基础知识 C_Zhangyh
18
2020/5/12
第一节 信息存储的基本程序与方法
五、信息的存储
信息存储:将经过加工处理的信息资源 按照一定的方式记录在相应的信息载体 上,组织成系统化的检索系统。
信息素养 == 信息意识 + 信息检索能力
信息检索基础知识 C_Zhangyh
8 2020/5/12
第一节 信息存储的基本程序与方法
二、信息组织
概念:对大量的信息进行收集,并对其 进行组织和控制,使之有序化。
实质:无序信息流——有序信息流 内容:信息筛选、信息描述、信息存储
信息检索基础知识 C_Zhangyh
存储:原始文献 --- 文献标识.存储 --- 检索工具
信息检索基础知识 C_Zhangyh
19
2020/5/12
第一节 信息存储的基本程序与方法
五、信息的存储
第一章 文献信息检索概论
![第一章 文献信息检索概论](https://img.taocdn.com/s3/m/f5b051196bd97f192279e9be.png)
2.2信息检索的类型
2.2.1信息检索按存储和检索的内容划分
文献信息检索:通常指的是检索系统存储的是以二次信息 (文献集合)为对象(目录、索引、文摘)的信息,它们是 文献信息的外部特征与内容特征的描述集合体。如设计人 行天桥的参考文献有哪些? 数据信息检索:指检索系统中存储的是数值型数据,如各 种统计数据、气象数据、人口数据等。如某一新型载货汽 车的载重时是多少?百公里油耗是多少? 事实信息检索:指检索系统存储的是从原始文献中抽取的 关于某一事物(事件、事实)发生的时间、地点和过程 (情况)等方面的信息。如世界上最长的斜拉桥是哪座? 该桥位于什么地方?何时建成?
1.3.2 按信息的出版类型划分
图书 期刊 会议文献 科技报告 专利文献
标准文献 学位论文 产品资料 技术档案 政府出版物
1.3.3 按信息的加工程度划分
零次信息 :是指未经正式发行的或未进入社会交流的最 原始的信息。如私人笔记、文章草稿等。 一次信息 :是人们研究或创造性活动成果的直接记录 , 一般指公开出版的图书、期刊论文、科技报告、会议文献、 学位论文、发明专利等。 二次信息:是对一次信息加工、整理而成的。如目录、文 摘、索引等各种书目数据库是二次信息的核心。 三次信息:对一次信息所载内容进行单元层次(如一条消 息、一个定义、一种观点等)的选择,经过汇集、综合、 分析、评述等深度加工而成的产物。如评论、进展报告、 述评、百科全书、年鉴、指南、期刊书目等。
Ⅰ定题服务 Ⅱ回溯检索服务 Ⅲ随机问答服务 Ⅳ联机定购服务
2特征, 从各个不同角度来查找文献信息的途径, 可分为分类途径、主题途径、著者途径、 关键词途径和序号途径等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ⅰ信息第一意识 Ⅱ信息抢先意识 Ⅲ信息忧患意识 Ⅳ再学习和终身学习意识
信息能力 Ⅰ信息挑选与获取能力 Ⅱ信息免疫与批判能力 Ⅲ信息处理与保存能力 Ⅳ创造性的信息应用能力
二、信息检索的意义
避免重复研究或走弯路 节省研究人员或用户的时间 是获取新知识的捷径
知识有两类,一类是我们自己知道的,另一类是我们 在什么地方可以找到。----塞缪尔.约翰逊
2、期刊
一种定期或不定期的连续出版物,其外部特征是有固 定的刊名、统一的出版形式,较固定的出版规律,每 年至少一期,此外还有主办或主编单位、标准刊号、 年代、卷次、期次等。凡有这些特征的出版物为期刊。 期刊论文的著录格式如下例所示: 李旭东,宗光华,毕树生等. 生物工程微操作机器人 视觉系统的研究[J].北京航空航天大学学报,2002, 28(3):249~252
文献类型及其标志
期 刊 文 章 J 学 位 论 文 D 报 纸 文 章 N 资 料 汇 编 G 其 他 文 献 Z
参考 文献 类型 类型 标志
专 著
论 文 集 C
专 利
标 准
报 告
M
P
S
R
1、图书
图书的外表特征是有书名、编著者姓名、出版社、出 版年、总的页码、标准书号、价格等。凡有这些特征 的出版物为图书。 图书还可以分为两大类:A 阅读性图书,包括教科书、 专著、文集等;B 工具书,包括语言性工具书,如字、 词(辞)典等。 图书在各种论文末的参考文献或题录性检索工具中, 通常著录成如下例所示的格式: 孙家广,杨长青. 计算机图形学[M].北京:清华大 学出版社,1995.26~28
第一章 绪论
主要内容:
各种信息源及其特征
信息素质与信息检索
现代信息检索研究的内容及趋势
第一节 各种信息源及其特征
一、信息源的相关概念
信息、知识、情报、文献及其关系
1.信息的概念与特征
信息是人们关心的事情的消息或知识; 信息是物质存在的一种形式; 信息是经过加工的数据; 信息是帮助人们做出决策的知识; 信息是用来消除随机不确定的东西。
第一节 各种信息源及其特征
一、信息源的相关概念
1.信息的概念与特征
本书定义:信息是生物以及具有自动控制系统的机器
通过感觉器官或者细胞组织,或者具有类似功能的设 备部件与外界进行交流的一切内容。
第一节 各种信息源及其特征
一、信息源的相关概念
信息的特征
时效性 传递性 可扩散性 可扩充性 共享性 增值性
存储形式多样化 内容丰富 资源数字化 载体容量大 可交流程度高 方便利用
第一节 各种信息源及其特征
三、电子信息源
电子信息资源类型
按照网络传输协议不同:WEB信息资源、Telnet
信息资源、FTP信方式不同可分为:邮件型、电话型、公告 牌型、广播型、图书馆型、书目型、交互型等。 按照出版物类型不同:电子图书、电子期刊、电
第一节 各种信息源及其特征
二、文献信息源
(二)文献的载体类型
(1)早期文献形态 (2)印刷文献 (3)缩微文献 (4)声像文献 (5)电子文献
第一节 各种信息源及其特征
二、文献信息源
(三)主要的一次文献
一次文献主要包括十二大类,即图书、期刊、报纸、
会议文献、专利文献、科技报告、学位论文、标准文 献、政府出版物、产品资料和说明书、档案文献,灰 色文献。这十大类型涵盖了所有知识门类的知识载体。
4、专利文献
广义上的专利文献包括专利审批过程中产生的所有文 件,狭义上的专利文献指的就是专利说明书。 其外部特征有:国别代号、专利字样和专利号。如 U.S. Patent 4,142,783, 1979。国内为ZL+号码,如 ZL91100929.9.凡有这些特征的文献就是专利文献。
5、科技报告
第一节 各种信息源及其特征
三、电子信息源
电子信息资源
定义
电子信息资源是以数字化形式,把文字、图像、声音、
动画等多种形式的信息存储在光、磁等非印刷介质上, 以光信号、电信号的形式传输,并通过相应的计算机和
其他外部设备再现出来的信息资源。
第一节 各种信息源及其特征
三、电子信息源
电子信息资源
特征
所有物质均为一次信息源; 二次信息源主要储存于人的大脑中; 三次信息源主要包括口头信息源、体语信息源、文献 信息源和实物信息源; 四次信息源是文献信息源和实物信息源的集约化和系 统化。
第一节 各种信息源及其特征
二、文献信息源
(一)文献的等级
零次文献 一次文献 二次文献 三次文献 从零次文献、一次文献、二次文献到三次文献,是一 个由分散到集中,由无序到有序,由博而精的对知识 信息进行不同层次的加工过程。
第一节 各种信息源及其特征
一、信息源的相关概念
4.文献
文献有三大构成要素,即知识内容、知识载体和记录 手段,缺一不成其为文献。 “人”不是文献,因为没有记录手段,而且人的知识 含量不是确定的,这也和文献不同。
信息、知识、情报及文献的关系
第一节 各种信息源及其特征
一、信息源的相关概念
(二)信息源及其层次划分
3、会议文献
会议文献是指由各种学术会议产生的各种文字资料。 各种类型的学术会议很多,有国际会议、全国性会议、 地区性会议等,有会前出版物( Paper )、会后出版 物( Proceedings ),其外部特征是在出版物的名称 上给出某某“会议录”或某某“会议论文集”等字样, 国内一般不加区分,都叫会议“论文集”。 有会议主办单位、会议名称、会议召开地点、开会时 间、会议录出版单位等。一般来讲,出版物外表有这 些特征的就是会议文献。
第一节 各种信息源及其特征 一、信息源的相关概念
三者的相互关系
信息包含知识和情报。系 列化的信息成为知识,知 识中的特定需要部分就是 情报。但也有的情报只是 消息,并非知识。
信息
知识
情报
第一节 各种信息源及其特征
一、信息源的相关概念
4.文献
记录有知识的一切载体。 包括图书报刊、声像资 料、电子出版物。 信息、知识、情报是文 献的实质性内容。
信息素质与信息检索
现代信息检索研究的内容及趋势
第二节 信息素质与信息检索
一、信息素质内涵
信息素质这一概念1974年由美国信息产业协会主 席保罗·泽考斯基提出,是信息时代人才培养模 式中出现的一个新概念,已引起了世界各国越来 越广泛的重视。 定义为“知道何时需要信息,并已具有检索、评 价和有效使用所需信息的能力”。
第一节 各种信息源及其特征
二、文献信息源
(一)文献的等级
零次和一次文献是最基本的信息源,是文献信息检索 和利用的主要对象; 二次文献是一次文献的集中提炼和有序化,它是文献 信息检索的工具; 三次文献是把分散的零次文献、一次文献、二次文献, 按照专题或知识的门类进行综合分析加工而成的成果, 是高度浓缩的文献信息,它既是文献信息检索和利用 的对象,又可作为检索文献信息的工具。
第一节 各种信息源及其特征
一、信息源的相关概念
2.知识
知识是人们对客观事物存在和运动规律的认识,是人 们在社会实践中积累起来的经验。 隐性知识不属于信息的范畴。
第一节 各种信息源及其特征
一、信息源的相关概念
3.情报
人们在一定的时间内为一定的目的,传递的有使用价 值的知识或信息。 情报是活化的知识和信息,能为人们所利用。
科技报告是指国家政府部门或科研生产单位关于某项研 究成果的总结报告,或是研究过程中的阶段进展报告。 报告的出版特点是各篇单独成册,统一编号,由主管机 构连续出版。在内容方面,报告比期刊论文等专深、详 尽、可靠,是一种重要的情报源。
6、政府出版物
各国政府部门及其所属机构发表的文件,包括行政性 文件和科技文献两大类。行政文件含有国会记录、司 法资料、方针政策、规章制度、决议、指示以及调查 统计资料等。科技方面含有各部门的研究报告、技术 政策文件等。 其最显著的外部特征是有颁发文件的机构名称。
10、档案
有人事、组织、科技等各种档案。其中尤以科技档案 为科技含量最高,涉及任务书、协议书、审批文件、 研制计划、设计方案、技术措施、技术调研材料、设 计计算、试验项目、试验方案、实验材料、试验手段、 试验数据、设计图纸、生产工艺记录等许多内容。 其外部特征是有档案字样、以及档案所属机构名称。
子报纸等。
第一节 各种信息源及其特征
四、实物及口头信息源
实物信息源 包括自然实物和人工实物; 直观性强 可观性强 实用性强
第一节 各种信息源及其特征
四、实物及口头信息源
口头信息源
通过交谈、讨论、报告等方式交流传播的信息。 直观性强 可观性强 实用性强
第一章 绪论
主要内容:
各种信息源及其特征
8、标准文献
标准文献主要是指与技术标准、生产组织标准、管理 标准以及其它具有标准性质的文件所组成的特种科技 文献体系。 广义的标准文献是指记载、报导标准化的所有出版物。 狭义的标准文献是指技术标准、规范和技术要求等, 主要是指技术标准。
9、产品样本
产品目录、产品说明书和产品资料,是对已经投产的 产品所做的介绍,内容涉及定型产品的性能、构造、 原理、用途、使用方法和操作规程、产品规格、机械 维修等具体说明。 其外部特征是,有“产品目录”、“产品样本”和 “产品说明书”的字样和生产厂家名称。
33
第二节 信息素质与信息检索