信息组织PPT
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
⏹第1章信息组织引论
⏹主要内容
⏹信息资源在知识经济中的地位与作用
⏹信息组织的内容
⏹信息组织的发展沿革
⏹信息组织方法与技术
⏹ 2.1 信息资源在知识经济中的地位与作用
⏹1973年和1979年哈佛大学社会学家丹尼尔·贝尔;1980年未来学家阿尔温·托弗勒及法国名记者施莱贝尔提出并论述
了“信息社会”这一概念。
⏹知识经济:建立在知识和信息的生产、分配和使用上的经济。
⏹信息是物质存在的一种方式、形态或运动状态,是标记在通讯系统中的信号,是构成知识的原料。
⏹《牛津英语词典》综述了信息的三种用法:
1.作为过程的信息(information-as-process),
2.作为知识的信息(information-as -knowledge),
3.作为事物的信息(information-as-thing)。
⏹ 2.1.1 信息组织在信息资源开发中的地位与作用
⏹“信息爆炸”、“知识爆炸”成为现代社会的一大特征。
是否给你造成了困扰?
⏹这一现象给人类提出了两个问题:
⏹知识和信息的海量性和无限性与人的精力、时间的有限性形成了尖锐的矛盾;
⏹知识和信息的无序性和污染性与人类使用的选择性同样是尖锐的对立。
⏹美国未来学家奈斯比特在《大趋势》一书中指出:“我们淹没在信息中,但是却渴求知识”。
⏹为什么当各类信息向洪水一样向我们涌来时,我们仍然缺乏所需要的信息呢?
⏹这是因为在知识经济和信息化社会中,“失去控制和无组织的信息不再是一种资源”。
⏹解决这一问题的根本方法就是发展信息产业,开发信息资源。
⏹信息资源开发的基本内容与环节包括信息的组织、检索和利用。
⏹讨论:
⏹信息的含义是什么?
⏹将以下词汇按其思想水平从低到高排序:数据,知识,智慧,信息。
⏹信息组织的必要性?
⏹
⏹ 2.1.2 信息组织的涵义
⏹广义的信息组织
⏹一般来说,信息组织,即是对信息的集合和序化。
⏹信息管理领域的信息组织
(狭义的信息组织)
⏹信息组织,即信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的描述和
序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。
(周宁)
⏹信息组织的对象
⏹信息
⏹文献(信息资源)——记录有信息或知识的载体,如印刷型的书刊、机读资料、数字化的多媒体等。
⏹信息或文献的信息——信息或信息资源的描述。
⏹信息组织的实质
⏹集合,系统化,序化
⏹信息组织的目的
⏹建立信息检索系统
⏹方便信息的检索、获取、流通
⏹信息组织的依据
⏹信息的外表属性(外在特征、形式特征)
⏹物理形态,题名,责任者,等等
⏹信息的内容特征
⏹所属的类、涉及的主题、包含的语词
⏹信息组织的方式
⏹依外表属性进行的信息组织、依内容特征进行的信息组织
⏹不同环境下的信息组织
⏹图书馆,
⏹档案馆,
⏹博物馆和美术馆,
⏹互联网
⏹数字图书馆、信息构建
⏹数据管理
⏹知识管理
⏹ 2.1.3 信息组织的基础
⏹理论基础
⏹系统论
⏹大量分散、杂乱的信息有机结合(组织)成系统,实现“整体大于部分之和”
⏹信息组织就是要建立信息系统
⏹耗散结构理论
⏹开放系统、无序变有序
⏹信息组织所要建立的信息系统应该是一个开放系统
⏹协同论
⏹系统从无序向有序的演化,都是子系统之间相互作用而又协同一致的结果。
⏹信息组织而成的信息系统中,各个子系统之间必须具有协同作用机制。
⏹方法基础
⏹语言学
⏹作为信息组织依据的信息特征必须用符号系统来表示,这些符号系统都有一种语言,因此,需
要以语言学方法为基础。
⏹逻辑学
⏹信息组织是一种思维活动,必须遵循科学的思维方法。
形式逻辑是关于思维规律的科学。
信息
组织符合逻辑思维规律。
⏹知识分类
⏹知识分类是一门研究知识体系的学问。
⏹信息的主体是知识,信息组织必须建立在人们对知识体系认识的基础之上。
⏹ 2.2 信息组织的内容
⏹信息描述
⏹信息标引和浓缩
⏹提供检索点并将信息序化和系统化
⏹信息组织活动的两个方面
⏹计算机技术在信息描述和标引中的运用
⏹ 2.2.1 信息描述
⏹信息描述的概念
⏹信息描述,是依据一定的规则,对信息资源或文献的外表特征、物质形态和内容特征进行分析、选择和记
录的过程。
传统上称为文献著录。
⏹著录实例: 目前,国际上影响最大、使用最广泛的著录标准主要有ISBD和AACR2。
⏹ISBD:全称是——International Standard Bibliographic Description,译为《国际标准书目著录》。
⏹AACR2:全称是Anglo-American Cataloging Rules:2,译作《英美编目条例第二版》。
⏹信息描述的结果——元数据
⏹描述信息或文献特征的数据就是元数据。
⏹一般来说,元数据是关于数据的数据,或者是关于数据的结构化的数据。
⏹元数据提出之初,是指网络信息资源的描述数据。
但是,现在元数据描述的对象已经包括各种不同的信息
资源类型:数字化多媒体、机读资料、印刷型书刊论文等
⏹信息描述的目的
⏹以元数据为中介,对信息资源进行以下操作:
⏹识别:确认并对要进行组织的信息资源进行个别化描述,使用户能够识别被组织的信息资源对
象。
⏹定位:提供信息资源位置的信息,以便用户访问。
⏹序化和检索(发现):描述数据中的检索点,既是使信息组织序化的依据,又是信息资源检索
的入口。
⏹评价和选择:通过记录的信息资源特征,用户可以对信息资源的价值进行判断,决定是否选择
该资源予以利用。
⏹信息描述规范
⏹信息描述应该依据一定的描述规范进行,以便达到信息描述的一致性,实现信息共享。
⏹近年来,图书情报、计算机、网络、出版领域一起合作,结合电子环境和技术的发展,创建了一系列信息
描述规范。
其中,以《都柏林核心集》(Dublin Core,简称DC)最为著名。
⏹之前,国际图书情报界制定和实施了一系列《国际标准书目著录》(ISBD)标准。
如:
⏹ISBD(M)专著1974年
⏹ISBD(S)连续出版物1977年
⏹ISBD(NBM)非书资料1977年
⏹ISBD(G)总则1977年
⏹我国也制定了相应的全国文献著录标准系列,如:
⏹《普通图书著录规则》、《连续出版物著录规则》、《非书资料著录规则》、《文献著录总则》
⏹这些规范(标准)规定了描述的项目、次序、符号、依据等。
⏹信息描述项目
⏹信息描述项目是揭示信息资源或文献的内容和形式特征的记录事项,也称著录项目。
⏹DC将描述项目分为15大项:题名、作者或创作者、主题和关键词、描述、出版者、其他参与者、日期、
资源类型、格式、资源标识、来源、语言、关联、覆盖范围、权限管理。
⏹我国《文献著录总则》规定了9大项:题名和责任者项、版本项、文献特殊细节项、出版发行项、载体形
态项、丛编项、附注项、文献标准编号及有关记载项、提要项。
⏹描述信息源
⏹指进行信息描述时描述信息的来源和出处。
又称著录根据,著录信息源。
⏹每一种信息资源都有其特定的主要信息源作为描述的依据。
⏹网络信息描述的主要信息源是<head>和</head>这对标签内的头标部分。
⏹图书的主要描述信息源是书名页、版权页。
⏹ 2.2.2 信息标引和浓缩
⏹信息标引的涵义
⏹信息标引是指分析信息的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,从而
赋予信息检索标识的过程。
原先多称文献标引。
⏹信息标引过程,主要包括两个环节:
⏹主题分析转换标识
⏹简单一些,可以说:信息标引就是用特定检索标识揭示信息内容。
⏹信息标引正逐渐走向自动化。
⏹标引语言
⏹标引语言是表达信息主题概念和信息需求主题概念的简明性、单义性和关联性概念标识系统,是根据标引
和检索需要而编制的人工语言。
⏹标引语言的主要种类
⏹分类语言
⏹也称分类法。
它是用分类号表达主题概念,依据知识分类将主题概念组织、排列成
类目体系,主要以类目体系的自身结构显示概念之间关系的标引语言。
⏹主题语言
⏹又称主题法。
它是用受控的自然语言语词直接表达主题概念,按语词字顺排列主题
概念,主要用参照系统显示概念之间关系的标引语言。
⏹标引的种类
⏹由于用来表达信息内容的标引语言有不同的种类,相应地信息标引也有不同的种类。
其中,最主要的是分
类标引和主题标引。
⏹分类标引
⏹分类标引,是指对信息进行主题分析,用分类语言表达分析出的主题,赋予信息分类检索标识
(分类号)的过程。
⏹习惯上,分类标引被称为分类。
⏹分类
⏹是指以事物的本质属性或非本质属性为根据,将属性相同的事物集合成类,将属性
不同的事物区别开来的过程。
⏹类
⏹是具有某种或某些相同属性或特征的若干事物的集合,它是对某种或某些属性相同
的一组事物进行概括而形成的概念
⏹对信息而言,一类信息就是一组在某种属性上彼此相同的信息。
⏹在信息分类体系中,类常被习惯地称为类目,表达类目概念的名称叫类名。
⏹分类标准
⏹在分类过程中,作为分类根据的事物属性称为分类标准。
⏹信息分类
⏹根据信息内容及其他相关属性,以分类语言(分类法)为工具,分门别类地系统揭
示和组织信息的过程和方法。
⏹主题标引
⏹主题标引,是指对信息进行主题分析,用主题语言(主题法)表达分析出的主题,赋予信息主题
检索标识(标题、叙词等)的过程。
⏹通俗地说,主题标引就像是直接用信息内容所论述的事物名称给信息/文献“命名”。
只不过,主
题标引所命的“名”是对事物本来名称进行优选和规范后所形成的唯一和精确的名称。
⏹例如,关于“个人电脑”的信息和关于“微型电子计算机”的信息,其主题实际上是相同的,用《汉
语主题词表》这种主题语言来进行主题标引,可以赋予这两本书相同的主题检索标识(主题词)
“微型计算机”。
⏹信息浓缩
⏹是为了使用户能够迅速了解信息资源的内容,对信息资源的内容进行浓缩。
⏹信息浓缩的主要方式是编写文摘或内容提要。
⏹信息浓缩可以说是标引的一种特殊形式。
⏹虽然目前的大多数文摘和内容提要还是由人工(作者或专门人员)编写,但是,人们正在努力进行自动编
制文摘或内容提要的试验。
⏹ 2.2.3 提供检索点并将信息序化和系统化
⏹提供检索点
⏹就是确定检索特征及可检信息,以便依据它们对信息资源进行有序化和系统化,并响应检索提问。
⏹经过描述的各种信息特征,均可以用作检索点,但是,不一定都要作为检索点。
⏹标引所得的信息检索标识,如分类号、主题词,往往是主要的检索点。
⏹在计算机检索系统中,文摘、提要甚至全文中的语词都有可能成为检索点。
⏹信息序化
⏹信息序化,就是依据标引和描述所得的可检特征标识的顺序,将信息资源或信息资源记录(如元数据)组
成有序化的信息集合。
⏹有序化的信息集合的表现形式
⏹目录
⏹索引
⏹数据库文档
⏹网络搜索引擎
⏹目录、索引中款目的序化方法
⏹字顺方法
⏹是以作为检索点的题名、责任者、主题词等的特定字顺,对目录、索引款目进行排
序的方法。
⏹我国主要采用
⏹汉语拼音音序法
⏹笔画笔形法
⏹四角号码法
⏹分类方法
⏹是根据信息资源所属的类,依据所采用的分类体系(分类法),对目录、索引款目进
行排序的方法。
⏹分类排序所实现的实质上是一种逻辑顺序,形式上有可能是分类号的一种号码顺序。
⏹信息系统化
⏹信息系统化包括序化,但不只是序化。
它除了序化之外,还要求将信息资源之间的联系,特别是序化时款
目没能排到一起的信息资源之间的联系,通过款目之间的参照反映出来。
⏹因此,信息检索系统中的信息集合既是有序化的信息集合,更是系统化的信息集合。
⏹数据库中记录组织
⏹数据库中的记录,是对某一实体(信息或其他对象)的全部属性进行描述的结果。
⏹在全文数据库中,一条记录相当于一篇完整的文献。
⏹在书目数据库中,一条记录相当于一条文摘、题录或元数据。
⏹字段,是记录的基本单元,是对实体的具体属性进行描述的结果。
⏹文献数据库常见的基本字段:题名、文摘、主题词、标识词、作者等
⏹文献数据库的辅助字段有:记录号、作者单位、出版年月、语种等
⏹文档
⏹记录的集合就是文档。
⏹记录的序化就表现在文档结构上。
⏹一般来说,一个数据库至少包括一个顺排文档和多个倒排文档。
⏹顺排文档:将数据库的全部记录按照记录号的大小排列而成的集合。
⏹倒排文档:以记录的特征标识作为排列依据,其后列出含有此标识的记录号,或者
说是按照文献的属性列出具有同一属性的所有记录。
⏹ 2.2.4 信息组织活动的两个方面
⏹信息组织的操作
⏹描述
⏹标引
⏹提供检索点
⏹序化和系统化
⏹编制信息组织规范
⏹信息描述规范
⏹标引语言(检索语言)
⏹词表、分类表
⏹标引规则
⏹ 2.2.5 计算机技术在信息描述和标引中的运用
⏹自动生成元数据
⏹自动生成概念空间或词表
⏹自动标引
⏹自动做文摘
⏹数据挖掘
⏹信息推送
⏹基于内容的检索
⏹作业一:
⏹1.为什么说“失去控制和无组织的信息不再是一种资源”?
⏹ 2. 查阅《中国图书分类法》,并根据自己的理解分析中图法是如何实现信息组织的(500字左右)
⏹请写在作业本上,第5周交
⏹ 2.3 信息组织的发展沿革
⏹信息组织是如何走到这个阶段的?
⏹过去几个世纪发展起来的信息组织的基本原则都有哪些?
⏹库存目录、书目、目录和编码
⏹古代(西方)
⏹目前所知的最早的目录之一出现在公元前2000年左右Nippur的苏梅尔人制作的一块石碑上,上面记录着62个题名,
其中有24个是当今仍有名的文学著作
⏹大约公元前1500年,Hittites明显觉得有必要将书目信息作为书的一部分。
他们的石板上有版本页。
⏹约公元前650年,尼尼微城的居民建立了一个图书馆,对这个图书馆似乎花了很大力气来维护其资料的顺序和真实性。
⏹古代最大的两家图书馆分别在帕加马和亚历山大——古希腊文化中两个非常活跃的中心。
他们所使用的目录(Pinakes)
是一种木匾,中间可以倒蜡,待蜡变硬后可用尖笔在上面刻字。
(难怪没有任何遗迹留存下来)。
亚历山大图书馆的pinakes是由卡里马朱编制的。
⏹卡里马朱当时划分的门类有史诗和其他非戏剧诗、戏剧、法律、哲学、历史、演说、医学、数学、自然科学、杂记。
⏹希腊文化似乎奠定了西方“主要款目”应该是“作者”的思想基础。
⏹关于古罗马图书馆的资料几乎没有,从仅有的提及它们的资料来看,那时还是有某种查找所需图书的途径的。
他很可
能是通过“固定排架法”。
⏹有一则故事提到,如果一个贵族准备参加一场思维辩论,他会先派一个仆从去图书馆查找能佐证其观点的书。
⏹中世纪(西方)
⏹中世纪欧洲图书馆馆藏的最早目录之一出现在8世纪。
它写在图书最后的空白页上,由一系列简短的题名组成,其中
有些提名后还增加了作者。
⏹9-13世纪欧洲图书馆继续编写看似库存目录的目录,其中有这么一份目录,它明确说明了她的用途是作为库存目录。
⏹13世纪至少有一份目录在著录图书时用了一些罕见的著录项,如“无用”“字迹清晰”“古旧”“好”,使用这些著录项的目
的是帮助鉴别目录还是帮助读者选手,尚不清楚。
⏹13世纪末,有先辈开创了一项在目录史上被认为具有里程碑意义的工程,这就是Registrum Librorum Angliae的编写。
它是英国多所修道院图书馆馆藏的联合目录,用一种很现代的方式给每个图书馆分配了一个编号。
⏹欧洲文艺复兴时期
⏹目录在14世纪有了些许改进,这个时期有一些目录已经可以称得上是排架目录了。
⏹14世纪最出色的目录出自1389年多佛尔的圣马丁修道院,它可能是第一份真正意义上的目录。
⏹学院图书馆在14世纪开始书目控制时间,但是并没有为书目控制的发展带来任何革新,仍保持着前几个世纪的原始
库存目录水平。
⏹15世纪主要的新的书目实践是Reference(参照)的使用。
在目录中,参照是附在款目后面,揭示某书的其他可能位置
(如“见神学第96卷”)
⏹15世纪中期发生了一件挑战所有书目控制活动的大事——活字印刷术的发明。
⏹大量与作品原件一模一样的复本代替了原来数量很少的手抄本。
一个新的群体也应运而生,他们从事作品目录的编写
工作,即“编目员”
⏹15世纪末德国的编目员乔安·崔斯恩不仅编写了一部按时间顺序编排的书目,这在当时看来费比寻常,而且还附上了
一个作者字顺索引。
⏹从库存目录到查找目录到聚类措施
⏹1545年康纳德·格斯纳出版了一部作者书目,1548年出了一部主题索引,并在此过程中创立了一项优秀的新标准:在
书目前面放置了一个名姓倒置的作者字顺表。
⏹17世纪初,目录开始被视为查找目录而不是库存目录。
18世纪书目控制进入稳定期,目录要么是分类要么是字顺。
⏹1791年,法国大革命之后,法国政府颁布法规,对政府没收的大量图书馆藏书进行全国性编目,这是最早的国家图
书馆法规。
各图书馆根据法规制作卡片目录。
⏹编码时期
⏹1836年英国众议院的一个委员会受理大英博物馆的管理和事务,其中之一就是目录和编目的情况。
安东尼·帕尼兹把
他的意见写进了一部名为“91条规则”的编目规则中,与1839年货的官方批准。
这些规则表明,已经进入“现代”编目阶段,因为他致力于处理的问题和我们现在仍在争论的许多问题是相同的。
⏹19世纪上半页,美国的编目水平落后于欧洲大概一个世纪,例如,在当时哈佛印刷的三部目录中,有一部按照书的
大小分成三个字顺表;三部目录都只包含了非常简短的纪录;没有一部提供了主题途径。
⏹1850年查尔斯·朱埃特编制了一部施密森学会的编目规则,美国人开始在编目领域发挥影响力。
⏹对一部规则的用途,朱埃特信奉的是“一致性是必要的;但是,只有众多编目员都遵循尽可能解释作品细节的规则,
这种一致性才能达到。
”
⏹他认为目录应该是聚类措施。
⏹20世纪
⏹20世纪20年代,四位杰出的美国图书馆员帮助起草了《梵蒂冈规则》,被认为是当时最好最完整的编目法规。
⏹1961年国际图联(IFLA)在巴黎召开了一次国际编目原则研讨会,提交了一份原则草案,与会成员都同意采纳这些原
则,并且同意修订各自国家的规则以与刚通过的原则一致。
⏹1967年英美两国携手出版《英美编目条例》。
⏹1974年,为了国际书目信息的交流,IFLA出版了《国际标准书目描述》(ISBD)其目的在于使不同来源地记录能互相
交换,便于跨越语言障碍解释他们,将这种记录转换为机读格式。
⏹《英美编目条例》第2版于1978年出版,它结合了ISBD,主要针对非图书资料而贬值,考虑了书目记录的机器处理,
协调了英美的版本,而且更加紧密地遵从巴黎原则。
⏹书目机械化
⏹19世纪70年代,打字机进入图书馆,由此拉开了信息组织自动化的序幕。
⏹1928年,伊斯曼·柯达研发出了缩微照相技术,这是文献工作领域的一项重大技术进步,这项技术被看作收集、存储
和访问大量信息的一种手段,当时有人预言缩微胶卷将取代传统的图书。
⏹二战对书目控制的机械化造成了一定影响,表现在两个方面:
⏹第一,自从美国下达制造原子弹的命令以后,科技信息迅速膨胀。
当时科学研究秘密而快速进行,研究结
果也急需在实验室之间快速传递。
这增强了政府的书目控制意识,进而促使政府拨款发展书目控制的机械
化。
⏹第二,为了使大战向有利于同盟国的方向发展,大量德国科技文献资料被没收。
这些资料需要立即进行书
目控制以便于利用。
当时制作了许多缩微胶卷并且通过战略勤务局下属的一个委员会分发,战略勤务局的
中央情报部门使用IBM的穿孔卡片装置对文献资料进行主体分析。
⏹1945年,万·布什发表了一篇题为《As We May Think》的文章,开创了文献信息科学的新纪元。
文中,布什提出了memex
的构想,即“一个存储设备,可以存储个人所有的…图书、记录和信件等资料,而且它是机械化的,可以实现快速和灵活的查询。
”memex是以类似于人类思维过程的联合标引思想为基础的,把款目连接起来,任何一条款目都能立即同向其他相关信息的检索点。
⏹1950年,加尔文·莫尔斯首次提出了信息检索一词。
它和当时其他信息学家致力于研制“快速检索机”,目的是想通过
在缩微胶卷边上穿孔的方法为缩微胶卷提供主体检索。
⏹1957年第一颗人造卫星发射升空,再次把信息需求推向了科学界的最前沿。
文献领域发展成为信息科学领域。
20世
纪60年代通信和信息处理技术取得了巨大进步,计算机开始用于存储大量资料并提供高速检索。
⏹1968年,美国文献学会改名为美国信息科学学会(ASIS),机器在信息检索中的应用已深深扎根于信息科学界,此时
信息科学也开始脱离图书馆独立发展。
⏹回顾图书馆科学的发展轨迹,见证了信息科学的分离。
⏹虽然信息科学和图书馆科学之间似乎存在着一条鸿沟,但是二者都有至于信息组织并且从事着信息组织的研究和工
作。
⏹信息组织是信息管理的重要环节和基本工作
⏹信息管理的目的是解决日益增长的信息需求和相对滞后的信息服务的矛盾,信息组织是解决这一矛盾的关键环节。
⏹信息组织的发展主要是与信息管理整体发展和信息组织理论方法发展及信息技术发展紧密联系的。
⏹按照职能把信息组织的发展区分为三个阶段:
⏹清册职能时期、查检职能时期、组织职能时期
⏹安组织对象划分信息组织发展阶段
⏹文献组织阶段、信息组织阶段、知识组织阶段
⏹ 2.4 信息组织方法与技术
⏹信息是事物运动的状态和方式,而任何事物运动的转改和方式都具有形式、内容和效用三个方面。
⏹信息可分为语法信息、语义信息和语用信息。
⏹三种信息组织方法:语法信息组织、语义信息组织和语用信息组织。
⏹最常见的语法信息组织方法:
⏹字顺组织法、代码法、地序组织法、时序组织法
⏹语义信息组织方法:
⏹分类组织法、主题组织法
⏹语用信息组织方法:
⏹权重值组织法、概率组织法
第2章信息描述规范——元数据标准
⏹元数据的涵义和种类
⏹元数据标准
⏹DC的发展
⏹信息编码的计算机标识语言
⏹第一节元数据的涵义和种类
⏹元数据的涵义
⏹元数据的功能
⏹元数据的种类
⏹元数据的级别
⏹元数据的涵义。