信息组织期末复习整理资料 最终完整版
信息组织复习资料

信息组织复习资料1.文献著录标准:名解:国家或国际范围内,对文献著录的原则、内容、格式等作出具有一定约束力的规范。
目前国际上影响最大,使用最广泛的著录标准有ISBD和AACR.2.文献标引:信息资源的标引,也称文献标引,是指分析文献的内容属性以及相关外表属性,并用特点语言表达分析出的属性或特征,从而赋予文献检索标识的过程。
两个环节:1.主题分析2.转换标识3.先组式语言,后组式语言:依标识组合时间的先后,可将标引语言分为先组式语言、后组式语言、散组式语言。
先组式语言是指标识在编表时(标引前)就已组合好,标引或检索时不必或较少进行组配的标引语言;后组式语言是指标识主要供组配使用。
而且标引时不将标识组配在一起,到检索时才将标识组配起来的标引语言;散组式语言是指标识主要供组配使用,而且标引时就要表达主题概念的若干个标识组配在一起的标引语言。
4.信息组织的阶段及划分?按职能把信息组织的发展分为三个阶段 a.清册职能时期 b.查检职能时期 c.组织职能时期按组织对象把信息组织的发展分为三个阶段 a.文献组织阶段 b.信息组织阶段c.知识组织阶段。
5.语义信息组织方法:(1)分类组织法(2)主题组织法语用信息组织方法:(1)权重值组织法(2)概率组织法P24判断目前的组织方法属于语义还是语用组织方法。
6.网络信息环境对传统信息组织方式的冲击主要体现在以下方面:(1)信息量剧增以及信息传递速度的加快(2)信息种类增多,数据库成分复杂化,过去主要适用于文本信息的信息组织方法已不敷使用(3)用户成分发生很大变化,用户要求信息组织方式的透明化,易用化。
(4)网络信息资源共享要求信息组织标准化、兼容化。
7 .a.一次信息:①超文本方法②自由文本方法③主页方式b.二次信息:①搜索引擎方法②主题树方法8.主题树方法组织信息资源的优点:a.主题树屏蔽了网络资源系统相对于用户的复杂性,提供了一个基于树浏览的简单易用的网络信息检索与利用界面b.信息检索由用户按照规定的范畴分类系,逐级查看,按图索骥,目的性强,查准率高.c.采用树型目录结构诅咒信息资源,具有严密的系统性和良好的可扩充性.9.下位类:经过一次划分所形成的一系列概念称为子类或下位类上位类:被划分的类称为母类或上位类。
信息组织期末复习资料

信息检索需求的多样化(1)文献检索:是以文献为检索对象的信息检索。
它为用户提供的是与用户的信息需求相关的文献信息,它的目的是相关文献的出处和收藏处所。
文献检索的结果是提供与课题相关的数篇文献的线索或原文,供用户参考. (2)数据检索:是以数值和图表形式表示的数据为检索对象的信息检索。
数据检索是一种确定性检索.(3)事实检索:是以从文献中抽取的事项为检索内容的信息检索。
信息标引:就是对信息内容进行分析并充分而有效地予以揭示。
揭示信息的内容是检索信息、利用信息的前提条件。
从学科属性揭示信息内容就是分类标引,从主题特征揭示信息内容就是主题标引。
准确标引信息要求准确的内容分析,否则就会出现错误标引。
信息系统组织:信息通过特征描述和内容揭示,获得了表示信息的标识,但这只是针对某一文献和信息单元的,把这些信息有序地组织起来才完成了信息组织的过程,这个过程就是信息系统组织。
信息系统组织是把描述和标引的信息实体和信息记录组织成一个有序的系统。
一、信息组织方法:(一)按组织对象分:文献实体组织与信息内容组织(二)按信息组织的层次分:语法信息组织、语义信息组织与语用信息组织(三)常用信息组织方法: 1.分类组织法 2.主题组织法 3.集成组织法三、信息组织手段1、人工组织2、自动组织1、分类检索语言:分类检索语言习惯简称分类语言或分类法,分类检索语言语族主要有三个语支,即(1)等级体系分类语言(2)分析综合分类语言(3)半分析综合分类语言。
2、主题检索语言(1)标引词语言(2)单元词语言(3)叙词语言检索语言词汇控制的意义:检索语言构成材料就是词汇,把词汇按某种方式组织起来构成检索语言词典,它是标引和检索的工具。
检索语言的词汇控制又称规范化处理。
由于表述信息内容的词汇非常庞杂,日常的自然语言词汇并非都能准确表达信息的学科和主题内容。
自然语言缺点(1)词汇的同义现象。
(2)词汇的多义现象。
(3)词汇语义不清或语义不确定。
信息组织知识点汇总

信息组织知识点汇总Happy First, written on the morning of August 16, 2022信息组织知识点汇总第一章第一节、信息组织的必要性1.信息组织:根据信息检索的需要;以文本及各种类型的信息资源为对象;通过对其内容特征等的分析、选择、标引、处理;使其有序化并以适当方式加以提供的活动..2.信息检索:根据检索需要;从检索系统中检出相应信息资源的过程..3.信息资源:通常指一切以记录形式存在的信息载体;只是比较而言;更侧重于对新型媒体形式的强调..可以是图书、期刊、报纸、论文;也可以是网络上的电子资源4. 信息组织与信息检索有什么关系1信息组织是信息检索的基础和前提;只有对信息资源进行处理和有序化信息系统之后;才能准确有效查找相关信息资源;2信息检索则是信息组织出发点与归宿;用户的检索需要是组织信息的主要依据..第二节、信息组织的形式和检索途径1.文献组织的基本排列方式:一般有两种基本排列方式;其一为:固定排列法和按一定意义的次序排列..固定排列法;如档案、博物馆的收藏、光盘、录音带、缩微品..按一定意义的次序排列;如图书、期刊等2. 按照检索工具的对象和特点;可以分为文献目录、索引、机读数据库、网络搜索引擎四种类型..3. 按照标识特征;检索工具可以分哪两种基本类型1以信息资源的外部特征形式特征为检索依据;提供以信息资源形式特征为标识检索途径..常见的信息资源形式特征有责任者名即作者和与资源形成相关的人或机构;如译者、改编者、修订者等、题名、机构名、标准书号、专利号、文献登录号或顺序号等..2以信息资源的主题内容特征为检索依据;提供从资源内容进行检索的途径;主要有分类法、主题法..4.按照系统中所用的标识是否进行控制;检索工具可以分为受控检索系统与自然语言检索系统..5.按照系统中标识组配的特点;检索系统可以分为先组式和后组式两种..6.检索工具还可以按照采用的形式;分为卡片式、书本式、缩微式、电子方式等..第三节.信息组织的处理方式和研究内容1. 检索语言:一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统;也称情报检索语言..2.知识组织系统:知识组织系统通常指经过组织的知识结构表达的工具;它试图包含组织信息和促进知识管理的各种类型的词表;其范围从传统的地名表、同义表;到新型的知识组织工具..3.信息处理的基本做法:领会1描述信息资源;以便识别与确认它;主要方法是着录、编写题录和资源形式特征的描述;2浓缩信息资源内容;主要方法是编写内容提要或文摘;供用户了解、选择和判断信息资源;3提供检索点..主要方法是确定特定资源的标索特征或标识与可检信息..信息资源的检索点有代表其内容特征和形式特征的各种标识;如题名、责任者、分类号、主题词或关键词等4.信息组织活动的内容:领会信息组织活动包括两个基本方面:1信息组织的操作..指根据信息资源的内容和特征;对信息资源进行描述、标引、并将其组织进相应系统的过程..2信息资源的组织规范..这是根据信息组织的需要;按照信息资源的特点预先确定的规则和方法系统;是进行信息组织操作的依据..第二章信息组织原理第一节对信息组织的要求1. 检全率:是指一次检索中检出的与提问相关的信息资源数量占系统中所有与提问相关的信息资源数量的比例;检全率=检出的相关信息资源量/系统中相关信息资源总量子数×100%2.检准率;是指检出的相关信息资源的数量;占检出的全部信息资源数量的比例..检准率=检出的相关信息资源数/检出的信息资源总数×100%3. 简述对信息组织的要求..领会1检全率..略2检准率..略3检索速度和系统的及时性..检索速度是指用户从实施检索到得到结果化费的时间;它是衡量系统检索速度与使用效果的重要参数..它与系统响应检索的能力、检全率、检准率、资源组织的全理性等因素有关..系统的及时性是指检索工具处理信息和提供信息所用时间较短;能快速纳入、处理和提供信息..4系统易用性..是指标引人员使用检索系统描述、标引资源是否方便和易用;用户使用系统的简易性、方便性与获取信息的容易程度..系统易用性是系统性能的主要因素;决定系统设计改进和发展方向..5检索的成本效益..是指检索系统的成本和效益之比..检索成本包括系统设备费、标引处理费、检索运行费;检索效益指检索系统创造经济效益和社会效益..好的检索系统是低成本高效益的系统..第二节信息组织中的控制与规范1. 句法控制的方法主要有哪些句法控制是根据信息资源标引和检索的需要;按照一定的组词造句规则;对检索词的组合方式做出的规定..常见的句法措施有确定引用次序、使用辅助符号和句式转换..1引用次序;是指复合主题标引和检索时;各个主题因素的组合次序..在分类法中引用次序是指类目划分标准使用的先后次序或各主题分面在组配时的先后次序;在主题法中是指字顺检索系统中主标题与各级子标题组合的次序..2辅助符号;是揭示主题概念之间的关系意义、进行检索操作的符号..常见的有:关系符号:是一种用于揭示词语组配中形成的关系类型的符号;通过对组配中关系类型的表达;对标引词进行控制;说明组配性质并有一定的排序功能..联系符号:是一种揭示同一文献主题之间联系强度的符号;可以防止主题词之间出现误组配..职能符号:是一种表示主题标识在组配中的句法职能的符号;可以明确一个标识串句子中各主题因素的施动-受动作用;明确法含义;提高检准率..3句式转换;是为了使检索句子各个有意义的词素能成为检索入口字;通过对语句中词语位置的变动来增加检索点..常见的有:轮排转换;将检索语句中每个有意义的词依次排在检索入口;其他词在保持相对位置的情况下移动..链式转换;以逐次折卸句子链环的方法;将每个有检索意义的的词语依次排在检索入口..分析转换;在一个检索词句中;每次抽取少量的词组配成标题;依次把每个有检索意义的词排在检索位置上..2. 词汇控制的范围是什么领会词汇控制:即根据标引和检索的需要;对自然语言中的的词汇进行优选、规范、揭示相关性的过程..2词汇控制的主要措施包括:同义控制:是对字面形式不同而含义相同的词进行控制;使检索系统中一个概念只有一个词语表达..包括对同义词、准同义词及部分专指词与泛指词进行的控制..同义控制常用的方法是在几个词中选取一个作为规范词;在规范词和非规范词之间建立用代参照;便于用户从非规范词找到规范词..同义控制的作用是可以克服一义多词的自然语言现象;把相同内容或特征的信息资源集中在一起..如:自行车代脚踏车单车词义控制:是对同形异义词和语义含糊的词进行控制;使词义明确;一个词语只表示一个概念;以控制一词多义现象..词义控制常用的方法是在词后加限义词;在词下增加含义注释和范围注释.. 疲劳生理;疲劳心理词间关系控制:是揭示词汇之间的等级、等同、相关关系;使之成为语义相关的系统..在主题法中词间关系控制采用设置参照、倒置标题、主标题-副标题以及编制词汇索引系统;如词族索引、范畴索引、轮排索引等..分类语言主要通过类目体系显示词语间的从属、并列、相关关系;用类目参照显示语词概念的横向联系..3.相关因素控制的主要内容领会常用的相关控制包括引用关系、链接关系和用户需求等..①引用关系:这是科学文献中通过相互引用建立的一种关系;通过它;可以根据相互引证关系;提示文献之间内容上的联系..②链接关系:是基于超文本链接技术建立的对象之间的联系..③用户需求:信息组织是为用户服务的;因此用户的检索需求是信息组织的目标和判断信息组织使用效果的重要指标..第三节规范控制的依据1.概念之间的关系类型..①同一关系:“自行车”与“脚踏车”、“电子计算机”与“电脑”..②包含关系:“哺乳动物”与“熊猫”、“图书馆”与“公共图书馆”..③交叉关系:“妇女”与“科学家”、“中等教育”与“业余教育”..④矛盾关系: “核国家”与“非核国家”..两者之和等于上位概念“国家”..“脊椎动物”与“无脊椎动物”⑤反对关系: 中医学与西医学 ..两者之和小于上位概念“医学”..“无产阶级”与“资产阶级”、“有机肥料”与“无机肥料”⑥并列关系:“人造棉”与“锦纶”、“维纶”、“腈纶”2.知识分类:根据知识组织的不同对象和层次;现有的知识组织体系包括:科学分类体系、学科分类体系、事物分类体系、行业分类体系等..见P24-25页表3.阐述文献保证原则和用户保证原则..文献保证原则:亦称文献根据;指信息资源组织应根据信息资源类型、数量等因素进行相应控制..信息检索系统处理的对象是各种类型信息资源;因此要有效进行信息描述及主题内容的组织和提示;离不开对信息资源的内容、特征以及分布状况等的了解..信息资源的数量、特点;往往是影响检索语言详略程序、确定类目或标识设置的重要依据..用户保证原则:指根据用户需要进行描述控制和词汇控制..检索系统是为用户服务的;各种控制和组织措施如不符合用户的检索要求和使用习惯;必然会影响其使用效果..因此对信息检索系统在进行规范控制时;应当有意识地从用户的使用需要出发..4.信息资源组织对分类的借鉴..信息资源组织以知识分类为基础;可以较好的揭示各个领域知识之间的关系和规律性;及时反映各知识领域的进展..可以包括多种层次和方面;如:①作为信息资源分类的基础;用于建立合理的信息组织的结构..②作为基础类目门类的设置依据..③作为主题系统中范畴处理的依据..④作为专门领域下具体类目的设置依据..⑤作为类目之间关系、词间关系处理的依据等..第三章信息描述第一节、信息描述的含义1.信息描述的信含义:亦称信息资源描述;是指根据信息组织和检索的需要;对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动..2.元数据:是关于数据的数据;或关于数据的结构化的数据..其作用主要包括:①识别:确认并对要进行组织的信息资源进行个别化描述;使用户能识别该组织的资源对象..②定位:提供信息资源位置的信息;以便供用户访问时使用..③检索;通过在描述数据中提供检索点;方便用户对资源的检索和利用..④选择;通过记录信息资源的各种特征;供用户对信息资源的使用价值进行判断;并作出选择..3.信息描述的主要标准:① ISBD是国际标准书目着录的英文缩写;由国际图联IFLA1969年制定的供各类信息资源描述用的国际标准..②文献着录总则我国于1983年7月发表的全国文献着录总则..③DC:是都柏林元素集的简称;1995年3月在美国小镇都柏林创建的元数据描述方法;是对网络资源描述最着名、最有代表性的标准..第二节信息资源描述项目、标识和描述级次1.信息描述项目:亦称着录项目;是用以揭示文献内容和特征的记录事项..2.基本描述项目的内容:我国国家标准文献着录总则规定基本描述项目分为9个大项目;依次为:题名和责任者项目;版本项;文献特殊细节项;出版发行项;载体形式项;丛编项;附注项;文献标准编号及有关记载项;提要项..都柏林核心集分15个大项:题名;创作者;主题;描述;出版者;参与者;日期;资源类型;格式;资源标识;来源;语言;关联;覆盖范围;权限管理..3.掌握文献着录格式;描述各项目内容:如下图:图:文献着录格式4.着录详略级次参见P41图3-3;图3-4;图3-5简要级次:仅记录主要项目的级次;一般为小型文献单位;基本级次:记录主要项目的同时;记录部分选择项目..最常见详细级次:记录主要项目和全部选择项目上..适合国家书或集中编目使用..描述信息源:又称着录信息源、着录根据;指进行信息资源描述时描述信息的来源和出处..第三节检索点和规范文档1.检索点是指检索信息资源使用的题名、责任者、分类号、主题词等供检索使用的各种数据..2.标目的含义及作用..标目即手检系统中的检索点;是记录中用来作为排检依据的资特征..标目有两个作用:①作为排检的依据;确定一款目在检索系统中的位置;供检索查找..②决定款目的性质;供组织相应检索工具使用..3. 参照法的含义和类型..参照法是指引用户从检索工具中的一个标目或款目去查找另一个标目或款目的方法;其作用是指引检索系统中检索对象之间的联系;说明检索系统的编制和使用方法..分为:①单纯参照;又称直接参照;从不用作标目的标识去查找用作标目的标识..②相关参照;又称兼互参照;从一个使用的标目去参考另一条或几条相关标目的参考..③一般参照;又称普通参照;是提供关于一定编目事项的说明;介绍用户使用系统的方法..4. 名称规范文档:是一种对描述记录中的名称标目进行规范控制的工具..其处理的范围;包括人名、机构团体名、着作题名等.. P455.题名检索点的选择方法:P43①文献描述中着录的正题名一般直接选作标目..② 适当选择副题名和附注项中的合辑题名作标目..③ 并列题名在我国中文手工检索工具中一般不选作标目..④ 一文献的题名检索点一般不宜超过两个;但题名分析款目不受此限制;可根据需要设置..6. 个人责任者检索点的选择方法:①描述记录中第一责任者、两人合着中的第二个责任者名称均可以作标目..但3人以上合着时只以第一责任者名称作标目..②如可能;文献责任者中记录的其他责任方式的责任者亦可选择作为标目..③附注项着录的责任者;以及其他有关责任者;一般不作标目;但在必要时;着名学者或着名着作的责任者也可作标目..④以书名命名的编写组不作检索点、临时性写作团体如无检索价值;也不做检索点..⑤丛书综合款目的责任者选择与单书相同;分散着录时;单书作者可选为第一责任者..如果编者为出版社则不编制责任者综合款目..当分析出来的材料的责任者与原书责任者不同时;应选其为分析款目的责任者检索点..⑥一文献责任者检索点的数量一般不超过4个为宜..7.规范文档:是信息组织的一种需要;它是对元数据记录的标目进行控制、跟踪、维护工具..包括名称规范档、主题规范档等.. 其中;名称规范控制是根据确定标目的需要;规定统一使用名称的活动;范围包括人名、团体名、题名等..规范控制的作用是:1有利于以统一的方式加以记录..2以规范、通用的形式加以记录..3方便标引和检索..4有助于实现国际书目共享..第四节计算机编码1.MARC-Machine readable cataloging;机读编目格式是根据文献特点和文献机构之间信息交换的需要建立的标准化的计算机可读形式..MARC中一个编目记录的结构四个部分2.分隔符:P52页分隔符用于分隔不同数据集合;分为字段分隔符和记录分隔符两种..字段分隔符以“”表示;用于标志字段结尾..记录分隔符用于标志记录的结束;以“”表示..3.计算机编码的作用..P501用以显示..2提供检索点..3可以对数据进行一体化处理;促进资源共享..第四章信息描述工作第一节信息描述工作概述1.信息描述工作:依据描述规则;对信息资源的特征进行分析、选择、记录的操作过程..2. 元数据在检索系统中的作用:向用户提供信息资源的目录学信息;供使用者确认信息资源;进行选择元数据的各种特征也是进行组织和检索的依据;是建立检索工具的基础和前提3.信息描述工作的方式类型分类依据工作方式类型描述的资源对象文献编目、档案编目、博物馆藏品编目、网络资源编目操作的设备条件手工编目、机读编目、联机编目处理方式原始编目、复制编目编目过程的组织形式集中编目、共享编目4.在版编目:是集中编目的形式之一;是指在文献出版过程中进行编目;使编目数据得以与文献一起提供;方便文献机构使用..5.大规模的信息资源描述网络——书目机构Bibliographic Utility的出现..这些机构将联机环境、网络环境与信息描述的形式结合;同时结合采用集中编目和协作编目的方式;为有关文献单位提供书目资源和服务..OCLCOnline Computer Library Center;为全美国和国外进行书目服务的机构RLINResearch Library Information Network;该网络开始于1967年;是一个为美国研究图书馆服务的系统UTLASUniversity of Toronto Library Automation System;该系统最早为多伦多大学图书馆的自动化系统;目前已扩大成兼为其他图书馆服务的系统中国高等教育文献保障体系CALIS;管理中心设置在北京大学图书馆;是我国高等学校信息资源的联机编目网络..6.元数据工作的规范要求如下:P58准确:对信息资源的描述应真实反映其内容特征..规范:信息资源的描述应严格遵守相应的描述规范;并在可能时依据相关的规范文档或控制词表..完备:描述项目应比较完备;使得可以从信息资源的各种特征出发进行检索操作..7.信息描述工作程序1查重:就是确定某一信息资源是否已经收入系统..作用:避免不必要的重复劳动;保证对信息资源描述和处理的一致性..2描述:描述操作通常应根据描述规范进行;规范化是信息资源描述的发展方向..3标引:分析信息资源的内容属性特征及相关的外表属性;并用特定的语言表达分析出的属性或特征;从而赋予其检索标识的过程..在此处主要指分类标引、主题标引..4复核:包括检查描述项目是否完备;准确;分类标引、主题标引的结果是否符合系统的要求等..8.Connexion元数据的创建方式:①对已有的记录修改完善..②克隆clone相关记录;进行修改..③创建新元数据记录..第二节信息描述方法1.文献着录总则对题名的分类..P67 ;各种题名书上的例子要知道1正题名:单纯题名、交替题名、合订题名..2并列题名:又称平行题名;对照题名;指见于书名页;与正题名语种不同的题名..3副题名:为解释或从属于正题名的另一题名;应记录于题名之后;以“:”为标识..4说明题名文字..2.责任者的类型和责任方式..责任者说明由责任者和责任方式组成..责任者指对信息资源的生产负有责任的个人或团体..个人责任者可以是一人或多人;集体责任者可以则指机构团体、会议活动等.. 责任方式表示责任者对文献所作的贡献类型..传统文献通常有着、编、改编、执笔、口述、译、注、点校、作词、作曲、绘等多种形式..3. 载体形态项、的含义和类型..载体形态项是一个记录文献物质形态特征的项目..包括:数量、图、尺寸或开本、附件等.. 文献特殊细节项是为某些特殊类型文献特征的着录设置的项目..如:连续出版物的卷、期、起讫、地图比例尺、投影法等;主要用于记录个别重要文献特征..4. 关联项的类型.P71关联..主要用于表达一信息资源与其他信息资源的联系..有七种类型:1部分、全部关联..2版本关联..3格式转换关联..4参照关联..5替代关联..6附属关联..7一致关联..5.检索排检项的类型..检索排检项通过对检索点的提示;供手工检索系统编制使用..通常包括四个方面:文献题名、责任者名、主题词、分类号..6. 传统文献着录总则与都柏林核心集的特点和异同..同:1完备的描述项目2都对描述的等级、标识以及规范的使用作出相应的规定3都具有比较强的扩充性、兼容性异:1针对传统文献描述和识别的需要设置2对传统资源特征的描述项目的设置详尽;针对网络资源的描述项目相对比较概括3各描述项目有明确规定的次序和等级4对描述的表达有严格要求5采用人工标识;适合专业文献单位使用;是一个以文献专业人员为处理主体的描述规范.. 第五章分类法第一节分类法概述1.分类:是指依据事物的属性或特征加以区分和类聚;并将区分的结果按照一定的次序进行组织的活动..分类是人类思维的基本形式;是认识世界的基本方法..2. 信息资源分类:根据信息资源的内容属性和其他特征;将资源分门别类地、系统地组织和揭示的方法..3. 信息资源分类一般具有以下特征:1按照信息资源内容特征的相互关系加以组织;使得信息资源成为一个根据其远近亲疏组织而成的具有等级性、次第性的系统..2一般是从一定的角度出发组织信息资源的按学科集中;按主题分散..3以一定标记符号作为排序工具..4一般通过类目索引提供从字顺角度查找类目的途径..4. 对信息资源进行分类的作用意义1进行资源组织..2建立分类检索工具..3分类统计..4兼容工具..5. 分类法是一种从主题内容角度组织和揭示信息资源的方法;是分类方法在信息资源组织中的应用..6. 分类法的类型以及各类型的典型代表信息资源分类法按照其编制方式;通常可以区分为:①等级列举式分类法..美国的杜威十进分类法Dewey Decimal Classification;简称杜威法或DDC美国国会图书馆图书分类法Library of Congress Classification;简称国会法或LCC 我国的中国图书馆分类法简称中图法等..②分面组配式分类法..冒号分类法Colon Classification;简称CC布立斯书目分类法二版 Bliss Bibliographic Classification;简称BC2③列举组配式分类法..国际十进分类法Universal Decimal Classification;简称UDC俄国的图书馆书目分类法7. 等级列举式分类法的特点、不足..特点:①从一定的角度出发有层次地揭示信息资源;类目展开比较系统;②分类结构显示直观;易于把握、便于使用;③标记简明;号码单纯;适于分类排架;也可以用于组织分类检索工具..不足:①揭示专门主题能力差;往往无法满足确切分类的需要;不能充分揭示现代文献中大量存在的细小专深主题;。
《信息组织学》考试复习大纲(终极版)

【名词解释】1.信息采集:是指根据特定的目标和要求,将分散在不同时空域的有关信息,通过特定的手段和措施采掘和汇聚的过程。
它涉及一切信息工作中的信息采集活动,包括企业和其他组织的管理者们为了实现决策、管理和控制等目标所进行的信息采集。
2.信息组织:就是人们根据信息本身的特点,运用适宜的工具和方法,依据一定的标准或规则,对其进行加工整理,排列组合,使之有序化、系统化、规律化、高级化,增强信息对象的表现效能和运用效能,以满足人们信息需求的过程和活动。
3.分类组织:是依照类别特征组织信息对象的方法。
它的实施以对每一个排列组织对象进行属性或特征分析,为它们赋予分类代码或语词形式的类别标识为基础,然后,再按照类别的不同或分类代码的某种次序,排列组织所有对象的活动和方法。
4.主题组织:是按照信息对象等所反映的主题特征的异同,用接近自然语言的能表达宽泛程度各异的概念语词和语词符号标识这些特征,通过参照系统等方法揭示概念词间关系,并将概念语词、语词符号按音、形顺序排列来组织信息,以便提供一种易用的面向具体事实、概念的检索途径的信息组织方法和活动。
5.关键词:是指在文献的标题、摘要或正文中出现的、对表达文献主题内容具有实质意义、能作为检索入口的、具有关键性描述作用的词汇。
6.标引:是对信息的内容进行分析,并运用一定的语言和方法,根据信息内容的学科属性等特征给予标识(如主题词、分类号),并以此作为信息组织、存储和检索依据的过程。
7.主题标引:是依据一定的主题词表或主题标引规则,将信息资源中具有检索意义的特征转换成相应的主题词,赋予信息资源语词标识的过程。
8.信息描述:是指根据信息组织和检索的需要,依据一定的规则和标准,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。
9.元数据:描述数据的数据,是描述任何Internet数据和资源的数据。
10.信息重组:是以一批相关信息为基础,利用分析、鉴别、浓缩、提炼、综合归纳和评价手段,对信息对象中的相关信息或知识点进行重组,通常是按照逻辑序列整序,形成更加系统的信息或知识产品。
(完整word版)信息组织复习题及参考答案

(完整word版)信息组织复习题及参考答案信息组织复习题及参考答案1-1 名词解释:著录:亦即信息组员描述,它是指根据信息组织和检索的需要,对信息资源的内容特征和形式特征进行分析、选择和记录的过程。
标引:分析文献的内容属性及外表属性,并用特定语言表达分析出的属性或特征,从而赋予文献检索标识的过程。
ISBD:全称《国际标准书目著录》,即是一系列以丛书、乐谱、地图资料、非书资料等为对象的书目著录的国际标准,1971年开始发布。
AACR2:全称《英美编目条例第二版》,1978年,在第一版的基础上根据国际编目标准调整后出版,由“著录”及“标目、统一书名和参照”两部分组成。
自动聚类:从待分类对象中提取特征,再将提取的全部特征进行比较并按一定原则将具有相同或相近特征的对象定义为一类,设法使各类中包含的对象大体相等。
自动归类:先分析待分类对象中的特征,将其与各种类别中对象具有的共同特征进行比较,再将待分类对象归入特征最近的一类并赋予其相应的分类号,通常有基于词的自动分类(词典法)和基于专家系统的自动分类(知识法)两大类。
1-2 简述信息组织的诞生与发展。
信息组织是对信息资源对象进行收集、加工、整合、存储使之有序化、系统化的过程。
在信息生产与消费的过程中,信息组织是核心。
作为社会活动的重要组成部分,信息组织是与人类社会同时产生并同步发展的。
按职能划分信息组织发展阶段:清册职能时期,在古代信息管理时期,信息管理的着眼点不在于“用”而在于“管”;查检职能时期,此时,信息组织活动不仅告诉人们有什么信息,而且告诉人们怎样找到信息;组织职能时期,这个时期,信息组织从最完整的意义上实现了整序信息、科学分流、促进选择、保证利用的组织职能(organizing function)。
1-3简述信息组织学的理论方法(理论基础与方法基础)。
系统论(基于“整体大于部分之和”的原理,信息组织的目的是要建立信息系统)、耗散论(信息组织所要建立的信息系统应该是一个与外界保持信息交换的开放系统)、协同论(一个信息系统是由多个子系统构成的,建立各子系统之间的协同作用机制是非常重要的)是信息组织的理论基础。
信息组织复习

第一章1.信息组织的基本方法就可以概括为: 以信息外在特征和内容特征为基础的信息序化方法和信息优化方法。
2.信息的序化:是按照一定的方法将无序的信息组织成有序信息的过程。
经序化过的信息会变得一目了然,便于管理和利用。
3.信息的优化:是在序化的基础上,按照结构功能优化的目的对信息进行再序化的过程。
4.信息序化的基本方法:1.语法信息序化法 2. 语义信息序化法 3.语用信息序化法5.信息的优化主要包括: 信息的优选、浓缩、重新表述及三者的综合运用。
6.信息的重新表述 有改写、编译、翻译等方式。
(了解)7.信息的综合优化的主要形式是信息综述和信息述评。
8.信息综述:是对某一领域或课题一定时期的有关信息进行归纳、整理、分析、加工后所形成的信息产品6.信息述评:是针对某一领域、研究课题或成果的水平、现状、发展动向及影响进行全面而系统的分析评价或明确提出建议9信息组织的一般过程包括:1.信息替代 2.信息序化 信息的替代过程(亦可成为信息揭示过程)实际上是对原始信息的外表特征(包括题名、着者、出处等)和内容特征(包括分类号、主题词、摘要等)进行描述的过程,这项工作通常称为着录。
10.信息序化是对替代信息给出信息标识(如分类号、主题词等)的过程,这项工作通常称为标引。
11.衡量信息检索效率的指标:查全率R = 查准率P = 查全率R 与查准率P 呈负相关12.信息浓缩的主要方式:1)文摘 2)题录 3)目录 4)词条第二章分类法:是以知识属性来描述和表达信息内容的一种信息处理方法。
分类语言:是指以数字、字母或字母与数字结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为隔离的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。
分类法的类型:1)体系型分类法:是传统的分类法,它的特点是:直线型的序列,层累制的结构,列举式的类目,码号式的语言。
《中国图书馆分类法》是典型的体系型分类法。
信息资源与组织管理(复习资料)

信息组织与管理复习1.信息的基本特征:客观性,普遍性,时效性,共享性,传递性,转换性,可伪性,记载性,价值性,等级性,不完全性2.信息的分类:(重点)一次文献信息:指一切原始的信息,包括决议,报告,记录,心得,经验,消息,创作和研究成果等原始文献资料。
(手稿和未刊稿)二次文献信息:指对原始文献信息加工处理后的信息。
包括卡片、目录、索引,文献等。
三次文献信息:指通过二次文献信息提供的线索,对某一范围内的一次文献信息进行分析、研究而加工生成的第三个层次的文献信息,包括综述、述评、专题研究报告、百科全书等。
3.信息资料的定义:广义信息资源:指人类社会活动中积累起来的信息、信息生产者、信息技术等信息活动要素。
广义的信息资源有三个部分组成:(1) 人类社会经济活动中经过加工处理有序化并大量积累后的有用信息的集合;(2) 为某种目的而生产有用信息的信息生产者的集合;(3)加工、处理和传递有用信息的信息技术的集合。
狭义信息资源相当于广义信息资源所包括三部分内容的第一部分内容,即人类社会经济活动中经过处理有序化并大量积累后的有用信息的集合。
4.信息资源的特点:潜在性、可塑性、共享性、时效性、不可分性、不一同性、不均衡性、驾驭性、整体性5.信息资源的类别:(1)元信息资源:是指信息生产者、信息产生者的结合。
其中信息生产者是指能够创造并生产出有用信息的人或者机构;信息产生者则是指无意识地向人类社会发出各种信息的大自然。
元信息资源是信息生产的源泉,是信息资源的基础。
(2)本信息资源:是指信息内容本身,是信息的集合。
它是构成信息资源的核心部分,是信息资源组织和管理的重要内容(3)表信息资源:是指为信息的收集、存储、加工、处理、传递、开发、利用而使用的一切技术和设备的集合。
表信息资源是信息得以显现的重要基础,也是信息得以充分开发利用的必要条件。
表信息资源既包括以计算机技术和通信技术为核心的信息技术和网络技术,也包括计算机与通信设备,以及纸张、光盘、胶片、软盘、磁带等各种介质,甚至还包括人脑。
信息组织复习

信息组织复习信息组织1.1.1信息在知识经济中的地位与作⽤信息是物质存在的⼀种⽅式、形态或运动状态,是标记在通讯系统中的信号,是构成知识的原料。
《⽜津英语词典》综述了信息的三种⽤法:其⼀是作为过程的信息(information-as-process),其⼆是作为知识的信息(information-as -knowledge),其三是作为事物的信息(information-as-thing)。
信息与物资、能源已成为现代社会的三⼤⽀柱。
它是物资、能源之后的“第三级资源”。
⼈们每时每刻都在⽣产信息、消费信息。
从长期的社会实践中⼈们认识到,信息是⼈类的宝贵财富,是国家的战略资源。
1962 马克卢普:1973 丹尼尔.贝尔:1980 阿尔⽂.托夫勒:1982 约翰.奈斯⽐特:1985 美国政府授权Calgary⼤学成⽴:“知识科学研究所”:90年代初,信息探索研究所1994 C.温斯洛和W.布拉马:1996 《经济合作与发展组织》1.1.2 信息组织在信息资源开发中的地位与作⽤由于现代信息技术的发展,特别是随着Internet的兴起和迅速发展,信息⽣产、传输空前便捷,导致信息量急剧增长,信息质量参差不齐,信息污染⽇益严重,“信息爆炸”、“知识爆炸”成为现代社会的⼀⼤特征。
这⼀现象给⼈类提出了两个问题。
其⼀,知识和信息的海量性和⽆限性与⼈的精⼒、时间的有限性形成了尖锐的⽭盾;其⼆,知识和信息的⽆序性和污染性与⼈类使⽤的选择性同样是尖锐的对⽴。
信息组织的地位与作⽤:1.是信息资源开发利⽤的基础现代社会信息的基本特征,是庞杂分散。
⼈们需求的特点,是专业的⾼度选择性、内容的精良性和时间的紧迫性。
两者之间的⽭盾就依靠信息组织来完成。
2.是信息增值过程有序的信息、信息系统的价值增加。
3.是在信息⽣命周期开发信息的要求。
1.2 信息资源的描述于发现机制1.2.1 信息组织原理信息组织,即信息序化或信息整序,也就是利⽤⼀定的科学规则和⽅法,通过对信息外在特征和内容特征的描述和序化,实现⽆序信息流向有序信息流的转换,从⽽保证⽤户对信息的有效获取和利⽤及信息的有效流通和组合;信息组织是信息资源管理的基本范畴之⼀,是信息资源建设的中⼼环节,是建⽴信息系统的重要条件,是信息检索与咨询的基础,是开展⽤户服务的有⼒保证。
信息组织复习资料

信息组织期末复习资料1.信息组织、文献目录、索引、检索语言的基本概念。
信息组织:亦称为信息资源组织,是根据使用的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等进行分析、选择、处理、序化,并以适当的方式加以提供的方式。
文献目录:通常是以各种媒体的文献单元为对象,对其进行记录、报道与揭示的工具,包括文献收藏目录和书目。
索引:是以文献集合中的文献单元或文献中的信息单元为揭示对象的检索工具。
检索语言:是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统。
2.信息组织与信息检索的关系。
信息组织是信息检索的基础和前提;信息检索是信息组织的目的和归宿,是信息组织的反向过程。
3.信息资源组织的类型。
按组织对象分为信息资源和检索工具;按检索工具的类型分为目录、索引、数据库和网络搜索引擎;按照标识特征和提供的检索途径分:题名检索工具、责任者检索工具、分类检索工具、主题检索工具、按照引文关系的检索工具;按照组配方式分:先组式检索工具、后组式检索工具;按照是否控制:受控检索工具、自然语言检索工具;4.检索工具的类型(依据对象与特点划分)。
按照检索工具的对象和特点,可以分为文献目录、索引、机读数据库和网络搜索引擎。
①文献目录:以各种类型的文献单元为对象,对其进行揭示、报道的工具。
包括:(1)文献收藏目录——以一个或多个文献单位收藏的文献为对象加以描述和揭示;(2)书目——通常以某一领域、地域、或时限内出版的文献为对象进行组织和揭示,也可以根据应用需要编制,为用户提供较为全面的文献信息。
②索引:是以文献或文献集合中包括的信息内容为其揭示单元的工具,包括期刊索引、书后索引等;③机读数据库:是由文献资源为对象的机读记录的有序集合,是一种依托现代计算机技术、以机读形式建立的检索系统。
包括:(1)参考数据库——书目数据库收录文献目录或索引数据;全文库收入文献全文,可进行文本检索;(2)源数据库——包括事实数据、数值数据、图像数据等类型。
信息组织复习资料

信息组织复习资料名词解释:1.信息组织:是根据使用的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等进行分析、选择、处理、序化,并以适当的方式加以提供的活动。
(P1)2.标引:指在对信息资源进行主题分析的基础上,依据一定的类表、词表等,进行检索标识的过程。
(P62)3.主题法:指直接以表达主题内容的语词做检索标识、以字顺为主要检索途径的标引和检索信息资源的方法。
(P184)4.情报检索语言:一种由表达文献主题概念及其相互关系的词汇及规则组成的人工语言系统。
(P9)5.叙词:是经过规范化处理的,已基本概念的基础的表达文献主题的词和词组。
(P187)6.标引语言:7.主题标引:是依据一定的主题词表或主题标引规则,赋予信息资源语词标识的过程。
(P253)8.分类法:以表达信息资源内容的标记符号为标识,按照主题之间的关系进行系统组织。
(P5)简答题:1.信息组织和信息检索的关系。
(P2、3,图1—1)答:⑴信息组织与信息检索是密切联系的,相互依存、相互作用、互为因果;⑵信息组织是信息检索的基础和前提,只有进行信息资源处理和有序化组织,才可以利用它有效地进行检索查找;⑶信息检索是信息组织的出发点和归宿,是信息组织的只要目标之一;2.什么是句法控制?方法有哪些?(P16、17)答:含义:是指根据信息资源标引和检索需要,通过一定的组词造句的规则,对检索语词的组合方式作出规定。
方法:⑴引用次序:指复合主题标引和检索时,各个主题因素的组合次序;⑵辅助符号:是检索语言揭示主题概念之间的关系意义,进行检索操作的标识形式,包括:关系符号、逻辑组配符号、联系符号、职能符号。
⑶句式转换:根据需要,对句法形式加以转变和调整,包括:轮排转换、链式转换、分析转换。
3.MARC机读编目的应用(P50、P53图3—6)(论述题中也涉及此知识)答:MARC格式是根据文献特点和文献机构之间信息交换的需要建立的标准化计算机可读形式。
信息组织学复习资料

信息组织学复习资料第一篇:信息组织学复习资料第2章信息组织概述1.λ信息组织的内涵信息组织(information organization)就是人们根据信息本身特点,运用适宜的工具和方法,依据一定的标准或规则,对其进行加工整理,排列组合,使之有序化、系统化、规律化、高级化,增强信息对象的表现效能和运用效能,以满足人们信息需求的过程和活动。
λ从层次上看,信息组织包括了序化和优化两个层次,序化是基础,优化是延伸。
2.信息组织要素λ属性与序、规范和操作是信息组织的两对基本要素,是信息组织进行的依据,信息组织学科体系就是建立在这些要素之上。
(1)属性λ属性反映了信息的本质特征事物的属性总体上可以分为外在属性和内在属性,在信息组织工作中,外在属性称为外表特征,内在属性称为内容特征。
λλ信息组织的过程就是按照事物属性之间的同一性、包容性、交叉性和排斥性等关系对信息实施序化的过程。
(2)序λ序是事物的一种结构形式,是指事物或系统的各个结构要素之间的相互关系以及这种关系在在时空中的表现,即事物发展中的时间序列及排列组合、聚类状态、结构层次等空间序列。
(3)规范λ有序无序是针对一定参照系而言的,这个参照系就是规范。
信息组织规范主要包括:λ①基本术语规范;②有关信息技术规范(信息交换格式、程序设计与数据库语言、网络标准与协议等);③信息组织技术规范(如信息描述规则、信息代码、信息标引规则和信息组织成果编排规则等);④其他相关规范。
(4)操作λ操作指根据信息资源的内容和特征,对信息资源进行描述、标引,并将其组织进相应系统的过程。
λ这一操作一般是依据一定的信息资源描述处理的规范,对信息资源的特征和内容进行分析、归纳、选择、记录,并在此基础上将其组织进信息资源集合和检索工具。
3.信息描述规范λ描述项目规范:如题名、责任者、出版社、关键词等传统文献著录时基本描述项目分为9个大项。
依次为:题名和责任者项目;版本项;文献特殊细节项;出版发行项;载体形态项;丛编项;附注项;文献标准编号及有关记载项;提要项。
02117信息组织复习资料(2021)

02117信息组织复习资料(2021)第一章一.信息组织的含义信息组织,即信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。
序是事物的一种结构形式,是指事物或系统的各个结构要素之间的相互关系以及这种关系在时间和空间中的表现。
二.信息组织在信息资源建设中的地位与作用1.信息资源建设的基本内容与环节包括信息的采集,组织,开发和利用。
信息组织在其中属于关键因素,处于关节点的地位。
现在社会信息的基本特征是庞杂性和分散性,人们对信息需求的特点是专业的高度选择性,内容的精良性,时间的紧迫性。
2.信息组织是一个信息增值过程。
3.信息组织是信息生命周期管理思想的最积极,最活跃的因素,做好信息组织工作,会促进信息流通,发挥信息效用,使信息流形成良性循环,使信息在时间上更快速的传播。
4.信息组织是信息检索利用的基础。
三.信息组织的发展阶段1.清册职能时间:它主要通过对信息的记录和登载,如同“信息账房先生”,告诉人们有什么信息而已。
2.查检职能时期:信息组织活动不仅告诉人们有什么信息,而且告诉人们怎样找到信息。
3.组织职能时期:利用计算机技术,通信技术和网络技术已经不满足告诉人们有什么信息和怎样找到信息。
它不仅可以告诉人们我们这里有什么信息,而且还可以告诉人们其他地方有什么信息。
人们还可以知道什么信息适合于自己,可以多途径多角度地查检信息。
四.信息组织的理论基础系统论,耗散结构理论和协同论使信息组织有了理论基础。
五.信息组织的方法基础语言学,逻辑学,知识分类是信息组织的方法基础。
要把庞杂分散的信息组织成有序优化的整体,就必须建立符号系统,但都和自然语言一样,有着共同特征:有语词,有词汇,有语法,这就是信息组织的语言学基础。
知识分类是一门研究知识体系结构的学问。
六.信息组织的基本方法信息的外在特征和内容特征,它们是信息组织的基本对象和管理依据。
《信息组织》复习提纲

2022年秋季学期信息管理与信息系统专业《信息组织》课程期末复习提纲一﹑复习方法以本复习提纲作为复习的主要线索,掌握提纲中所涉及的各知识点。
二、参考资料1 马张华《信息组织》第三版清华大学出版社2022年5月第3版2 《信息组织》网络课件注:教材与课件在编排顺序和内容详略上有所不同,具体的对应关系见学期初挂在论坛上的“学习指导”。
所以在复习时请以教材为主,配合使用网络课件。
三、考试方式与试卷结构采用闭卷方式。
考试的具体形式包括:名词解释、填空题、选择题、问答题。
名词解释――主要帮助掌握术语体系;为了方便复习,本课程提供完整的名词复习范围。
填空和选择――帮助掌握基本知识;问答题――帮助掌握内容的深度了解。
四、各章节知识点第一章一、名词解释信息组织、文献目录、索引、检索语言二、简答题1.信息组织与信息检索的关系。
(了解)2.根据对象与特点划分,检索工具有哪些类型(掌握)3.两种基本检索途径及其特点(掌握)4.传统检索系统中对信息资源处理的基本做法。
(掌握)第二章一、名词解释检全率、检准率二、简答题(了解)1、评价一个信息组织系统应考虑的基本因素。
2、信息组织中的规范控制主要有哪些方法。
第三四章一、、名词解释信息描述、元数据、检索点、MARC格式二、几个典型的信息描述规范,如《文献著录总则》、《都柏林核心集》的基本描述项目(了解)三、简答题:信息描述的作用有哪些(了解)第五章分类法第一节一、名词解释信息资源分类、等级列举式分类法、分面组配式分类法二、简答题1. 简述信息资源分类的特征、作用。
(了解)2. 信息资源分类法的含义是什么?分为哪几种类型?(要求能根据实例判断类型)(掌握)第二节一、名词解释基本部类、复分表(了解)、顺序标记制、层累标记制、八分法、双位制、预留空号法、类目索引(掌握)二、简答题1、分类法的结构组成及各部分的作用。
(掌握)2、类目体系的结构组成。
(掌握)3、复分表的作用。
(了解)4、标记符号的要求、种类、编号制度、常用标记技术(掌握)5、类目索引的几种常见类型及其定义。
信息组织复习资料

信息组织复习资料信息组织考试题⽬名词解释:信息组织,检全率,分类标引,轮排解答题:信息组织与信息检索的关系,主题法的特征,信息资源分类的特征论述题:主题标引与分类标引的异同分类法的类型年复习资料名词解释1.信息组织亦称为信息资源组织,它是根据信息资源检索的需要,以⽂本及各类型的信息资源为对象,通过对其内容特征等的分析、选择、处理、序化,并以适当的⽅式加以提供的活动。
2.检索语⾔是⼀种由表达信息资源主题概念及其相互关系的词汇及规则组成的⼈⼯语⾔系统,国内亦称为情报检索语⾔。
3.词汇控制指根据⽂献标引和检索的需要,对⾃然语⾔中的词汇进⾏选择、规范并揭⽰其相关性的过程.4. 句法控制是指根据信息资源标引和检索的需要,通过⼀定的组词造句的规则,对检索语词的组合⽅式作出规定。
5. 轮排转换(转动轮排)。
即依次将检索语句中每⼀个有检索意义的语词轮流在排检位置上排列,并对句⼦中其他语词在保持原有相对位置不变的情况下随着移动6。
搜索引擎(search engine)是指根据⼀定的策略、运⽤特定的计算机程序从互联⽹上搜集信息,在对信息进⾏组织和处理后,为⽤户提供检索服务,将⽤户检索相关的信息展⽰给⽤户的系统。
7.. 信息资源分类,是指根据信息资源内容属性和其他特征,将各种类型的资源分门别类地、系统地组织和揭⽰的⽅法。
8. 分类(法)表,亦称信息资源分类表,是根据类⽬之间关系组织起来的,并配有⼀定标记符号的类分信息资源的⼯具。
9.基本部类是为分类法合理展开对知识范畴所作的最概括、最本质的划分10类⽬索引是⼀种按主题字顺⽅式,从主题名称指向分类号或相应类⽬,帮助分类⼈员利⽤类⽬表的⼯具。
11. 同位类从同⼀个上位类区分出来的⼀组处于同等地位的⼦类,12. 交替类⽬,是指在为⼀个知识门类设置使⽤类⽬的同时,在相应门类下设置的具有同⼀关系的类⽬。
13.分类标引,⼜称为归类,是指依据⼀定的分类语⾔,对信息资源的内容特征进⾏分析、判断、选择,赋予分类标识的过程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息组织复习资料第一章信息组织引论1、信息组织:信息组织是对信息资源对象进行收集、加工、整合、存储使之有序化、系统化的过程。
组织信息的目的是为了检索信息、利用信息。
2、信息组织的诞生与发展:(1)按职能划分信息组织发展阶段1)清册职能时期2)查检职能时期3)组织职能时期(2)按组织对象划分信息组织发展阶段1)文献组织阶段2)信息组织阶段3)知识组织阶段3、信息组织的理论基础(P8)1)系统论a)系统是处于一定相互关系中并与环境发生关系的各组成部分的总体b)整体大于部分之和2)耗散结构理论a)一种自组织结构b)系统内各组成部分有强烈的相互作用c)相互影响、制约,与环境发生交互d)使自身保持稳定,动态有序的活结构3)协同论a)海尔曼·哈克4、信息组织的方法基础(P9)1)语言学a)一种符号系统(形式和内容)b)词(词组)词形、发音、语义、语用2)逻辑学a)形式逻辑b)数理逻辑c)辩证逻辑3)知识分类学a)信息资源的知识分类b)知识分类体系(图书馆图书分类)5、自动分类标引(P15):是指由计算机代替人工对文献信息进行分类,赋予其分类标识,以描述文献主题内容的活动。
分为:1)自动归类自动归类是指先分析待分类对象中的特征,将其与各种类别中对象具有的共同特征进行比较,再将待分类对象归入特征最近的一类并赋予其相应的分类号。
自动归类根据使用的技术通常分为基于词的自动分类(词典法)和基于专家系统的自动分类(知识法)。
2)自动聚类自动聚类是指从待分类对象中提取特征,再将提取的全部特征进行比较并按一定原则将具有相同或相近特征的对象定为一类,设法使各类中包含的对象大体相等。
一般是在语词共现的基础上,通过词频统计和相似性比较加以聚类的。
6、自动主题标引技术(P16):自动主题标引是指由计算机自动确定语词标识来表达信息资源主题的过程,包括1)自动抽词标引:是指直接从原文中抽取词或者短语作为标引词来描述信息资源的主题内容。
2)自动赋词标引:是指由计算机从受控词表中自动选取词语来表达文献主题内容。
7、文献著录标准(P21)1)ISBD:《国际标准书目著录》。
各类型文献书目著录的国际标准。
外文简称ISBD。
由国际图书馆协会联合会和联合国教科文组织合作,根据1969年丹麦哥本哈根国际编目专家会议精神而制订。
ISBD在总则及各分则内,明确规定了款目的著录项目、各著录项目的顺序以及标识符号的使用等,既统一了各类型文献的书目著录,又各有特点,同时有利于不同文种书目记录的识别与交流。
2)AACR:《英美编目条例》国际性的文献著录规则。
1967年出版的《英美编目条例》简称AACR1,由英国、美国和加拿大三国图书馆协会,以及美国国会图书馆联合提出,C.S.斯波尔丁编。
由于英美双方对部分规则有分歧意见,AACR1有两个版本,即英国版(British text)和北美版(North-American text)。
1971年《国际标准书目著录》问世后,为适应网络化和文献著录标准化的需要,1978年出版了AACR2。
注:以上均来自百度百科8、信息资源标引(P23)1)标引的含义:分析文献的内容特征及相关外表属性,用特定语言表达分析出的属性或特征,从而赋予文献检索标识的过程。
2)标引过程:a)主题分析,即在了解和确定文献的内容属性及帮助揭示内容的某些外表属性(如文献类型)之后,将这些属性概括为主题并用自然语言表述,同时分析主题概念之间或主题概念因素之间的结构关系,为下一环节做准备。
b)转换标识,即用专门的主题概念或概念因素,构成一定形式的检索标识。
3)标引语言:标引语言是表达文献主题概念和文献需求主题概念的简明性、单义性和关联性概念标识系统,是根据标引和检索需要而编制的人工语言。
第二章信息资源管理的分类语言1、《中国图书馆分类法》(P32)1)《中国图书馆分类法》简称《中图法》,原名《中国图书馆图书分类法》,1971年着手编制,1975年出版第1版,1980年、1990年、1999年分别出版第2,3,4版。
2)分类(P33、34)《中图法》类目排列的基本原则是:①优先使用事物的客观发展次序、事物内部固有的次序、科学的系统次序以及人们认识事物的逻辑次序排列同位类。
②同位类的排列贯穿着从总到分、从理论到应用、从一般到具体的逻辑次序。
③当某类事物的客观次序不明显或某种人为的次序更有利于检索时,则按人为次序排列同位类。
主要是按类目的重要程度、文献的多少、通常的习惯次序以及从现实到历史的次序排列。
④对于性质相同或相似的类列,采用统一或对应的排列方法,以提高助记性。
3)标记制度a)标记符号:《中图法》采用拉丁字母与阿拉伯数字相结合的混合制标记符号。
b)编号制度:《中图法》的编号制度采用基本的层累制。
还采取了诸如八分法、双位法和借号法等编号的变通措施,增加配号的灵活性,扩大号码系统的容纳性。
①八分法②双位制③借号法4)组配技术a)通用复分表:附在主表之后,是主表各级类目组配复分的依据。
只对主表类目起复分作用,不能单独使用。
b)专类复分表:编列于主表有关类中或通用复分表类中,专供特定类目细分使用的复分表。
c)类目之间的仿分:利用相邻或相关类目的子目,作为有关类目复分依据的组配编号法。
2、冒号组配:是将概念相关的两个或多个类目(主类号)通过组配符号“:”连接在一起,以表达一个分类表未列举的较专指或较复杂检索主题的标引技术。
3、DDC/UDC/LCC 的特点1)DDC的特点:a)类目体系完整,覆盖全部知识、文献;类目详尽,等级分明,便于理解使用。
b)首创以简明号码标记类目的方法,便于图书排架、目录组织和检索。
c)首创采用小数标记制。
d)首创使用复分和仿分方法。
e)首创图书馆分类法的类目相关索引。
f)成立了管理常设机构,不断修订更新,保持分类法的长久生命力。
2)UDC的特点:a)UDC在文献分类法发展史上占有重要地位,它具有下列主要特点:b)较早、较全面地采用概念分析与综合原理及冒号组配技术,是世界上第一部半分面分类法。
c)类目详尽,详本类目多达15-21万个。
d)标记制度灵活,辅助符号多达十几种,表达概念能力强。
e)当然,UDC也有修订不及时,类目体系陈旧,组配过于复杂等不足。
3)LCC的特点:a)类目体系有文献保证,因而实用性强。
b)列类详细(尤其在人文、社会科学部分),类目超过23万个,是世界上类目最多的一部分类法。
c)是典型的列举式分类法,较少采用组配方法。
没有通用复分表,各大类几乎分别编有地区、形式、主题等专用复分表,各大类复分表的类目设置和配号均不相同。
d)类号较简短,容纳概念的能力较强。
e)有专门机构负责修订,及时反映新的变化。
4、分类语言的构成原理1)体系分类法的构成原理:体系分类法,又称等级分类法、列举式分类法,是一种直接体现知识分类的等级制概念标识系统。
它是对概括文献信息内容及某些外表特征的概念进行逻辑分析(划分与概括)和系统排列而构成的。
a)类:是许多具有某种(或某些)共同属性的事物的集合。
b)分类:用另一种属性作为划分标准(分类标准)来对这一类事物进行划分。
c)经过一次划分所形成的一系列概念称为子类或下位类,被划分的类称为母类或上位类。
它们之间的关系是隶属关系。
各子类互称为同位类。
d)分类应遵循的规则:i.唯一性。
在每一次划分时,只使用一个划分标准,不同时使用两个或两个以上的划分标准,否则会出现划分后所得各子类互相交叉、重叠的混乱现象;ii.完整性。
划分后所得各子类的外延之和应等于其母类的外延,避免“不完全划分”的错误和“多出子类”的错误;iii.科学性。
要选择事物本质的、符合分类目的的属性作为划分标准,否则分类便失去科学性和实用价值。
2)组配分类法的构成原理:组配分类法的构成基于概念的可分析性和可综合性。
即一个复杂概念可以分析为若干个简单概念(或概念因素),若干个简单概念可以综合为一个复杂的概念。
因此,一个复杂的主题概念可以用若干个简单概念标识的组配来表达。
是分类体系法的发展。
5、分类语言的体系结构(P49)☻分类法的体系包括理论体系和技术体系。
☻理论体系是指编制分类法时对人类全部知识所作的最基本的划分,即基本部类或基本大类的划分,如十进法(将全部文献分为十大类)、五分法(将全部文献划分为五大部类)等。
☻技术体系是指为达到特定的功能,将众多类目构成相互联系、相互制约的整体的形式,如体系分类法、组配分类法、体系-组配分类法等。
☻分类法是一个具有内在联系的逻辑系统,其系统功能是通过其结构来实现的。
分类法的结构分为:宏观结构,即它的各个组成部分及其之间的组织方法、相互联系和作用的方式;微观结构,即类目的构成要素及其组织。
1)体系分类法的宏观结构:a)分类表。
也称类目表,是根据类目之间的关系,按照一定的原则组织起来的类目一览表。
是分类表的主体。
b)编制和使用说明。
分类法的编制说明一般是对分类表的编制目的和适用范围、编制原则、体系结构、辅助表、标记符号、注释等予以介绍和解释,使人们对分类表有一个基本的、全面了解。
使用说明是分类表的使用指南,它以指引人们正确使用分类表为目的,一般会对分类表的分类体系、标记符号和复分表的编制和使用、分类标引的一般规则和方法等予以详细说明。
c)索引。
分类法索引,又称为类目索引,它是一种按类名及类目相关概念名称字顺查找相应类号的类表辅助工具。
2)体系分类法的微观结构:a)类目(包括复分表的子目):是构造分类法的最基本要素,每个类目代表具有某种共同属性的文献集合。
b)类号:是类目的代号,也叫标记符号,决定类目在分类体系中的位置。
c)类名:是类目的级别,代表该类目在分类体系中的等级(划分的层次)、显示类目间的等级关系。
d)注释和参照:对类目的含义及内容规范、分类方法、与其他类目的关系等进行说明。
3)组配分类法的体系结构:组配分类法可以分为分面组配分类法、组配—体系分类法和体系—组配分类法三种类型。
6、分类法在组织网络信息时具有的优势(P57)7、自编分类系统的种类①等级式主题分类法系统②分面组配分类法系统③学科分类法系统8、自编分类系统的特点①重视以事物为中心设置类目②类目收录范围宽泛③多重列类、重复反映④排列方式简便⑤直接以语词组织信息⑥更新迅速9、网络信息分类的基本原则:①直接性原则分类的层次不宜太多,不应该出现转换十多次还找不到所需信息的情况。
一般来说,类目在6层以下比较符合人们的习惯。
②数据保证原则分类对象要明确地扩大到网络上一切可以利用的资源,让各种类型的网络信息资源都能在分类法中找到相应的位置。
③自然性和实用性原则所用的类名基本上应当是自然语言,同时,网络信息分类的类目要少而精,要实用.④快捷性原则每一类名都应有与其对应的一个快捷键或类号,以便于熟练的用户进行快速查找。