信息组织
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章
信息组织的定义
信息组织,亦成称信息资源组织,是根据使用的需要,以文本及各种类型的信息资源为对象,通过对其内容进行分析、选择、处理、叙化,并以适当的形式加以提供的活动。
信息资源的概念
信息资源是指一切以记录形式存在的信息载体。
与“文献”含义接近。
信息组织和揭示的层次
信息组织和揭示的层次:存在单位,个体,信息成分。
根据使用的需要确定。
就其组织和揭示的层次而言,直接以信息资源的存在形式为处理对象,例如直接以图书、期刊、网站等为处理单元。
也可以期刊、报刊、网站中的个体,如论文、新闻、网站中的构成部门为处理单位。
还可以选择其中的信息成分作为处理的单元。
(数据库)
信息组织和信息检索的关系
信息组织是信息检索的基础和前提,信息检索是信息组织的出发点和归宿。
信息组织的形式
信息组织的形式,信息资源,文献记录。
对信息资源进行组织,是指按照一定的方式将信息资源本身直接纳入信息资源集合。
文献组织的排列方式
文献组织的两种基本排列方式,固定排列法,按一定意义的次序排列。
检索工具的类型
按照检索工具的对象和特点,检索工具分为文献目录,索引,机读数据库,网络搜索引擎。
文献目录,以各种媒体的文献单元为对象,包括文献收藏目录和书目。
索引以文献集合中的文献单元或文献中的信息单元为揭示对象的检索工具。
按照数据的特点,机读数据库可以分为参考数据库和源数据库。
按照依据的标识特征,检索工具可以分为,以信息资源的外部特征为依据,以信息资源的内容特征为依据。
(以表达信息资源主题内容的表示为依据,提供从内容角度进行检索的途径。
包括主题法和分类法。
)
责任名、题名、机构名、出版社、标准书号、专利号、档案号、文献登录号为外部特征。
关键词、摘要、分类号为内容特征。
根据系统中所用的标识是否进行控制,检索工具可以
分为受控检索系统和自然语言检索系统。
受控检索是指依据指定的受控词表建立的检索系统。
例,各种依据分类法和主题词表等建立的检索系统。
自然语言检索系统是指直接使用信息资源中自然语言的语词进行组织和检索的方法。
按照系统中标识组配的特点,检索系统可以分为先组式和后组式。
先组式检索工具是指检索前复杂主题的标识在系统中就已经按一定方式组配好了的一类检索系统。
后组式检索工具是指检索前复杂主题的标识在检索系统中是以基本概念的形式独立存在的,实施检索时,才根据提问进行组合。
检索语言的定义
检索语言是一种由表达信息资源主题概念及其相关关系的词汇及规则组成的人工语言系统,亦称为情报检索语言。
检索语言有词汇和语法组成。
第五章
信息资源分类的定义
信息资源分类,是指根据信息资源的内容属性和其他特征,将各种类型的资源分门别类地、系统地组织和揭示的方法。
信息资源的分类是一种从主题内容角度系统组织和揭示信息资源的方法,是分类方法在信息资源组织中的应用。
信息资源分类的特征
按照内容特征的相互关系进行组织。
从一定角度出发组织和揭示信息资源。
采用一定的标记符号作为排序工具。
通过类目索引提供从字顺角度查找类目的途径。
信息资源分类的作用
进行资源组织。
建立分类检索工具。
分类统计。
兼容工具。
信息资源分类法的编制方式
分类法的组成
分类法的组成分为类目体系、标记符号、说明与注释、类目索引。
类目体系的组成
按照其展开特点,通常是在基本部类的基础上,由基本大类、简表、详表、复分表组成。
基本大类、简表、详表构成类目表的主表。
复分表,又称附表,是一种结合主表使用需要编制的辅助表。
我国文献分类法的基本部类,应用。
我国文献分类法的基本部类,将知识门类分为哲学、社会科学、自然科学、马列主义和毛泽东思想、综合
性图书五个部类。
国内当前使用比较广泛的文献分类法,如《中图法》、《科图法》。
基本大类应做好类目设置、序列两个方面。
类目设置应划分均衡、数量合理。
基本大类的数量保持在20个左右。
大类的数量一般保持在14~20个之间。
在大类的排列次序上,文献分类法一般均重视对各个部门之间关系的揭示。
大多重视对大类之间联系的揭示,一般将内容相关的门类集中设置。
我国文献分类法大类的序列,除将马列主义、毛泽东思想设为第一大类外,在大类的排列中一般都注意贯穿从总到分的原则,根据对类目关系的理解确定次序。
复分表的定义,作用,类型
由共性子目构成,供主表有关类目共同使用的表,称为复分表,亦称为副表、辅助表、共性区分表。
复分表是分面组配的一种基本使用形式。
作用为,缩小类表的篇幅,加强类表的伸缩性,增强类表的规律性。
复分表按其适用范围,可分为通用复分表、专类复分表和仿分。
通用复分表,又称共同区分表,是一种供主表各大类有关类目共同使用的表,通常在类表的前部或后部集
中编列。
常用的复分表有:标准复分表,地区复分表,时代复分表。
专类复分表,是一种只限于在某一基本大类或专门领域使用的复分表,一般设置于相应大类之下。
仿分是一种以统一的方法处理共性子目的方法。
利用某一类的子目作为进一步区分依据的类目处理方法即称为仿分。
标记符号的概念(理解),作用
标记符号,亦称分类号,是分类法中用以标识类目的代号。
标记符号具有固定类目次序,显示类目之间关系的作用。
分类号(标记符号)的要求
简明性,表达性,容纳性,助记性
号码的种类,与其对应的优缺点
按号码组成成分,分类标记通常可以分为单纯号码、混合号码两种。
单纯号码
编号制度类型及其应用。
分类标记一般分为顺序标记制、层累标记制、顺序-层累标记制、分面标记制。
标记技术
标记技术包括八分法,双位制,借号法,预留空号法,对应编号法,字母标记法。
类目索引的定义
类目索引,亦称分类表索引,是一种按照主题字顺方法,从主题名称指向分类号,帮助分类人员利用类目表的工具。
类目索引根据其不同的特点,分类及应用
类目索引根据其不同的特点,可以分为直接索引、相关索引、主题词索引。
《中国人民大学图书馆图书分类法》(人大法)的索引属于直接索引。
分面分类表的索引属于直接索引
《中图法》的索引条目《杜威法》的索引中的条目属于相关索引。
我国《中图法》(四版)索引采用了轮排索引。
类目划分的定义、分类标准、应遵守的分类规则
类目的依据,是指依据一定的属性或特征对类目的外延进行区分,生成一组子目的过程。
建立分类体系时用以区分事物的属性,一般必须是信息资源的本质属性或显著特征。
逻辑划分规则:每次划分只使用一个标准。
划分应该穷尽被划分类的外延。
划分后各子类相互排斥。
引用次序的定义、作用
引用次序,是指复合主题在标引与检索中不同主题因素的组配次序。
引用次序决定类目体系中复合主题的集中方式。
同位类的定义、常用同位类序列方法(同位类不等于同级类。
)
从同一个上位类区分出来的一组处于同等地位的子类,
称为同位类。
常用同位类序列方法:按时间先后顺序、事物进化顺序、空间次序、逻辑次序、依存次序、惯用的次序、实用顺序、字顺次序排列。
类目之间的关系有几种?形式是什么?
类目之间的关系有四种,表现为从属关系,并列关系,交替关系,相关关系。
通过连续划分形成的一系列具有从属关系的类目,称为类系。
从属关系的类目包括属种、整部、方面等三种基本类型。
特点:上位类必然能包括下位类的外延;下位类必然具有上位类的属性。
同位类是指由同一个上位类区分出来的、处于同等地位的一组类目。
类目体系中处于同一个等级的类目,称为同级类。
同级类不一定属于同一上位类,类目之间往往并没有同位类所具有的那种联系。
交替关系指交替类目与相应使用类目之间形成的关系。
相关关系是指类目之间除从属、并列、交替等方式以外的其他联系。
类目体系展开的特点
类目体系展开的特点:重视按事物对象设类、多元划分、多维展开、横向关系揭示、采用类目设置与显示的新形式。
第七章
分类标引的定义
分类标引,又称为归类,是指依据一定的分类语言,对信息资源的内容特征进行分析、判断、选择,赋予分类标识的过程。
标引工作程序
标引工作程序:查重、主题分析、归类、给号、审核主要类目、附加类目、分析类目的定义
按照文献主要内容对象确定的类目,称为主要类目;按照次要内容对象确定的类目,称为附加类目。
按照信息资源中部分内容进行的分类,称为分析类目。
主要分类号、附加分类号和分析类目号的定义
按照文献主要类目确定的号码,称为主要分类号。
按照文献的辅助类目和分析类目确定的号码,称为附加分类号和分析分类号。
附加分类号和分析分类号只用于编制工具。
使用本、确定使用本的定义
使用本,是指特定的文献标引结构直接作为分类依据的分类法文本。
根据分类标引的需要,对选定的通用性文献分类法进行适当调整,称为确定使用本。
确定使用本的范围
确定详略程度。
以专业机构为例,一般情况下,重点收藏的,直接使用详表;非重点收藏的,可略分。
局部扩充。
常用方法:直接将类目注释中列举的小主题扩充为类目,从其他分类法相应门类移植,扩大副表的使用范围,归类增补。
局部集中。
包括:确定交替类目,确定选择类目,按专题集中。
增加新类。
调整说明与注释。
基本分类规则包含的内容
信息资源的分类应根据信息资源的性质,按照其各自的特点进行。
信息资源的分类必须能体现分类法的逻辑性、等级性、次第性。
信息资源必须归入最切其内容的类。
类分的文献必须归入用途最大的类。
不能单凭题名、篇名的意义归类。
应注意标引的思想性。
一般分类规则
包括单主题信息资源的分类标引和多主题信息资源的分类标引
单主题信息资源是论述其一特色事物对象的资源。
根据论述的特点,可以分为简单单主题和方面单主题等类型。
单主题信息资源的分类标引
简单单主题信息资源,一般应按照主题对象的学科性质归类。
方面单主题信息资源,应根据其叙述的方面以及各个方面之间关系归类。
论述-主题两个或两个以上方面的信息资源,应根据不同方面之间的关系,确定其归属。
多主题信息资源的分类标引
并列主题的分类
论及两个并列关系主题的资源,如果同属于一个类列,具有共同的直接上位类,通常可直接归入上位类,否则,可按重点在前主题归类,同时为另一个主题作附加分类。
对同时涉及三个或三个以上并列主题的文献,一般根
据涉及的范围,将其归入共同的上位或概括性类目。
从属关系主题的分类
联结关系主题的分类
应用关系主体的信息资源,一般应按被应用到的主题分类。
但综合阐述一理论方法在各方面应用的文献,应按该理论方法所在的学科归类。
比较关系主题的信息资源,一般应按资源作者重点论述的内容归类。
影响及因果关系的信息资源,一般应按被影响或表示结果的主题对象归类。
分类索书号的概念、构成
分类索书号使标记实现个别化。
表示同类书先后次序的号码称为同类书区分号,亦称书次号。
同类书区分号应取号简易,号码简短,适合文献工作中实际使用的需要。
分类索书号,又称分类排架号,是表示一文献在分类收藏中位置的号码。
完整的分类索引号包括分类号、书次号、辅助区分号三种成分。
分类索书号的记录形式通常可分为三行或两行书写,例:
分类号分类号
书次号或书次号/辅助区分号
辅助区分号
第八章
主题法的定义、特征
主题法,一般是指直接以表达主题内容的语词作检索标识,以字顺为主要检索途径的标引和检索信息资源的方法。
特征:直接以语词作为检索标识。
以字顺作为主要检索途径。
以特定的事物、问题、现象,即主题为中心集中信息资源。
通过参照系统等方式揭示主题词之间关系的。
主题法的分法、按照不同的选词方式
按照主题法的选词方式,分为标题法、元词法、叙词法、关键词法。
按照其使用是否进行控制,可以分为受控主题法与非控主题法;
按照其使用时组配的先后,可以分为先组式主题法和后组式主题法。
标题法是一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。
字顺显示的组成。
标题词,亦称标题,是指经过词汇控制,用来标引信息资源的词或词组,通常为比较定型的事物名称。
叙词表,是以自然语言中精选出来的、经过严格处理的语词作为文献主题标识,通过概念组配方式表达文献主题的主题法类型。
叙词,亦称主题词,是经过规范处理的,以基本概念为基础的表达文献主题的词和词组。
关键词法,直接以自然语言中未经控制或只作少量的语词为文献主题标识,通过对关键词轮排等方式揭示
文献主题的主题法。
叙词表的显示方式、定义
叙词表的显示方式为字顺显示,系统显示,图形显示三种类型。
按照其功能,叙词表是一种将标引人员或用户使用的自然语言转化为规范化的系统语言的术语控制工具。
按照其结构,叙词表是一种概况特定知识领域并有词义相关、语义相关的术语组成的可以不断补充的规范化词典。
字顺显示的组成
字顺显示的组成是字顺表、专有叙词表、双语种索引按照传统词表组成,字顺表、附表、辅助索引
字顺表的定义、组成、基本的构成单位
字顺表是一种由众多叙词款目和非叙词款目按字顺排列的一览表。
叙词款目和非叙词款目是字顺表基本的构成单位,通常由款目词及其相关语义关系项构成的独立排检单位。
叙词款目或非叙词款目一般由款目词项、注释项、语义关系项组成。
款目词是叙词款目和非叙词款目的核心和排检依据。
相关成分根据词表的情况而定,如上例《汉表》款目项中,还包括汉语拼音和对应的外语译名。
语义关系项由各有关的参照项组成,依次设置代D、属S、分F、族Z、参C等各项参照。
非叙词只设用Y 项,用于指向相应的叙词。
字顺索引仅收入叙词、非叙词。
入口词表是一种将非叙词集中编制的表,收入词表编制或标引中出现的按等同关系处理的非叙词。
专有叙词表,称附表,是将众多专有叙词款目按字顺排列的一览表,是字顺表的重要组成部分。
专有叙词表的作用,缩小主表的篇幅,便于用户从范畴出发对专有叙词进行查检,及时进行管理。
专有叙词表包括人名、地名、机构、产品型号名等,数量大,范围广。
双语种索引,是一种将全部叙词、非叙词与相应外语译名相互对应,按外文译名字顺排列的索引系统,是通过外文译名使用词表的辅助工具。
《汉语主题词表》包括,主表、附表、范畴索引、词族索引、英汉对照索引、轮排索引。
《中国分类主题词表》包括,分类号-主题词对应表,主题词-分类号对应词表
《社会科学索引词表》包括,分类表,字顺表,英汉译文对照表。
系统显示的概念、作用、编制特点
系统显示,是一种通过改变编排方式,满足标引人员和用户各种不同角度使用叙词的辅助工具。
系统显示,包括,范畴索引、词组索引、轮排索引、分类主题一体化次词表。
词族索引通常以词族为基本款目单位,多数以族首词为款目的标目,按族首词字顺对词族进行排序。
词族的显示,以族首词为标目,按照词族中的等级展开。
叙词上部的词为上位词,冒号越多,词的外延越广。
款目词下的词为下位词,记号越多,范围越小。
轮排索引
轮排索引,亦称轮排表,是将词表中叙词按词素的字顺排列,使含有同一词素的叙词集中显示于一处的词汇表,是一种从词素的角度查找叙词的辅助工具。
收词范围,一种,只收词表中词表形式的叙词和非叙词,另一种,同时收入表中全部叙词和非叙词,包括单词、词组。
按照构成的词素,确定轮排条目数量。
显示方式,词外轮排,词内轮排,倒置轮排。
中文轮排检索分为顺序排序和逆序排列。
分类主题一体化词表,是一种分类语言和主题语言兼
容互换的系统。
图形显示的分类
图形显示分为三类,树形结构图,箭头关系图,方框图。
叙词表的组成模式
一部具体的词表没有必要包括所有部分,根据实用需要确定其构成形式。
一部功能完善的叙词表至少包括字顺显示部分、系统显示部分。
一个好的词表力求,功能完备,功能互补,结构简明,编制和管理方便,易于掌握、便于使用。
叙词词汇类型
叙词表选词以名词为主,必要时收入少量形容词。
Y D S F Z C
叙词可分为普通名词和专有名词两种。
词表关系控制(三种关系、六种符号)
叙词表中叙词之间主要有,等同关系,属分关系,相关关系。
等同关系,Y用于非叙词之下,用来指应对应的叙词。
D用于正式叙词之下,用来指向被替代的非叙词。
等级关系,F为分项指示符,表示该项叙词为款目词的下位词。
S为属项指示符,表示该项叙词为款目词
的上位词,Z为族首词符号,表示该项叙词为族首词。
相关关系通用符号C加以连接。
第十章
主题标引的概念
主题标引是依据一定的主题词表或主题标引规则,赋予信息资源语词标识的过程。
标引方式
标引方式分为整体标引,全面标引,对口标引,综合标引。
根据文献资源使用需要判断。
整体标引是,一种概况揭示信息资源基本主题内容的标引,亦称浅标引。
应用于书籍、论文、标准、档案或其他资源类型,常用于手工检索系统。
全面标引,是一种充分揭示信息资源论及的所有符合检索系统要求的主题概念的标引,亦称深标引。
适用于处理专业领域的论文、技术报告等文献类型。
不宜以图书为处理对象,较少使用分类标引。
对口标引,是一种只揭示资源中适合本专业需要的主题内容的标引,亦称重点标引,适用于专业文献单位。
综合标引是一种以集合型信息资源的整体为单位进行的概括性标引。
应用于传统的文献类型,如丛书、多卷书、论文集、会议录、标准汇编、档案的案卷等,或复合型的网站或数据库。
分析标引是一种根据资源中部分片段或集合型的构成单位进行的标引。
《中图法》~~文献分类法、等级列举式、层累标记制、相关索引。