《信息组织》课件(第二章)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
号。 2、联系符号:用于揭示同一文献主题之间联系强度的专
用符号。
.
2.2信息组织中的控制与规范
联号使用时,对某些几个主题共同使用的主题词,可使 用重复标号法。即同时标上几个联号,如果主题词为 各主题通用,还可以使用通用联号“0”
联号的特点: 联号的适用范围:
.
2.2信息组织中的控制与规范
3、职能符号
也是用户查找的对象,应当以他们为首要范畴; B、任何两个范畴中,如通过分析发现A范畴是活动对象
或是B范畴到达到的目的,那么,我们就认为A范畴在 组织文献方面最重要,从而将其置于组配次序的前头。
.
2.2信息组织中的控制与规范
范畴设置: 物质—部分—成分—性质—测度 物质—行为、操作或过程—施动者或工具 物质(产品)—种类—部分—成分—性质—过程—操作—
.
2.2信息组织中的控制与规范
(一)、引用次序 1、定义:组配次序,指复合主题标引和检索时各个
主题因素的组合次序。 (1)分类法:指类目划分标准使用的次序或不同分
面的概念在组配时被引用的先后次序; (2)主题法:字顺标题检索系统中主标题与各级子
标题使用的次序。
.
2.2信息组织中的控制与规范
2、引用次序的作用 (1)有助于标引的一致性 (2)可以避免出现错误的组配关系 (3)有助于提高主题标引的适用性
.
2.2信息组织中的控制与规范
3、引用次序的类型 1、显著性引用次序 是根据主题概念对用户心理印象的显著程度确定的次序。
(1)美国图书馆学家克特 1876 《字典式目录》。
采用自然语言中的通用术语作为标题唯一来源,同时规定 当自然语言次序中第一个语词不重要时,应当将更显著 的语词放在最前面
.
2.2信息组织中的控制与规范
2、检准率
系统实施检索时的实际检出的与某一检索提 问相关的信息资源总数与检出的信息资源 总数之比。
检出相关信息资源量 检出信息资源总数
*100%
.
2.1 对信息组织的要求
影响检全、检准率的因素 (1)系统资源的数量 (2)不同的用户对象 (3)不同的使用阶段 (4)与检索提问有关
.
2.1 对信息组织的要求
进行选择、规范并揭示其相关性的过程。 自然语言:是指人们在科学交流中采用的书面语言或口
头语言,是一种意义模糊、不易约束的人类交流思想 的符号系统。
.
2.2信息组织中的控制与规范
(一)、词汇控制的原因 1、词汇的同义现象; 2、词汇的多义现象; 3、词汇的模糊性和不确定性; 4、词汇量巨大,给词汇的存储加工和检索带来困难; 5、词间关系不明确,无法清楚显示概念之间的关系。
.
2.2信息组织中的控制与规范
一、描述记录
1、定义:记载一信息资源与检索有关的基本特征, 是信息资源检索系统进行组织和检索的基本依据。
2、描述记录的控制 (1)描述项目的控制 (2)描述文字的控制 (3)描述级别的控制 (4)描述格式的控制
.
2.2信息组织中的控制与规范
二、词汇控制 根据信息资源标引和检索的需要,对自然语言中的词汇
.
2.3规范控制的依据
三、信息资源组织的特点 1、文献保证原则 2、用户保证原则 3、与设备条件相适应 4、应尽量取得费用和效果的平衡
.
施动者或工具
.
2.2信息组织中的控制与规范
3、中文引用次序 刘湘生 1981 《关于主题分面公式》 “全部主题词归纳为5个基本方面,每个方面即为一种类
型的主题因素” A主体因素、B通用因素、C位置因素、D时间因素、E文献
类型因素
.
2.2信息组织中的控制与规范
组配次序
1
代码符号
A1
2
3
4
5
A2
A3
(2)、英国图书馆学家凯塞 1911 《系统标引》 提出“实体—过程”引用公式 (3)、英国图书馆学家科茨 提出“事物—活动”
“事物—材料—活动” “事物—部件—材料—活动—施动者“
.
2.2信息组织中的控制与规范
2、范畴职能引用次序 是指将各种主题概念划分为范畴,并按范畴的性质、职
能确定组配次序。 (1)印度图书馆学家阮冈纳赞 范畴分面公式PMEST
(5)矛盾关系:外延之和等于上位概念的两个不相容概 念之间的关系;
(6)反对关系:外延之和小于属概念的两个相互对立概 念之间的关系。
.
2.3规范控制的依据
3、概念的限制与概括、分析与综合 (1)限制:增加内涵,缩小外延; (2)概括:减少内涵,扩大外延 二、知识分类 恩格斯分类体系的原则:客观发展原则;唯物辨证原则
层:同一范畴中,如主题特征不止一个,则可分析出第二层本体、第二层物 质、第三层本体、第三层物质,用P2、P3、M2、M3表示;
轮:如动力后再出现新的本体、物质、动力、则称为第二轮本体、第二轮物 质、第二轮动力,用2P、2M、2E表示。
.
2.2信息组织中的控制与规范
(2)英国分类法研究小组维克利 标准引用次序 理论原则: A、任何技术部门中,最终产品都是该主题领域的目的,
.
2.2信息组织中的控制与规范
(三)、句式转换 1、轮排转换:依次将检索语句中每一个有检索意义的语
词轮流在排检位置上出现,并对句子中其他语词在保 持原有相对位置的情况下随着移动; 2、链式转换:通过逐次拆卸链环的方式,依次将检索语 句中每一个有检索价值的语词作为检索语句的入口; 3、分析转换:每次抽取少量主题词组成组配标题,使所 有检索价值的词都可以成为检索入口
的控制
.
2.2信息组织中的控制与规范
2、受控语言与自然语言的比较 (1)自然语言系统 (2)受控语言系统
.
2.2信息组织中的控制与规范
三、句法控制
根据信息资源标引和检索的需要,通过一定的组词造 句规则,对检索语词的组合方式作出规定。
检索语句:主题词通过组配方式表达文献主题时形成 的语词组合。
句法关系:检索语句中主题词之间形成的关系。
第二章 信息组织原理
第一节 对信息组织的要求 第二节 信息组织中的控制与规范 第三节 规范控制的依据
.
2.1 对信息组织的要求
1、检全率 系统实施检索时检出的与某一检索提问相关的
信息资源数与检索系统与该提问相关的实有 信息资源总数之比。
检出相关信息资源量
*100%
系统相关信息.
2.2信息组织中的控制与规范
(二)、词汇控制的原则 1、稳定性; 2、正确性; 3、单义性; 4、系统性; 5、简明性; 6、成族性; 7、兼容性。
.
2.2信息组织中的控制与规范
(三)、词汇控制的范围 1、词量控制
(1)组配标引法 (2)收核心词和组配功能强的词 (3)采用上位词置代 2、词类控制 3、同义控制;
A4
A5
主体因素 的再区分
对象(学科、 事物、问题)
方面(材料、成分、 性质、过程、状态、
特征、作用)
结果 方法 (后改为过程) 条件
A(A1—A2—A3—A4—A5)—B—C—D—E
.
2.2信息组织中的控制与规范
(二)、辅助符号 组配符号,是检索语言揭示主题概念之间关系意义,进
行检索操作的标识形式。 1、关系符号:用于揭示语词组配中形成的关系类型的符
围。
.
2.3规范控制的依据
2、概念之间的关系 是否存在共有的外延,相容关系、不相容关系。 (1)同一关系:具有相同外延的概念之间的关系; (2)包含关系:一个概念在另一个概念外延之中,并且
是另一个概念的组成部分; (3)交叉关系:部分外延重合的概念之间的关系;
.
2.3规范控制的依据
(4)并列关系:一个属概念下几个不存在共有外延的并 列属概念之间的关系;
(2)范畴控制:是将众多的具有学科或专业相关性的语 词按其所属的学科或范畴划分为一个概念分类系统。
(3)分面分类控制:将语词编列为一个分面分类系统。 6、专指度控制 (1)定义:主题词与文献主题概念的切合程度
.
2.2信息组织中的控制与规范
(四)、词汇控制的利弊 1、4种词汇控制方式 (1)在标引与检索阶段均对词汇进行控制 (2)在标引阶段对词汇进行控制,但在检索阶段不予控制 (3)在标引与检索阶段均不实施控制 (4)在标引阶段不实施任何控制,在检索阶段实施不严格
.
2.3规范控制的依据
信息资源的组织和检索一般是以概念逻 辑为工具,以知识分类为基础,根据信 息资源的特点和设备条件的状况进行的。
.
2.3规范控制的依据
一、逻辑知识 1、概念极其内涵外延 (1)概念:是表达事物对象的特有属性或本质属性的思
维形式,是检索系统交流的内容; (2)内涵:概念所反映的对象的本质属性的总和; (3)外延:具有该属性的事物对象,即概念所包括的范
是一种用以表示主题标识在组配中的句法职能的 辅助符号。
符号 A B C D E
职能 动作对象 部分 性质 操作 施动者
.
2.2信息组织中的控制与规范
4、加权 (1)加权:按照主题词在一文献或检索程序中的重要性,
采用赋予一定权值的方式来确定其标引或检索价值的 方法。 (2)加权标引:是根据各个主题因素在文献中的重要程 度,在标主题词的同时赋予相应权值。 (3)加权检索:在加权标引的基础上,结合主题词的权 值进行查找。
3、检索速度与系统的及时性 (1)检索速度:用户实施检索时获得检索结果花费
的时间。 (2)及时性:检索工具能否在较短时间内将信息资
源纳入系统,以较快速度提供使用
.
2.1 对信息组织的要求
4、系统的易用性 (1)对信息资源的处理和标引人员 (2)对广大检索用户
.
2.1 对信息组织的要求
5、检索的成本效益 (1)检索的成本 (2)检索的效益
.
2.2信息组织中的控制与规范
4、词义控制 (1)在主题词后加限义词,以区分同形异义词; (2)加含义及范围注释; (3)附加简明扼要的定义
5、词间关系控制 (1)词族控制:利用概念成族的原理将众多的具有等级
从属关系的语词汇集为一个由泛指概念到专指概念组 成的等级系统。
.
2.2信息组织中的控制与规范
用符号。
.
2.2信息组织中的控制与规范
联号使用时,对某些几个主题共同使用的主题词,可使 用重复标号法。即同时标上几个联号,如果主题词为 各主题通用,还可以使用通用联号“0”
联号的特点: 联号的适用范围:
.
2.2信息组织中的控制与规范
3、职能符号
也是用户查找的对象,应当以他们为首要范畴; B、任何两个范畴中,如通过分析发现A范畴是活动对象
或是B范畴到达到的目的,那么,我们就认为A范畴在 组织文献方面最重要,从而将其置于组配次序的前头。
.
2.2信息组织中的控制与规范
范畴设置: 物质—部分—成分—性质—测度 物质—行为、操作或过程—施动者或工具 物质(产品)—种类—部分—成分—性质—过程—操作—
.
2.2信息组织中的控制与规范
(一)、引用次序 1、定义:组配次序,指复合主题标引和检索时各个
主题因素的组合次序。 (1)分类法:指类目划分标准使用的次序或不同分
面的概念在组配时被引用的先后次序; (2)主题法:字顺标题检索系统中主标题与各级子
标题使用的次序。
.
2.2信息组织中的控制与规范
2、引用次序的作用 (1)有助于标引的一致性 (2)可以避免出现错误的组配关系 (3)有助于提高主题标引的适用性
.
2.2信息组织中的控制与规范
3、引用次序的类型 1、显著性引用次序 是根据主题概念对用户心理印象的显著程度确定的次序。
(1)美国图书馆学家克特 1876 《字典式目录》。
采用自然语言中的通用术语作为标题唯一来源,同时规定 当自然语言次序中第一个语词不重要时,应当将更显著 的语词放在最前面
.
2.2信息组织中的控制与规范
2、检准率
系统实施检索时的实际检出的与某一检索提 问相关的信息资源总数与检出的信息资源 总数之比。
检出相关信息资源量 检出信息资源总数
*100%
.
2.1 对信息组织的要求
影响检全、检准率的因素 (1)系统资源的数量 (2)不同的用户对象 (3)不同的使用阶段 (4)与检索提问有关
.
2.1 对信息组织的要求
进行选择、规范并揭示其相关性的过程。 自然语言:是指人们在科学交流中采用的书面语言或口
头语言,是一种意义模糊、不易约束的人类交流思想 的符号系统。
.
2.2信息组织中的控制与规范
(一)、词汇控制的原因 1、词汇的同义现象; 2、词汇的多义现象; 3、词汇的模糊性和不确定性; 4、词汇量巨大,给词汇的存储加工和检索带来困难; 5、词间关系不明确,无法清楚显示概念之间的关系。
.
2.2信息组织中的控制与规范
一、描述记录
1、定义:记载一信息资源与检索有关的基本特征, 是信息资源检索系统进行组织和检索的基本依据。
2、描述记录的控制 (1)描述项目的控制 (2)描述文字的控制 (3)描述级别的控制 (4)描述格式的控制
.
2.2信息组织中的控制与规范
二、词汇控制 根据信息资源标引和检索的需要,对自然语言中的词汇
.
2.3规范控制的依据
三、信息资源组织的特点 1、文献保证原则 2、用户保证原则 3、与设备条件相适应 4、应尽量取得费用和效果的平衡
.
施动者或工具
.
2.2信息组织中的控制与规范
3、中文引用次序 刘湘生 1981 《关于主题分面公式》 “全部主题词归纳为5个基本方面,每个方面即为一种类
型的主题因素” A主体因素、B通用因素、C位置因素、D时间因素、E文献
类型因素
.
2.2信息组织中的控制与规范
组配次序
1
代码符号
A1
2
3
4
5
A2
A3
(2)、英国图书馆学家凯塞 1911 《系统标引》 提出“实体—过程”引用公式 (3)、英国图书馆学家科茨 提出“事物—活动”
“事物—材料—活动” “事物—部件—材料—活动—施动者“
.
2.2信息组织中的控制与规范
2、范畴职能引用次序 是指将各种主题概念划分为范畴,并按范畴的性质、职
能确定组配次序。 (1)印度图书馆学家阮冈纳赞 范畴分面公式PMEST
(5)矛盾关系:外延之和等于上位概念的两个不相容概 念之间的关系;
(6)反对关系:外延之和小于属概念的两个相互对立概 念之间的关系。
.
2.3规范控制的依据
3、概念的限制与概括、分析与综合 (1)限制:增加内涵,缩小外延; (2)概括:减少内涵,扩大外延 二、知识分类 恩格斯分类体系的原则:客观发展原则;唯物辨证原则
层:同一范畴中,如主题特征不止一个,则可分析出第二层本体、第二层物 质、第三层本体、第三层物质,用P2、P3、M2、M3表示;
轮:如动力后再出现新的本体、物质、动力、则称为第二轮本体、第二轮物 质、第二轮动力,用2P、2M、2E表示。
.
2.2信息组织中的控制与规范
(2)英国分类法研究小组维克利 标准引用次序 理论原则: A、任何技术部门中,最终产品都是该主题领域的目的,
.
2.2信息组织中的控制与规范
(三)、句式转换 1、轮排转换:依次将检索语句中每一个有检索意义的语
词轮流在排检位置上出现,并对句子中其他语词在保 持原有相对位置的情况下随着移动; 2、链式转换:通过逐次拆卸链环的方式,依次将检索语 句中每一个有检索价值的语词作为检索语句的入口; 3、分析转换:每次抽取少量主题词组成组配标题,使所 有检索价值的词都可以成为检索入口
的控制
.
2.2信息组织中的控制与规范
2、受控语言与自然语言的比较 (1)自然语言系统 (2)受控语言系统
.
2.2信息组织中的控制与规范
三、句法控制
根据信息资源标引和检索的需要,通过一定的组词造 句规则,对检索语词的组合方式作出规定。
检索语句:主题词通过组配方式表达文献主题时形成 的语词组合。
句法关系:检索语句中主题词之间形成的关系。
第二章 信息组织原理
第一节 对信息组织的要求 第二节 信息组织中的控制与规范 第三节 规范控制的依据
.
2.1 对信息组织的要求
1、检全率 系统实施检索时检出的与某一检索提问相关的
信息资源数与检索系统与该提问相关的实有 信息资源总数之比。
检出相关信息资源量
*100%
系统相关信息.
2.2信息组织中的控制与规范
(二)、词汇控制的原则 1、稳定性; 2、正确性; 3、单义性; 4、系统性; 5、简明性; 6、成族性; 7、兼容性。
.
2.2信息组织中的控制与规范
(三)、词汇控制的范围 1、词量控制
(1)组配标引法 (2)收核心词和组配功能强的词 (3)采用上位词置代 2、词类控制 3、同义控制;
A4
A5
主体因素 的再区分
对象(学科、 事物、问题)
方面(材料、成分、 性质、过程、状态、
特征、作用)
结果 方法 (后改为过程) 条件
A(A1—A2—A3—A4—A5)—B—C—D—E
.
2.2信息组织中的控制与规范
(二)、辅助符号 组配符号,是检索语言揭示主题概念之间关系意义,进
行检索操作的标识形式。 1、关系符号:用于揭示语词组配中形成的关系类型的符
围。
.
2.3规范控制的依据
2、概念之间的关系 是否存在共有的外延,相容关系、不相容关系。 (1)同一关系:具有相同外延的概念之间的关系; (2)包含关系:一个概念在另一个概念外延之中,并且
是另一个概念的组成部分; (3)交叉关系:部分外延重合的概念之间的关系;
.
2.3规范控制的依据
(4)并列关系:一个属概念下几个不存在共有外延的并 列属概念之间的关系;
(2)范畴控制:是将众多的具有学科或专业相关性的语 词按其所属的学科或范畴划分为一个概念分类系统。
(3)分面分类控制:将语词编列为一个分面分类系统。 6、专指度控制 (1)定义:主题词与文献主题概念的切合程度
.
2.2信息组织中的控制与规范
(四)、词汇控制的利弊 1、4种词汇控制方式 (1)在标引与检索阶段均对词汇进行控制 (2)在标引阶段对词汇进行控制,但在检索阶段不予控制 (3)在标引与检索阶段均不实施控制 (4)在标引阶段不实施任何控制,在检索阶段实施不严格
.
2.3规范控制的依据
信息资源的组织和检索一般是以概念逻 辑为工具,以知识分类为基础,根据信 息资源的特点和设备条件的状况进行的。
.
2.3规范控制的依据
一、逻辑知识 1、概念极其内涵外延 (1)概念:是表达事物对象的特有属性或本质属性的思
维形式,是检索系统交流的内容; (2)内涵:概念所反映的对象的本质属性的总和; (3)外延:具有该属性的事物对象,即概念所包括的范
是一种用以表示主题标识在组配中的句法职能的 辅助符号。
符号 A B C D E
职能 动作对象 部分 性质 操作 施动者
.
2.2信息组织中的控制与规范
4、加权 (1)加权:按照主题词在一文献或检索程序中的重要性,
采用赋予一定权值的方式来确定其标引或检索价值的 方法。 (2)加权标引:是根据各个主题因素在文献中的重要程 度,在标主题词的同时赋予相应权值。 (3)加权检索:在加权标引的基础上,结合主题词的权 值进行查找。
3、检索速度与系统的及时性 (1)检索速度:用户实施检索时获得检索结果花费
的时间。 (2)及时性:检索工具能否在较短时间内将信息资
源纳入系统,以较快速度提供使用
.
2.1 对信息组织的要求
4、系统的易用性 (1)对信息资源的处理和标引人员 (2)对广大检索用户
.
2.1 对信息组织的要求
5、检索的成本效益 (1)检索的成本 (2)检索的效益
.
2.2信息组织中的控制与规范
4、词义控制 (1)在主题词后加限义词,以区分同形异义词; (2)加含义及范围注释; (3)附加简明扼要的定义
5、词间关系控制 (1)词族控制:利用概念成族的原理将众多的具有等级
从属关系的语词汇集为一个由泛指概念到专指概念组 成的等级系统。
.
2.2信息组织中的控制与规范