第02章 信息的分类与编码

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

15:38:31
18
2.3.1 信息编码的概念
信息编码的概念
信息编码是将事物或概念(编码对象)赋予具有一定规律、易 于计算机和人识别处理的符号,形成代码元素集合。代码元 素集合中的代码元素就是赋予编码对象的符号,即编码对象 的代码值。 信息编码包含数据表达成代码的方法 数据的代码表示形式 数据表达成代码的方法、数据的代码表示形式 数据表达成代码的方法 数据的代码表示形式、 代码元素集合的赋值。 代码元素集合的赋值 信息编码形式有多种,例如:
(注意:“信息元素”可以视为数据库中的“字段”)
15:38:31
4
2.1.2 信息元素的命名原则(1/2)
1、命名原则
信息元素命名的原则就是用一简明的词组来描述一个信息元 素的意义和用途。
2、词组的一般结构 修饰词一基本词一类别词
类别词和基本词都只有—个,修饰词可以有一个或多个;
类别词是信息元素命名中的—个最重要的名词,用来识别和描述 类别词 信息元素的一般用途或功能 用途或功能,一般不具有行业持征,条目较少。 如数量(AMOUNT)、名称(NAME)、编号(NUMBER)、代码 (CODE)等。 基本词是类别词的最重要的修饰词,它对一大类信息对象进一步 基本词 分类(反映一小类信息对象),一般具有行业 行业特征,条目较多。 如会计(ACCOUNTING)、预算(BUDGET)、顾客(CUSTOMER)等。
特点:
优点:结构简单,使用方便,特别是排序很容易,易于向国内外 优点: 推广, 缺点:但对于分类对象属性与特征描述不直观。 缺点:
案例:
我国国家标准《人的性别代码》 《国民经济行业企业和代码》 《中华人民共和国行政区划代码》。
15:38:31
23
2.3.3.1 按符号形式分类(2/3)
2、字母型代码
15:38:31 3
2.1.1 信息元素的概念
信息元素(又称数据元素或数据项)是最小的不可再 分的信息单位,是一类信息的总称。 例如:
船舶资料中的船名“天河轮”、“冀海轮”等,可以抽象出 “船舶名称”这个数据元素; 每一条船都有一个编号,可以概括出“船舶编号”这个数据 元素。 通常职工档案中的“简历”、“受奖情况”等,不是信息元 素。因为“简历”至少包括时间、地点等信息,是可以继续 分解的信息;“受奖情况”也是可以继续分解的信息。
15:38:31
10
2.2.2信息分类的基本原则(2/3)
3、可扩展性
随着科学技术的进步和社会经济的发展,人们可利用的信息 量急剧增长,信息的类别和分类体系结构也应适应这种变化 的需要,这就要求:
分类体系结构在原有的基础上有扩展的余地,其中包括新的类别 的增补和在原有类别的基础上进行分解、细化。
4、兼容性
① 信息的标识唯一,便于分类鉴别,防止同名异义、异名同义 现象发生。 ② 信息的标识统一,便于信息交换与利用,实现更大范围的资 源共享。 ③ 信息的标识有序,便于信息的加工、排序、查询、检索。 ④ 信息的标识明确,可以表达特定含义。 ⑤ 信息的标识简洁,可以提高信息处理的效率。 ⑥ 信息标识的形式与信息内容的对应关系可以人为设定,有利 于信息的安全保密。
某高校教师分类编码
15:38:31
16
2.2.3.2 面分类法(2/2)
3、面分类法的优缺点
优点:
具有较大的弹性。 具有较大的弹性。一个面内的属性内容与数量的调整不会影响其 他的面。 适应性强。可根据需要组成任何类目,也便于机器处理。 适应性强 易于增、删、改。 易于增、删、改
缺点:
不能充分利用信息。在面分类法形成的分类体系中,可组成的类 不能充分利用信息 目很多,但有时实际应用的类别不多。 用手工来组成信息类目比较困难。 用手工来组成信息类目比较困难
15:38:31
9
2.2.2信息分类的基本原则(1/3)
1、科学性
使类别的划分符合信息的内涵、性质及使用与管理要求; 选择信息的本质属性和特征作为分类的依据,使分类体系结 构具有稳定性,以供人们方便地使用。
2、系统性
分类结构中各类信息按照他们之间的相互联系排成一定的顺 序,形成一个系统,既便于人们区分信息、识别信息,又便 于人们从整体上去把握信息之间的关系。
信息的分类是一个庞大而复杂的系统,这个大系统中存在着 若干层分系统与子系统,一些子系统之间存在着相互联系和 信息共享问题:
如生产类信息和人事类信息中都包含工人这一类信息。生产类信 息在对工人这一信息的定义和再分类时就要和人事类信息兼容
15:38:31
11
2.2.2 信息分类的基本原则(3/3)
5、实用性
14
2.2.3.1 线分类法(3/3)
3、线分类法的优缺点
优点:
容量大。可容纳较多类目的信息。 容量大。 结构清晰。采用树形结构能较好反映类目之间的逻辑关系。 结构清晰 使用方便。既符合手工处理信息的思维习惯,又便于计算机处理。 使用方便
缺点:
结构弹性较差。分类结构一经确定,不易改动。 结构弹性较差 效率较低。当分类层次较多时,编码的位数较长,影响数据处理 效率较低 速度。
15:38:31 12
2.2.3.1 线分类法(1/3)
1、线分类法的基本思想
线分类法(又称等级分类法 层级分类法)是将初始的分类 线分类法 等级分类法或层级分类法 对象(即被划分的事物或概念)按所选定的若干个属性/特征作 为分类的划分基础,逐次地分解成若干个层级类目,并编排 成一个逐级展开、有层次的分类体系。
15:38:31
15
2.2.3.2 面分类法(1/2)
1、面分类法的基本思想
面分类法是将所选定的分类对象的若干属性或特征视为若干 面分类法 个“面”,每个“面”中又可分成彼ຫໍສະໝຸດ Baidu独立的若干个类目。 。 使用时: 使用时:可根据需要将这些“面”中的类目组合在一起,形 成一个复合类目。
2、面分类法的典型案例
15:38:31 5
2.1.2 信息元素的命名原则(2/2)
3、信息元素命名案例
社会保险编码
社会(修饰词)、保险 社会 保险(基本词)、编号 编号(类别词)
学校学生学号 学校贵重设备名称
学校(修饰词)、贵重 学校 贵重(修饰词)、设备 设备(基本词)、名称 名称(类 别词)
15:38:31
6
2.1.3 信息元素的标识
21
2.3.3 代码的分类
信 息 编 码 方 法
符号编码法
数字型代码 字母型代码 混合型代码 无含义代码 顺序码 无序码 系列顺序码 数字化字母顺序码 层次码 特征组合码 矩阵码 复合码
符号含义 编码法 有含义代码
15:38:31
22
2.3.3.1 按符号形式分类(1/3)
1、数字型代码
定义:
数字型代码或称数字码 数字型代码 数字码是用一个或多个阿拉伯数字表示分类对象 的代码。
15:38:31
17
2.2.3.3 混合分类法
1、混合分类法的基本思想
混合分类法是将线分类法和面分类法组合使用,以其中一种 分类法为主,另一种做补充的信息分类方法。
2、案例:
上述教师的面分类体系中的从事专业,又可以分为学科门类(如 管理学、工学等),学科门类下设若干一级学科,每个一级学科 一般设有若干二级学科。 这样,从事专业这一面可按线分类法分成学科门类 按线分类法分成学科门类、一级学科、 二级学科三个层次,如下表所示。其中,一级学科用三位数字表 示,二级学科用两位数字表示;一、二级学科之间用点隔开。
15:38:31
20
2.3.2 信息代码的功能和信息编码的基 本原则(2/2)
信息编码的基本原则如下:
① ② ③ ④ ⑤ ⑥ 唯一性。 唯一性。 合理性。 合理性。 可扩展性。 可扩展性。 简洁性。 简洁性。 可识别性。 可识别性。 规范性。 规范性。
稳定性。 ⑦ 稳定性。
注意:
15:38:31
企业代码由技术监督局、工商管理局负责给定; 企业代码由技术监督局、工商管理局负责给定; 人口代码(身份证) 人口代码(身份证)由公安局给定
同层级类目之间存在着并列关系,称为同位类。 一个层级类目经分解形成的下层类目,称为下位类;相应的被分 解的类目称为上位类;上位类与下位类的关系是隶属关系。 同层级类目互不重复,不同层级的类目互不交叉。每个下位层的 类目只对应于一个上位层。
15:38:31
13
2.2.3.1 线分类法(2/3)
2、线分类法的典型案例
国际莫尔斯电报码用小点与短横表示。 国际通用的电阻元件参数值是用一组由不同颜色组成的圆环表示 的,称为电阻色环码。
15:38:31
19
2.3.2 信息代码的功能和信息编码的基 本原则(1/2)
对信息进行编码,就是使信息的标识规范化的过程, 代码就是信息规范化的标识符。
代码的功能如下: 代码的功能如下:
国家标准有《中华人民共和国行政区划代码》(GB/ 2260— 国家标准有《中华人民共和国行政区划代码》(GB/T 2260— 1999)(以下为河北省部分案例) 1999)(以下为河北省部分案例)
其他案例: 其他案例:
15:38:31
《国民经济行业分类与代码》(GB/T 4754—1994)和《职业分 类与代码》(GB/T 6565—1999)
2.2.1 信息分类的概念(了解) (了解) 2.2.2 信息分类的基本原则(了解) (了解) 2.2.3 信息分类的基本方法(重点) (重点)
2.2.3.1 线分类法 2.2.3.2 面分类法 2.2.3.3 混合分类法
15:38:31 2
内容提要(2/2)
2.3 信息编码方法
2.3.1 信息编码的概念 2.3.2 信息编码的功能和信息编码的基本原则(了解) (了解) 2.3.3 代码的分类(重点) (重点)
《信息资源组织与管理》之第2讲 信息资源组织与管理》之第2
信息的分类与编码
15:38:31
1
内容提要(1/2)
2.1 信息元素的涵义(了解:信息分类与编码的最小单位)
2.1.1 信息元素的概念 2.1.2 信息元素的命名原则 2.1.3 信息元素的标识 2.1.4 信息元素的一致性
2.2 信息分类的方法
1、信息元素标识的含义
又称信息元编码是计算机和管理人员共同使用的标识。
2、信息元素标识的方法
用限定长度的大写字母字符串表达,字母字符可按信息元素 名称的汉语拼音抽取首音字字母,也可按英文词首字母或缩 写规则得出。
3、案例:
15:38:31
7
2.1.4 信息元素的一致性
信息元素命名和信息元素标识要在组织(政府部门或 企事业单位)中保持一致。 不允许有“同名异义”的信息元素。 也不允许有“同义异名”的信息元素。
这里的”名”是指信息元素的标识; “义”是指信息元素的命名或定义。
15:38:31
8
2.2.1 信息分类的概念(1/2)
1、含义
信息分类是根据信息内容的属性或特征,将信息按一定的原 则和方法进行区分和归类,并建立起一定的分类体系和排列 顺序。
2、信息分类的两个要素
分类对象,分类对象由若干个被分类的实体组成; 分类依据,分类依据取决于分类对象的属性或特征。
2.3.3.1 按符号形式分类 2.3.3.2 按符号的含义分类
2.3.4 编码的校验
2.3.4.1 错误种类(了解) (了解) 2.3.4.2 校验方法(重点) (重点) 2.3.4.3 信息编码错误的校验步骤(重点) (重点) 2.3.4.4 校验案例 (重点) (重点)
2.4 作业 (…….)
定义:字母型代码 字母型代码或称字母码 字母码是用一个或多个字母表示分类对象的
代码。
优点及案例:
(1)字母型代码与数字型代码相比,同样位数的代码比数字型 的容量大得多。
案例:用一位英文字母型代码最多可以表示26个(A-Z)类目,而一位数 用一位英文字母型代码最多可以表示26 (A-Z)类目 26个 类目,
由于信息的属性与特征的多样性,在实际生活中选择何种属 性与特征进行分类还要考虑到人们实际应用的需要。 例如:某企业在开发新产品时,管理部门、设计部门与制造 部门从各自的应用目的出发,对信息的分类会提出不同的要 求。
管理部门从企业的经营管理目标出发,希望信息的分类要便于生 产的计划与控制,并能反映成本和市场需求方面的情况; 设计部门则从设计需要出发,希望信息的分类体系体现新产品开 发组合化(模块化)、标准化、序列化的趋势; 制造工艺部门则从实现产品的小批量、多品种成组生产,以提高 生产效率和质量的目的出发,希望信息的分类体系能反映产品的 量、部件的几何特征与工艺特性。 因此,在制订企业信息分类体系时,要从企业的总体目标出发, 充分考虑到各部门的合理要求,进行企业信息分类体系的整体优 化。
相关文档
最新文档