第二章 医学数据分类、编码系统和医学信息标准

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

无含义代码
顺序码编码方法
从一个有序的字符集合中顺序的取出字符分配给各个编码对象, 这些字符通常是整数或字母。 递增顺序码编码方法 编码对象被赋予的代码值,可由预定数字递增决定。 系列顺序码编码方法 确定编码对象的类别,按各个类别确定代码取值范围。 约定顺序码编码方法 全部编码对象预先知道并不会扩展,按某些特性对编码对象 进行排序。
第二章 医学数据分类、编码系统和 医学信息标准
南京中医药大学
1.信息标准化的定义与特点
信息标准化的定义 信息标准化的特点 元数据与数据元
1.1.1 标准化
信息共享的前提是标准化 信息的标准化问题具有普遍性 广义的定义:
是指针对现存或潜在的问题,为公共的和常用的事 物做出某些规定的活动,旨在使该环境达到最佳有 序度。
6 表示层 5 会话层 4 传输层 3 网络层 2 数据链路层 1 物理层
数据编码
数据编码的概念: 将编码对象赋予具有一定规律、易于计算机和 人识别和处理的符号,并形成对应的代码表的过程。 数据编码的要素:
编码对象 数据表达成代码的方法——取决于数据属性、编码 对象的规模、目的和用途 数据的代码表示形式 代码表
数据分类的基本原则
科学性——选择分类对象的最稳定的本质特征作为 分类的基础和依据 系统性——将选定的对象按其内在规律系统化进行 排列,形成一个层次清晰、结构合理、类目明确的 分类体系。
GB/T 19253 规定的字符长度表示法
固定长度 可变长度 有若干字符行表示的长度
美国HL7采用的数据类型(见附录一)
4 一些重要的国际医学信息标准
ICD-10 SNOMED HL7 DRG ICD-0 LOING DICOM HIPPA UMLS IHE
ICD-10——国际疾病分类
(International Classification of Disease, ICD )是根据 疾病的某些特征,按照规则将疾病分门别类,并用编 码的方法来表示的系统。 ICD已有110年发展历史:
层次码编码方法
以编码对象集合中的层次分类为基础,将编码对象编码成连续 且递增的组类。 易于编码对象的分类,易于统计汇总,代码易于解释;缺乏弹 性。 举例:ICD,GB/T 13745-1992(学科分类与代码)
代码类型
矩阵码编码方法
以复式记录表的实体为基础,赋予表中行和列相关坐标上编码 对象一定的代码值; 代码值可以解释,容易赋予;需预先建立表,覆盖对象的全部 特征,不易变通。 举例:GB 2312-1980(信息交换用汉字编码字符集 基本集)
2. 数据分类与编码的基本原则和方法
数据分类与编码的定义 数据分类的基本原则 数据分类的基本方法 代码类型的划分
数据分类
数据分类的概念:
根据数据的属性或特征,将分类对象按一定的原 则和方法进行区分和归类,并建立一定的分类体系 和排序顺序的过程。
数据分类的要素:
分类对象——数据 分类依据——取决于数据特性
数据元
数据元(data element)
用一组属性描述定义、标识、表示以及允许值的数 据单元,不可再分的最小数据单元。 组成:
对象类——人们希望研究、搜集和存储他们的相关数据的事 物。 特性——对象类中所有成员共同具有的一个有别于其他数据 元的显著特征。 表示——数据表达的方式。
数据元和数据元概念
HL7组织参考ISO,采用开放式系统互联(Open system interconnection, OSI)的通信模式,将HL7 纳入通信最高层,即第七层应用层。
OSI
OSI模型有7层结构,每层都可以有几个子层。 OSI的7层从上到下分别是 :
7 应用层
HTTP FTP POP3 SMTP Telnet BitTorrent HL7
人类与兽医学系统术语——SNOMED
(Systemized nomenclature of human and veterinary medicine, SNOMED)用于人、兽医学的结构化术语 集和术语的分类。 颁布于1975年。目前是第三版,《人类与兽类医学 系统术语》,也称《国际医学规范术语全集》。 参考术语(reference terminology):即可以满足 用户结构化、智能化录入临床数据的需要,又能够 用于优化自然语言处理,还能帮助完成医学信息的 存储、提取与分析,把这种更高层次的满足广泛医 学信息处理需求的标准术语集成为参考术语。
代码类型的划分
有含义代码
缩写码编码方法 层次码编码方法 矩阵码编码方法 并置码编码方法 组合码编码方法
无含义代码
顺序码编码方法 无序码编码方法
代码类型
缩写码编码方法
依据统一的方法缩写编码对象的名称,由取自编码对象名称中 的一个或多个字符赋值成编码表示; 容易记忆,但依赖编码对象的初始表达方法 举例:世界各国和地区代码(GB/T 2659-2000)
优缺点:
具有较大弹性,易于添加和修改类目; 不能充分利用容量,可组配类目很多,但有时实际 应用的类目不多;难于手工处理信息。
混合分类法
混合分类法
将线分类法和面分类法组合使用 常用于药品的分类 使用时可以用一组代码代表特定药品 但这种方法割断了代码与药品属性的联系
代码类型的划分
编码的定义: 即将一个表示对象或事物信息的某种符号(常 见的是文字)转换成便于人或计算识别和处理的另 一种符号体系(代码)的过程。 代码:编码的基本构件。
SNOMED的结构
SNOMED是多轴编码的医学命名法,有若干独立的 编码体系,每一个轴可以用于描述同一个诊断
全部术语分入11个独立的系统模块(轴) 术语按照自然层次排列,被分配5或6位代码 代码与术语一一对应,标示术语的内在信息组、上 下关系 通过使用G(链接词/修饰词)模块,可连接和修饰 每个模块术语、描述符及限定词。 词条的索引排列是按照编码顺序
双重分类:剑号与星号 (病因与临床表现), 如A18.8↓I32.0* 索引排列方法:按汉语拼音—英文字母顺序排 列,第一层次是主导词,其下包括若干个修饰 词,根据它们与主导词的关系逐层依序排列
ICD的应用和意义
标准化:使得疾病名称标准化、格式化,这是 医学信息化、医院信息管理的基础,也是电子 病历等应用基础。 共享性:疾病信息得到最大范围的共享 有利医疗管理:医疗统计的基础,便于了解各 病种的相关信息。 有利费用管理:疾病分类是医疗经费控制的重 要依据之一,而城镇职工医疗保险制度采用按 病种计费,促使各种病种制定规范化治疗方案 。
数据分类的基本原则
可扩展性与可维护性
横向设置适宜的收容类目,保证分类对象增加时, 不打乱已建立的分类体系; 为纵向进一步的延拓和细化创造条件; 标准的制定要留有扩展、延拓的余地;要安排人力、 财力跟踪维护
实用性
从工程建设实际需求出发,产生符合需求、综合实 用和便于操作。
数据分类的基本方法
线分类法 面分类法 混合分类法
线分类法
线分类法:
将分类对象按所选定的若干个属性逐次的分成相应 的若干个层级的类目,并排成一个由层次的、逐渐 展开的分类体系; 同位类目之间存在并列关系,下位类与上位类类目 存在隶属关系
优缺点:
层次性好,反映类目之间的逻辑关系,便于处理 结构弹性差,分类结构不易改动;分类层次多时, 代码位数长。
分类举例
HL7标准
数据交换是医院信息系统的基本功能。
HL7(Health Level Seven)标准主要用于与卫生保 健计算机系统有关的临床、银行、保险、管理、行 政及检验等信息的交换。
HL-7是由美国研究开发的一个专门用于医疗卫 生机构及医用仪器设备数据信息传输的标准, 是一种标准化的卫生消息传输协议。
某些传染病和寄生虫病——以疾病为分类目的 分类原则: 1.以病因为轴心进行分类
A00为霍乱 A01为伤寒 A06为阿米巴感染
2.依据属性(病情和病理)进一步分目
A06.0为急性阿米巴痢疾, A06.1为慢性肠道阿米巴病, A06.3为肠道阿米巴
3.按序化关系逐个编码
面分类法
面分类法:
将选定的分类对象的若干属性或特征视为若干个 “面”,每个面中又可分成彼此独立的若干个类目 根据需要,组合类目
SNOMED的模块
SNOMED的应用
将人、兽医学术语进行结构化的分类和编码, 使得原有的医学术语标准化,为计算机处理奠 定了基础; 标准化的、规范的应用医学术语将有利于医学 信息共享和提高医疗质量; 术语代码拥有医学知识表达的许多特征,具开 放式的数据结构,可灵活地进行搭配、组装、 合成,适用于电子病历,并支持专家系统。
并置码编码方法
由一些代码段组成的复合代码,这些代码段提供了描绘编码对 象的特征。 易于编码对象的分类,代码易于解释;需含有大量特性,代码 值有许多字符。
代码类型
组合码编码方法
由一些代码段组成的复合代码,提供编码对象的不同特性,但 特性相互依赖并且具有层次关联; 代码值容易赋予、解释、确认;理论容量不能充分利用。 举例:GB 11643-1999(公民身份号码)
任何一个标准,一种代码体系都是在一定范围,为 一定目的服务的。
完整性与惟一性
对于一个或是一组客体,在标准化代码中有且仅有 一个确定的代码与其对应。 特殊情况需用两个以上代码表示同一客体,需用加 以特殊的标志与说明。
信息标准化的特点
权威性
信息标准化要形成一个文本并被人们在一定范围内 认可和应用。 信息标准化往往有具有行政管理权威的部门制定和 颁布,并在一定范围内强制执行。
1891年第1版; 1940年第6次修订,首次引入疾病分类,强调按病因分类 的思想; 1975年ICD-9,得到推广; 1994年ICD10;
北京协和医院世界卫生组织疾病分类合作中心负责有 关疾病分类的中文事宜
ICD-10分类原理
依据疾病的四个主要特性,即病因、部位、病理和临 床表现 ,形成一个多轴心的分类系统。
元数据
元数据(meta data)
关于数据的数据。按照一定的标准,从信息资源中 抽取出相应的特征,组成一个特征元素集合。 包括描述一个具体对象所需要的数据项集合、各项 数据语义定义、著录规则和语法规定。 通过元数据,人们能够对信息资源进行详细、深入 的了解,包括信息资源的格式、质量、处理方法和 获取方法等。 元数据标准的制定为提高数据库建库质量,使数据 加工达到规范化、标准化,促进科学数据标准化, 加强数据交流与共享。
3 医学数据的类型
GB/T 19253 规定的数据类型表示法
字符型 (S):包含汉字、字母字符、数字字符等 布尔型 (B):用0(False)或1(True)表示。 数值型 (N):用“0”到“9”数字形式表示的数值 日期时间型 (T):YYYYMMDD或 YYYYMMDDhhmmss 二进制流 (By):图像、音频、视频等二进制流文 件格式。
数据元概念:
由对象类和特性组成,是数据模型。 一个特性只描述一个对象类,当一个特性和一个对象类建立 关联时就产生一个数据元概念。
数据元概念和数据元:
数据元由数据元概念和表示两部分组成。 数据元和数据元概念之间存在多对一关系。 数据元需要并且只能有一个表示。 数据元的概念模型相同而表示不同就是两个不同的数据元。
标准化的狭义定义:
是指信息表达上的标准化,实质是在一定范围内人 们能共同使用的对某类、某些、某个客体抽象的描 述与表达。
信息的表达、交换和处理
信息表达类标准化:是信息标准化的基础,如分类、 编码,名称和内涵的标准化、代码化。 信息交换标准化:解决不同系统或部门间信息共享 的问题,注重信息的格式,忽略信息内容,具体应 用有:
HL7标准(Health Level 7) XML标准 (Extensible markup language) DICOM标准 (Digital Imaging and Communication in Medicine)
信息处理与流程标准化:主要利于信息系统的开发 和推广
信息标准化的特点
明确的域
◇ ICD分类的基础是对疾病的命名; ◇ 疾病的本质和表现特性正是分类的依据; ◇ 分类与命名之间存在一种内在的对应关系; ◇ 对指定疾病赋予一个编码,编码是唯一的;
ICD分类பைடு நூலகம்方法
有三个层次:类目、亚目、细目,各围绕一个 轴心
类目:三位数编码,如S80 亚目:四位数编码,如S82.0 细目:五位数编码,如S82.01
相关文档
最新文档