公共卫生信息分类与基本数据集标准研究(研究生课件)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如对地区按省、地、县等行政区划的划分,学科的分 类等就是遵循线分类法。
二、研究结果
1 . 公共卫生信息分类框架与编码
2) 面分类法 按照各类之间的某个共有的特性对各类
进行划分。如在上面对地区的划分中,可 以按照地形、地貌的分类,这时对地区的 划分就是面分类法。它不形成层级关系。
二、研究结果
1. 公共卫生信息分类框架与编码
二、研究结果 2. 公共卫生基本数据集标准的研究
1)基本数据集的设置及数据元的提取、描述,提交 由各个工作组完成。 各工作组根据本领域信息系统建设需求,通过业务功 能需求分析、业务流程建模和信息建模,进行了基本 数据集设置、数据元提取、数据元描述和数据元的提 交。 各工作组已完成的46个基本数据集,提交了1149个数 据元。
•数据元基本概念理解:
数据建模: 以美国公共卫生概念数据模型(PHCDM)为例
1. 4个主题域
卫生相关活动主题域包含卫生服务、卫生环境和影响健康行为信息 参与者主题域包含卫生相关活动的参与对象信息 客体主题域包含与卫生相关活动和参与者有关的物资、设备和产品信息. 位置(场所)主题域包含与参与者、卫生相关活动或者客体相关联的地
一、背景
澳大利亚的国家卫生数据字典(National Health Data DicBaidu Nhomakorabeaionary)到2003年已经出版了第12版,近年来平均每 两年修改一次。该数据字典的数据范围是以医疗为主,有 部分公共卫生数据元,目前已经有365个基本数据元,尚 在不断扩展增补中。
马来西亚也发布了国家卫生数据字典(National Health Data Dictionary)。主要是围绕人的生命全过程需要的医疗 保健所必须的数据元,为国家卫生信息系统管理者、开发 者、使用者和卫生系统的官员提供其规范化定义和标准, 以便实现信息的交换和共享。
二、研究结果 2. 公共卫生基本数据集标准的研究
2)基本数据集的元数据描述项:
序号: 数据集在本文件中的顺序号 数据集名称:提交单位提交时给数据集起的名 数据集分类:数据集在公共卫生信息分类中的归属 数据集代码:指该数据集按照信息分类的编码 数据集摘要:数据集的主要内容、数据来源等的说明 提交部门:负责数据集数据收集、管理的单位。如中国CDC慢性病
标准化工作已为各国政府所高度重视。
一、背景
国际和发达国家特别是美国已建立了较完善的公共卫 生信息标准发展协调促进组织、开发组织和分类术语标 准系统 .
美国疾病预防控制中心的HISSB(the Health Information and Surveillance Systems Board)于 1999年开始研究建立了PHCDM(The Public Health Conceptual Data Model),目的是规范公共卫生领 域需要的数据信息,为CDC及相关的公共卫生部门提供 数据交换标准。
二、研究结果
1. 公共卫生信息分类框架与编码
2)分类结果 公共卫生信息分类初步结果
二、研究结果 1. 公共卫生信息分类框架与编码
3)编码设计
码位名称 主题域
码类 字母类
位数 一位
取值 A,B,C,D
主类
数字类
两位
01 - 99
子类
数字类
两位
01 - 99
小类
数字类
两位
01 - 99
二、研究结果 1. 公共卫生信息分类框架与编码
公共卫生信息系统基本数据集标准的 研究关注的是信息表达的标准与规范, 研究的主要内容: --公共卫生信息系统事务层数据元标准 --公共卫生信息系统交换层数据元标准 --公共卫生信息系统决策层数据元标准
第三层:决策应用层 第二层:数据交换层 第一层:事务处理层
为满足管理决策需求从事务层
公
和交换层派生的数据元
但也看到存在一个奇怪的现象。 一方面,我们在不同的地区和部门运行着数十个公共卫生 信息系统,收集着大量的数据; 另一方面,我们又存在着严重的数据“荒”。表现为“缺 乏共享,难以交换”的信息孤岛现象.有人说我国是一个 数据大国,但不是一个数据强国。 结果:信息资源的极大浪费。
一、背景
问题存在的重要原因
共
卫
生
根据部门与领域间信息交换与共享
数
需求通过功能建模抽取的数据元
据
元
基
本
根据公共卫生各机构业务工作流
内
程通过业务模型设置的数据元
容
公共卫生数据元逻辑层级关系
公共卫生基本数据集 数据元标准化的基本原则与方法
公共卫生事务系统产生和处理的数据元是最基本的数据 元,是公共卫生基本数据集元素的数据源,他们贯穿于业 务流程始末,因此公共卫生基本数据元的提取需要基于科 学的业务流程分析。在具体实现中采用面向对象的技术和 业务建模方法,利用其全程一体化精细建模的特点,对数 据元进行有的放矢地规范化提取。基本步骤为:数据元基 本概念理解、业务流程分析与信息建模、数据元提取、数 据元描述和数据元提交。
二、研究结果 2. 公共卫生基本数据集标准的研究
数据集类 公用数据集 免疫类 职业类 实验室 突发事件类 资源类 妇幼类 传染病类 慢性病类 环境类 合计
数据集个数 3 7 2 4 3 9 8 3 3 4 46
数据元数 61 337 60 102 48 131 119 150 62 79 1149
在知识库中的ID: 000002
版本号:
2
元数据类型:
数据元
管理状况:
当前的, 01/07/00
定义:
个体伤害时的行为
主要用途说明:
伤害监测
可以据此对伤害控制有重要意义的因素进行分类,定义和监测伤害控
制的目标、成本,鉴定需进行深入调查的事件。本数据元也是界定与
工作和运动相关的损伤的基础。
Relational and Representational Attributes (关联和表达属性): 数据类型:数值型 表达形式:编码 表达版式: 最小长度:1 最大长度:2
s 从未结过婚
1 从未结过婚
s 单身
w 丧偶
2 丧偶
w 丧偶
d 离婚
3 离婚
a 分居
4 分居
a 分居或离婚
m 在婚,包括事实 5 婚姻 6
在婚(不包括事实 m 在婚 婚姻) 事实婚姻
z 未说明,包括表 9 未说明,包括表
述不清楚
述不清楚
一、背景
《公共卫生信息分类与基本数据集标准研究》的 最终产品是国家公共卫生信息分类框架与基本数据集:
3)公共卫生信息分类的方法
采用面分类与线分类相结合的方法。
二、研究结果
1. 公共卫生信息分类框架与编码
(4) 公共卫生信息分类初步结果
1)分类框架:
公共卫生信息分类框架由主题域和三层子类目组成,最高层为 主题域。将公共卫生分为4个主题域:
即:疾病预防控制,公共卫生服务,公共卫生管理及卫生监 督 其次对每个主题域再划分成若干个主类,主类以下为子类,子 类以下为小类。 形成:主题域——主类——子类——小类——数据集的分类框 架结构。
(无板篮球)
07 Cricket
(板球)
08 Roller balding
(滚筒)
09 Other and unspecified sporting activity (其他或未指明的运动)
1 Leisure activity (excluding sporting activity) (除运动外的休闲活动)
从总体上说,公共卫生信息系统的建设缺乏整体规 划和统一的标准,多以“单兵作战”为主。有人将它形 象地表述为处于信息系统开发的“春秋战国”时代,属 于小作坊“烟筒”式开发。
信息孤岛
传 染 病 监 测 系 统
实 验 室 管 理 系 统
一、背景
从数据的角度说信息孤岛表现为信息表达不规范。 以三个不同系统中有关婚姻编码为例,见下表:
2 Working for income
(收益性工作)
3 Other types of work
(其他类型工作)
4 Resting, sleeping, eating or engaging in other vital activities
(休息、睡眠、饮食或其他重要活动)
5 Other specified activities
一、背景
我国公共卫生信息系统是国家公共卫生建设的重要组 成部分。目前已经建立了数十个不同功能和规模的公共 卫生信息系统。初步形成了以传染病疫情与突发公共卫 生事件监测报告为主体、包含不同专病监测报告、管理 的公共卫生信息系统,初步形成了从基层到中央疾病监 测报告信息网络,积累了大量的原始数据。
一、背景
(其他特指行为)
6 Unspecified activities
(未特指行为)
Administrative Attributes (管理属性)
来源文档: 来源机构: 信息模型链接:NHIM损伤事件 数据集规范:开始日期 结束日期 NMDS – 入院病人护理 01/07/2000 NMDS – 损伤监测 01/07/2000 备注:
值域
0 Sports activity
(运动)
00 Football, rugby
(橄榄球)
01 Football, Australian
(澳式橄榄球)
02 Football, soccer
(足球)
03 Hockey
(曲棍球)
04 Squash
(壁球)
05 Basketball
(篮球)
06 Netball
公共卫生信息分类与 基本数据集标准研究
金水高 2006-12-22
一、背景
一、背景
标准化的历史有记载的可以追溯到秦始皇时代。 秦始皇统一中国后,紧接着便是统一文字,统一度量 衡,实行‘车同轨,书同文’。
随着时代的发展,标准已经成为全人类关注的问题。 “标准”无处无时不影响着我们的生活,已经渗入到 我们工作生活的方方面面。
美国公共卫生概念数据模型基本功能
规范记录公共卫生信息,并使疾病预防控制机构及其合 作伙伴能够:
1.建立公共卫生数据标准,包括数据定义、组成结构、 代码表值和数据应用。
2.与国家卫生信息标准框架主体协同,为公共卫生机构 与健康提供者间的信息交换定义标准。
3.遵照已确定的数据交换标准,构建计算机信息系统, 并应用于公共卫生相关的数据处理。
点信息。
2. 29个类: 3. 100多个属性:每个属性都有规范的名称、描述和数据类型
(公共卫生基本数据集标准化研究课题组已将PHCDM全文译成中文)
美国公共卫生概念数据模型目标
1.为公共卫生组织数据标准和指南提供一个框架. 2.降低公共卫生信息系统的开发强度. 3.通过一致性增强数据共享. 4.满足在国家标准框架中描述公共卫生数据的需求 5.促进CDC与政府和地方合作者在公共卫生领域的协作.
二、研究结果 1. 公共卫生信息分类框架与编码
(2) 分类的原则: 1) 分类法; 2) 以公共卫生领域“业务活动信息”为分类对象; 3) 以主题数据集为最小单元。
二、研究结果
1. 公共卫生信息分类框架与编码
(3) 信息分类的方法:
1) 线分类法 将初始的分类对象按所选定的若干个属性或特征作为
分类的划分基础,逐次地分成相应的若干个层级的类目, 并排成一个有层次的、逐级展开的分类体系。
4) 分类结果与编码示意
二、研究结果 2. 公共卫生基本数据集标准的研究
我 国 公 共 卫 生 基 本 数 据 集 数 据 元 ( data elements)标准的研究是国家卫生部2004年启动, 委托中国疾病预防控制中心承担的国家卫生信息标 准化研究体系的重要组成部分。公共卫生基本数据 集数据元,是公共卫生信息系统互联互通、协调运 作,数据交换和广泛共享以及满足政府职能部门对 公共卫生信息综合利用的核心内容。
数据元基本属性:
数据元属性的规范化描述: 数据元属性需依照一种标准方式进行描述,下表
列出了关于描述数据元属性的常规描述符集。
数据元标准的提交:
以澳大利亚国家卫生数据字典数据元发布格式为例:
Activity when injured(伤害原因)
Identifying and Definitional Attributes(标识和定义属性)
1)公共卫生信息分类框架与编码 2)公共卫生概念模型 3)公共卫生基本数据集与数据元目录
4)决策层数据元的提取
二、研究结果
1. 公共卫生信息分类框架与编码
(1) 信息分类目的:
1) 有效地组织信息 2) 发现信息 3) 利用信息
最后达到将具有某种共同特征的数据归并在一起,不 具有上述共性的数据区分开来,并通过设定某种符号体 系进行编码,使计算机或人工能够识别和处理,服务于 本领域的信息资源规划、分类管理和数据集查询。
二、研究结果
1 . 公共卫生信息分类框架与编码
2) 面分类法 按照各类之间的某个共有的特性对各类
进行划分。如在上面对地区的划分中,可 以按照地形、地貌的分类,这时对地区的 划分就是面分类法。它不形成层级关系。
二、研究结果
1. 公共卫生信息分类框架与编码
二、研究结果 2. 公共卫生基本数据集标准的研究
1)基本数据集的设置及数据元的提取、描述,提交 由各个工作组完成。 各工作组根据本领域信息系统建设需求,通过业务功 能需求分析、业务流程建模和信息建模,进行了基本 数据集设置、数据元提取、数据元描述和数据元的提 交。 各工作组已完成的46个基本数据集,提交了1149个数 据元。
•数据元基本概念理解:
数据建模: 以美国公共卫生概念数据模型(PHCDM)为例
1. 4个主题域
卫生相关活动主题域包含卫生服务、卫生环境和影响健康行为信息 参与者主题域包含卫生相关活动的参与对象信息 客体主题域包含与卫生相关活动和参与者有关的物资、设备和产品信息. 位置(场所)主题域包含与参与者、卫生相关活动或者客体相关联的地
一、背景
澳大利亚的国家卫生数据字典(National Health Data DicBaidu Nhomakorabeaionary)到2003年已经出版了第12版,近年来平均每 两年修改一次。该数据字典的数据范围是以医疗为主,有 部分公共卫生数据元,目前已经有365个基本数据元,尚 在不断扩展增补中。
马来西亚也发布了国家卫生数据字典(National Health Data Dictionary)。主要是围绕人的生命全过程需要的医疗 保健所必须的数据元,为国家卫生信息系统管理者、开发 者、使用者和卫生系统的官员提供其规范化定义和标准, 以便实现信息的交换和共享。
二、研究结果 2. 公共卫生基本数据集标准的研究
2)基本数据集的元数据描述项:
序号: 数据集在本文件中的顺序号 数据集名称:提交单位提交时给数据集起的名 数据集分类:数据集在公共卫生信息分类中的归属 数据集代码:指该数据集按照信息分类的编码 数据集摘要:数据集的主要内容、数据来源等的说明 提交部门:负责数据集数据收集、管理的单位。如中国CDC慢性病
标准化工作已为各国政府所高度重视。
一、背景
国际和发达国家特别是美国已建立了较完善的公共卫 生信息标准发展协调促进组织、开发组织和分类术语标 准系统 .
美国疾病预防控制中心的HISSB(the Health Information and Surveillance Systems Board)于 1999年开始研究建立了PHCDM(The Public Health Conceptual Data Model),目的是规范公共卫生领 域需要的数据信息,为CDC及相关的公共卫生部门提供 数据交换标准。
二、研究结果
1. 公共卫生信息分类框架与编码
2)分类结果 公共卫生信息分类初步结果
二、研究结果 1. 公共卫生信息分类框架与编码
3)编码设计
码位名称 主题域
码类 字母类
位数 一位
取值 A,B,C,D
主类
数字类
两位
01 - 99
子类
数字类
两位
01 - 99
小类
数字类
两位
01 - 99
二、研究结果 1. 公共卫生信息分类框架与编码
公共卫生信息系统基本数据集标准的 研究关注的是信息表达的标准与规范, 研究的主要内容: --公共卫生信息系统事务层数据元标准 --公共卫生信息系统交换层数据元标准 --公共卫生信息系统决策层数据元标准
第三层:决策应用层 第二层:数据交换层 第一层:事务处理层
为满足管理决策需求从事务层
公
和交换层派生的数据元
但也看到存在一个奇怪的现象。 一方面,我们在不同的地区和部门运行着数十个公共卫生 信息系统,收集着大量的数据; 另一方面,我们又存在着严重的数据“荒”。表现为“缺 乏共享,难以交换”的信息孤岛现象.有人说我国是一个 数据大国,但不是一个数据强国。 结果:信息资源的极大浪费。
一、背景
问题存在的重要原因
共
卫
生
根据部门与领域间信息交换与共享
数
需求通过功能建模抽取的数据元
据
元
基
本
根据公共卫生各机构业务工作流
内
程通过业务模型设置的数据元
容
公共卫生数据元逻辑层级关系
公共卫生基本数据集 数据元标准化的基本原则与方法
公共卫生事务系统产生和处理的数据元是最基本的数据 元,是公共卫生基本数据集元素的数据源,他们贯穿于业 务流程始末,因此公共卫生基本数据元的提取需要基于科 学的业务流程分析。在具体实现中采用面向对象的技术和 业务建模方法,利用其全程一体化精细建模的特点,对数 据元进行有的放矢地规范化提取。基本步骤为:数据元基 本概念理解、业务流程分析与信息建模、数据元提取、数 据元描述和数据元提交。
二、研究结果 2. 公共卫生基本数据集标准的研究
数据集类 公用数据集 免疫类 职业类 实验室 突发事件类 资源类 妇幼类 传染病类 慢性病类 环境类 合计
数据集个数 3 7 2 4 3 9 8 3 3 4 46
数据元数 61 337 60 102 48 131 119 150 62 79 1149
在知识库中的ID: 000002
版本号:
2
元数据类型:
数据元
管理状况:
当前的, 01/07/00
定义:
个体伤害时的行为
主要用途说明:
伤害监测
可以据此对伤害控制有重要意义的因素进行分类,定义和监测伤害控
制的目标、成本,鉴定需进行深入调查的事件。本数据元也是界定与
工作和运动相关的损伤的基础。
Relational and Representational Attributes (关联和表达属性): 数据类型:数值型 表达形式:编码 表达版式: 最小长度:1 最大长度:2
s 从未结过婚
1 从未结过婚
s 单身
w 丧偶
2 丧偶
w 丧偶
d 离婚
3 离婚
a 分居
4 分居
a 分居或离婚
m 在婚,包括事实 5 婚姻 6
在婚(不包括事实 m 在婚 婚姻) 事实婚姻
z 未说明,包括表 9 未说明,包括表
述不清楚
述不清楚
一、背景
《公共卫生信息分类与基本数据集标准研究》的 最终产品是国家公共卫生信息分类框架与基本数据集:
3)公共卫生信息分类的方法
采用面分类与线分类相结合的方法。
二、研究结果
1. 公共卫生信息分类框架与编码
(4) 公共卫生信息分类初步结果
1)分类框架:
公共卫生信息分类框架由主题域和三层子类目组成,最高层为 主题域。将公共卫生分为4个主题域:
即:疾病预防控制,公共卫生服务,公共卫生管理及卫生监 督 其次对每个主题域再划分成若干个主类,主类以下为子类,子 类以下为小类。 形成:主题域——主类——子类——小类——数据集的分类框 架结构。
(无板篮球)
07 Cricket
(板球)
08 Roller balding
(滚筒)
09 Other and unspecified sporting activity (其他或未指明的运动)
1 Leisure activity (excluding sporting activity) (除运动外的休闲活动)
从总体上说,公共卫生信息系统的建设缺乏整体规 划和统一的标准,多以“单兵作战”为主。有人将它形 象地表述为处于信息系统开发的“春秋战国”时代,属 于小作坊“烟筒”式开发。
信息孤岛
传 染 病 监 测 系 统
实 验 室 管 理 系 统
一、背景
从数据的角度说信息孤岛表现为信息表达不规范。 以三个不同系统中有关婚姻编码为例,见下表:
2 Working for income
(收益性工作)
3 Other types of work
(其他类型工作)
4 Resting, sleeping, eating or engaging in other vital activities
(休息、睡眠、饮食或其他重要活动)
5 Other specified activities
一、背景
我国公共卫生信息系统是国家公共卫生建设的重要组 成部分。目前已经建立了数十个不同功能和规模的公共 卫生信息系统。初步形成了以传染病疫情与突发公共卫 生事件监测报告为主体、包含不同专病监测报告、管理 的公共卫生信息系统,初步形成了从基层到中央疾病监 测报告信息网络,积累了大量的原始数据。
一、背景
(其他特指行为)
6 Unspecified activities
(未特指行为)
Administrative Attributes (管理属性)
来源文档: 来源机构: 信息模型链接:NHIM损伤事件 数据集规范:开始日期 结束日期 NMDS – 入院病人护理 01/07/2000 NMDS – 损伤监测 01/07/2000 备注:
值域
0 Sports activity
(运动)
00 Football, rugby
(橄榄球)
01 Football, Australian
(澳式橄榄球)
02 Football, soccer
(足球)
03 Hockey
(曲棍球)
04 Squash
(壁球)
05 Basketball
(篮球)
06 Netball
公共卫生信息分类与 基本数据集标准研究
金水高 2006-12-22
一、背景
一、背景
标准化的历史有记载的可以追溯到秦始皇时代。 秦始皇统一中国后,紧接着便是统一文字,统一度量 衡,实行‘车同轨,书同文’。
随着时代的发展,标准已经成为全人类关注的问题。 “标准”无处无时不影响着我们的生活,已经渗入到 我们工作生活的方方面面。
美国公共卫生概念数据模型基本功能
规范记录公共卫生信息,并使疾病预防控制机构及其合 作伙伴能够:
1.建立公共卫生数据标准,包括数据定义、组成结构、 代码表值和数据应用。
2.与国家卫生信息标准框架主体协同,为公共卫生机构 与健康提供者间的信息交换定义标准。
3.遵照已确定的数据交换标准,构建计算机信息系统, 并应用于公共卫生相关的数据处理。
点信息。
2. 29个类: 3. 100多个属性:每个属性都有规范的名称、描述和数据类型
(公共卫生基本数据集标准化研究课题组已将PHCDM全文译成中文)
美国公共卫生概念数据模型目标
1.为公共卫生组织数据标准和指南提供一个框架. 2.降低公共卫生信息系统的开发强度. 3.通过一致性增强数据共享. 4.满足在国家标准框架中描述公共卫生数据的需求 5.促进CDC与政府和地方合作者在公共卫生领域的协作.
二、研究结果 1. 公共卫生信息分类框架与编码
(2) 分类的原则: 1) 分类法; 2) 以公共卫生领域“业务活动信息”为分类对象; 3) 以主题数据集为最小单元。
二、研究结果
1. 公共卫生信息分类框架与编码
(3) 信息分类的方法:
1) 线分类法 将初始的分类对象按所选定的若干个属性或特征作为
分类的划分基础,逐次地分成相应的若干个层级的类目, 并排成一个有层次的、逐级展开的分类体系。
4) 分类结果与编码示意
二、研究结果 2. 公共卫生基本数据集标准的研究
我 国 公 共 卫 生 基 本 数 据 集 数 据 元 ( data elements)标准的研究是国家卫生部2004年启动, 委托中国疾病预防控制中心承担的国家卫生信息标 准化研究体系的重要组成部分。公共卫生基本数据 集数据元,是公共卫生信息系统互联互通、协调运 作,数据交换和广泛共享以及满足政府职能部门对 公共卫生信息综合利用的核心内容。
数据元基本属性:
数据元属性的规范化描述: 数据元属性需依照一种标准方式进行描述,下表
列出了关于描述数据元属性的常规描述符集。
数据元标准的提交:
以澳大利亚国家卫生数据字典数据元发布格式为例:
Activity when injured(伤害原因)
Identifying and Definitional Attributes(标识和定义属性)
1)公共卫生信息分类框架与编码 2)公共卫生概念模型 3)公共卫生基本数据集与数据元目录
4)决策层数据元的提取
二、研究结果
1. 公共卫生信息分类框架与编码
(1) 信息分类目的:
1) 有效地组织信息 2) 发现信息 3) 利用信息
最后达到将具有某种共同特征的数据归并在一起,不 具有上述共性的数据区分开来,并通过设定某种符号体 系进行编码,使计算机或人工能够识别和处理,服务于 本领域的信息资源规划、分类管理和数据集查询。