数据元、元数据概念及管理工具
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人
nationality, code
民族代码
PAT010101_100052 Person-race, code 表示人的民族代码。
人
件类别 名称
件类别 代码
证件号码 识别号
医疗档案 名称
档案类别 代码
档案号码 号码
籍贯
名称
国籍
代码
民族
代码
A[A(20)] N
N[N(18)] A[A(20)] N[N(2)] N[N(20)] A[A(20)]
数据字典重用(reuse)
7.2.3 血浆 □□□□ml 7.2.4 全血 □□□□ml
7.2.5 其它 □□□□ml
8.1 诊断符合情况(Y 符合 N 不符合) 门诊与出院□ 入院与出院□ 术前与术后□ 临床与病理□
8.2 病案质量(1 甲 2 乙 3 丙) □
Reference model
通过《数据字典》实现语义互操作
(5~9位)
元数据类型代码
(1位)
NHDD 元数据标识码
(5位)
实体
对象类
人(个体特指)
PAT01_800001
特性
性别
PAT00_700031
属性
单位负责人
表示
性别代码 PAT00_300031
出院患者 新生儿
个体特指 + 性别 + 代码 = 人的性别代码
…… 医生
OC
GN
PAT00_100031
数据格式符号说明
值
表示内容
A 字母:英文字母a-z 或A-Z,也可以包含特殊字符。 N 数字:数字包含整数或小数,也可以包含特殊字符。 X 文字数字:同时包含字母和数字,也可以包含空字符。
D天
M月 Y年 h 小时
m 分钟
s秒
[ ] 中括号表示可选,括号内的内容可以任意组合。例如:N[NNN],即:N, NN, NNN 或NNNN,表示1位,2位,3位或4位数字字符。
人
card,code
身份证件号码
PAT01_100026
Number of
表示个人的身份证件的号码。
人
identify card
医疗档案名称
PAT01_100030
Name of health 表示人的医疗档案的名称。
人
record
医疗档案类别代码 PAT01_100031
Type of health 表示人的医疗档案的类别代码。
标准数据元
5 大病统筹
6 新型农村合作医疗
9 其它
1.2 住院次数 □□
1.3 病案号______________
1.4 性别(1 男, 2 女) □
1.5.1 出生日期□□□□年□□月□□日 6.1 住院费用总计(元) □□□□□□
病人费用类别代码
6.1.1 床费 □□□□□ 6.1.2 护理费 □□□□□ 6.1.3 西药 □□□□□ 6.1.4 中药 □□□□□ 6.1.5 化验 □□□□□ 6.1.6 诊察治疗 □□□□□
5
4
实验室管理类
9
5
突发公共卫生事件类
3
6
传染病监测类
4
7
慢性病监测类
3
8
妇幼卫生类
8
9
环境卫生类
4
合计
50
数据元数 183 326 158 118 47 177 64 368 72 1513
公共卫生数据元描述
标识符
数据元 名称
英文简称
0001001 姓名 Name
源自文库
定义
在公安户籍管理部门 正式登记注册、人事 档案中正式记载的本 人姓氏和名称
根据ISO/IEC 11179-3:2002(信息技术/元 数据注册/第三部分:元模型注册及其基本属性) 和国标GB/T 18391.3-2001XX,建立国家卫生数 据字典基本体系架构。
病案首页数据
人的性别代码
生理性别 社会性别
患者、联系人、医生
人的性别
人
性别
性别分类 性别代码值
元数据描述的5大类基本属性:
孕产妇产前检查次数
报告日期
与数据字典协同化
个体特指(PAT0101_600400)+ 性别(PAT0101_200010)
个体特指(PAT0101_600400)+ 身高测量值(cm)(PAT0103_200001)
个体特指(PAT0101_600400)+ 姓名
事件特指(EVN01_100001)+ 事件开始日期(EVN01_100011)
人的姓名(名称)
事件特指列表 症状词汇表 检查结果词汇表 观察值词汇表
外部术语支持:
SNOMED CT LOINC
数据库字段与《国家卫生数据字典》数据元的协同实例
应用领域
医院信息系统
数据库字段名
患者的性别
患者身高
手术者姓名
统计调查数据库 统计调查日期
单位负责人姓名
社区与公共卫生信 社区卫生服务人员类别 息系统
版本: BDSS1.0 注册机构: 中华人民共和国卫生部 中文简称: 类别 英文名称: Category 英文缩写: Category 定义类属性: 定义:表示药品不同的种类。如西药、中成药、中草药、民族药、试剂等 表示类属性:
数据类型:C 数据类型_参考HL7: CE 数据长度:8 合法值域:1,2,3,4,5,9 关系类属性: 域名:药品管理系统 系统:药品管理系统 依据:用户自定义表,可参考BDSS 自定义列表中的推荐值 列表编号:BDSS-04000 列表名称:自定义表—药品类别
数据元、元数据概念 及管理工具
第四军医大学 刘丹红
2007.5.27
元数据标准及应用
信息标准化的基础是数据标准化
➢ 数据元:数据的基本单元。每个数据元的确切含 义需要通过一系列属性来说明,包括数据的定义、 标识、表示方法和管理等
➢ 元数据:是关于数据的数据,是对数据的说明, 提供的是理解和精确解释数据所需要的信息
药品类别代码
代码:药品类别 1 西药 2 中成药 3 中草药 4 民族药 5 试剂 9 其他 管理类属性: 主管机构: 中华人民共和国卫生部 注册状态: 注册 提交机构: 中华医院管理学会信息管理专业委员会 备注:
公共卫生基本数据集及数据元
序号
领域
基本数据集数
1
公用类
7
2
免疫规划类
7
3
职业卫生与中毒类
5 大病统筹
6 新型农村合作医疗
9 其它
1.2 住院次数
□□
1.3 病案号______________
1.4 性别(1 男, 2 女) □
1.5.1 出生日期□□□□年□□月□□日
个体特指(PAT0101_600400)+ 人的姓名
个体特指(PAT0101_600400)+ 从业种类(PAT0104_200100)
个体特指(PAT0101_600400)+ 事件发生次数(EVN01_100030)
事件特指(EVN01_100001)+ 事件开始日期
对象类的特化
个体特指=患者 个体特指=患者 个体特指=手术者 事件特指=统计调查 个体特指=单位负责人 个体特指=社区卫生服务人员 事件特指=孕产妇产前检查 事件特指=产前检查报告
数据项原形到标准数据元
医院出院病人调查表
组织机构代码 □□□□□□□□-□ 医院名称________________________
表 号:卫统 5 表 制表机关:卫生部
批准机关:国家统计局
批准文号:国统函[XXXX]5 号
有效期至:
年
1.1 医疗付款方式□ 1 社会基本医疗保险 2 商业保险 3 自费医疗 4 公费医疗
一系列数据元的标准化描述即元数据的集合
—— 数据字典
国家卫生数据字典
National Health Data Dictionary
国家卫生数据字典是装载数据元的定义和表 示的元数据资源库(Meta Data Repository),目的 是让使用者能够方便地获得数据元和描述数据元 的元数据。
元数据的描述框架
人出生时的公历日期
TS
yyyy mmdd
1.0
0001004 年龄 Age
人从出生到事件发生
时的年数
PQ n1..3
1.0
0001005
身份证 件类别
ID_card_typ 身份证件的不同类别 e
CS
n1
0001005证件类别代 码
1.0
0001006
身份证 号码
ID_no
证件发放机关为每个 证件持有者确定的法 II 定标识符
N(3) NN
《国家卫生数据字典》的结构和条目是相对 稳定的,而数据集和数据库字典则因应用目的不 同而千差万别,如数据库结构、字段名称等。那 些需要跨地域、跨机构信息共享的数据库字段的 元数据,需要通过与《国家卫生数据字典》的协 同进行标准化。
医院信息系统基本数据集按HIS的应用领域划分为
11 个子域,加上一个共享数据元素域,共12 个子域,602 个基本元素。
BUN020207_100003 病人医疗费用(元)
6.1.7 手术 □□□□□ 6.1.8 检查 6.1.9 其它费用 □□□□□
□□□□□
BUN020207_100001
7.1 血型(1A 型, 2 B 型, 3AB 型, 4 O 型, 5 其它) □
7.2 输血品种 7.2.1 红细胞 □□□□单位 7.2.2 血小板 □□□□袋
标识与定义(Identifying and definition) 数据采集及使用指南 (Collection and usage guide) 来源及参考文本(Source and reference) 关系(Relation) 管理(Administration)
元数据标识符(11~15位)
数据模型 实体分类代码
an18
1.0
对象类特指
相关环境 词汇代码 特指名称 定义
统计调查
1.001 单位负责人 1.002 填表人 1.101 联系人 1.121 被调查者 1.223 调查者 1.258 死者 1.501 调查对象 1.731 出院病人 1.732 住院病人
医院
2.001 急诊医生 2.002 门诊医生
中文名称 (简称)
姓名名称 (姓名) 性别代码
年龄(岁)
标识符
PAT00_100020 PAT00_100031 PAT00_100042
英文名称
定义
对象类
Person-name 由人的姓和名组成的字符串。
人
Person-sex,code 男性与女性之间的生物学区分,用 人
代码表示。
Person-age, years 表示人的实际年龄(岁)。
共享数据元素:38 患者ADT及挂号与转诊:40 门急诊/住院医嘱处理与医生工作站:38 财务与病人帐务管理:61 药品管理:54 医技科室管理:38
实验室:53 医学影像:91 后勤与物资:60 病案管理与电子病历:76 人力资源与办公自动化:41 医疗保险与社区保健:12
药品类别代码
标识类属性:
( ) 小括号表示指定重复次数。小括号中的数字表示小括号前的字符重复的次数。 例如:N(9)表示N重复9次,即NNNNNNNNN。
姓名:
数据类型=字符,最大长度=30
A[A(29)]
年龄(岁):数据类型=数字,最大长度=整数3位,小数1位
表示格式=NNN.N
N[N(2)].[N]
标识与定义—数据元(简化描述8/13,278)
数据元表示形式
序号 表示形式
1 测量值 2 代码 3 文本 4 名称 5 识别号 6 号码 7 符号 8 日期
序号 表示形式
9 比值 10 率 11 构成比 12 均数 13 总量 14 总数 15 总金额 16 顺序号
数据类型
序号 数据类型
1 数字型 2 字符型 3 布尔型 4 货币型 5 日期/时间型 6 二进制型
数据 类型
PN
表示 格式
值域依据
版本
GB/T 17538-1998(全 a..30 国干部、人事管理信 1.0
息系统数据结构)
0001002 性别 Gender
人的社会学性别属性 CE
GB/T 2261.1-2003个 n1 人基本信息与分类代 1.0
码 性别代码
0001003
出生日 期
Birth_date
调查表
医院出院病人调查表
组织机构代码 □□□□□□□□-□ 医院名称________________________
表
号:卫统 5 表
制表机关:卫生部
批准机关:国家统计局
批准文号:国统函[2002] 5 号
有效期至:2004 年
1.1 医疗付款方式□
1 社会基本医疗保险 2 商业保险 3 自费医疗 4 公费医疗
人
record, code
医疗档案号码
PAT01_100032
Number of health 表示个人医疗档案的号码。
人
record
籍贯名称
PAT010101_100030 Person-native 表示人的籍贯。
人
(籍贯)
place
国籍代码
PAT010101_100051 Person-
表示人的国籍代码。
人
特性
姓名 性别 年龄
表示
格式
名称 A[A(29)]
代码
N
物理量 N[N(2)].[N]
身份证件类别名称 PAT01_100024
Type of identify 表示个人的身份证件类别,如居民 人
card
身份证、军官证、护照等。
身份证件类别代码 PAT01_100025
Type of identify 表示个人身份证件类别的代码。