数据质量具体评测指标及方法说明
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据质量具体评测指标及方法说明
一、主要评测内容
重点评测个案库的数据完整性、逻辑关系准确性。评测内容及指标计算方法会根据需要作适当调整。
二、具体评测指标及方法
(一)主要数据项完整情况
1、评测内容:重点评测个案库中的基本情况表,具体数据项包括姓名、性别、现居住地代码、户籍所在地代码、公民身份号码、出生日期、婚姻状况、户口性质等8项必填内容。
其中:每条个案记录中,只要任意一项主要数据项缺失,即认定为该条记录的主要数据项不完整。
2、评测指标:主要数据项完整率
3、计算公式:
主要数据项完整的人口总数
—————————————×100%
个案信息库包含的人口总数
其中:
主要数据项要通过单项逻辑校验,没有通过单项逻辑校验的视为数据项缺失。校验规则如下:
(1)性别、户口性质、婚姻状况数据项均不能为空错值;
(2)姓名:7岁以上(含7岁)“姓名”不含“未取名”、阿拉伯数字、英文字母等不符合规范的文字,不少于两个汉字。7岁以下人口不做此单项逻辑校验。
(3)公民身份号码:7岁以上(含7岁)“公民身份号码”不含空格、性别码与性别匹配、长度为15或18位、校验码正确。7岁以下人口不做此单项逻辑校验。
(4)出生日期:不大于汇总数据时点。
(5)现居住地代码:不为空错值,当人员类别为外出时,现居住地代码不应为本地
(6)户籍地代码:不为空错值,当人员类别为外来时,户籍地代码不应为本地
(二)逻辑关系准确情况
1、评测内容:分为单表审核、表间审核两种类型,共计7个审核内容。
其中,每条个案记录中,只要任意一项逻辑关系不准确,即认定为该条记录的逻辑关系不准确。
(1)若总人口数据“婚姻状况”为已婚(代码为20 – 23 29),则与配偶有关的信息项目配偶姓名、配偶身份证(配偶身份证错误也视为空)项均不为空;
(2)育妇卡片“育龄妇女初婚日期”加15年不能小于“育龄妇女出生日期”;
(3)若15-49岁育龄妇女总人口数据“婚姻状况”不为“未婚”或“未说明的婚姻状况”,则育妇卡片“育龄妇女初婚日期”不为空;
(4)若15-49岁育龄妇女总人口数据“婚姻状况”不为“未婚”或“未说明的婚姻状况”,则育龄妇女至少有一条避孕记录。
注意:避孕记录是指避孕情况里必须至少有一条记录说明育龄妇女的避孕情况,避孕情况除了措施还包括:A00 未避孕原因;A10 待孕;A20 现孕A30 绝经A90 其它未避孕原因(5)若怀孕动态“妊娠结果”为活产(代码为10),“妊娠终止日期”与其对应的生育子女情况“子女出生日期”一致;
(6)一名育龄妇女妊娠史不可有完全重复的记录;
(7)若生育子女情况“子女死亡日期”不为空,则“子女死亡日期”大于等于“子女出生日期”;
2、评测指标:逻辑关系准确率
3、计算公式:
主要数据项没有逻辑错误的人口总数
——————————————————×100%
个案信息库包含的人口总数