第四讲分类变量统计描述率标准误
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7/29/2020
8
2. 在某遗传病的研究中,研究人员发现该病 患者中,有90%是第一个孩子,由此可见 该病的遗传与出生顺序有关---更容易遗传 给第一个孩子。这个结论是否正确,为什 么?
7/29/2020
9
绝对数:实际观察得到的数据,反映真实情 况。
相对数:两个有联系的指标(数值)之比, 用于比较。
➢ 请大家举出研究中熟悉的分类变量的例子:
▪ 特点
➢ 变量值是定性的 ➢ 没有度量衡单位
▪ 类型
➢ 无序分类变量:二项分类变量、多项分类变量
➢ 有序分类变量
▪ 统计分析中的处理
➢ 赋值 1=“男性”,2=“女性” ➢ 数据转换 出生体重(数值变量)
低出生体重、正常出生体重、巨大儿
SPSS程序:
Transform Recode Into different variables
第四讲 分类变量的统计描述
7/29/2020
1
wk.baidu.com本内容
数值变量
统计描述
频数分布 集中趋势 离散趋势
统计图表
分类变量 相对数 (率、比)
统计推断(1) 统计推断(2)
抽样误差
直线相关与回归
标准误
偏相关
均数可信区间 多元线性回归
t Z F检验 因子分析
秩和检验
率的可信区间 Logistic回归 2检验
6.4
146.5
22.0
7/29/2020
16
2.构成比
▪ 概念:也叫构成指标,是指一事物内部某一组成部
分的观察单位数与该事物各组成部分的观察单位总
数之比,用以说明某一事物内部各组成部分所占的
比重或分布。
▪
计算公式:
某 组 成 部 分 的 观 察 单 位 数
构 成 比
100%
各 组 成 部 分 的 观 察 单 位 总 数
0%
20%
40%
60%
80%
100%
百分比(%)
被调查的北京和青岛流动人口妇女职业分布
7/29/2020
20
练习:
放环情况
人工流产后 月经后 哺乳期 合计
已婚妇女不同情况下放环失败比较
放环人数
失败人数
失败人数构成比 ( ?)
254
76
88
40
17
10
359
126
失败率( ?)
率及构成比的差别?
3.相 对 比
7/29/2020
10
一、常用相对数
相对数的种类: 1.率 2.构成比 3.相对比
重要区别:分子、分母
7/29/2020
11
1. 率
概念:是指某种现象在一定条件下,实际发生的观察单位数 与可能发生该现象的总观察单位数之比,用以说明某种现 象发生的频率大小或强度。
计算公式:
率
发 生 某 现 象 的 观 察 单 位 数 K
感染率
感染人数 100%
检查人数
7/29/2020
13
死亡率
某年内的总死亡人数 同年内的平均人口数
1000‰
病死率 死于某病的人数 100% 该病的患病总人数
治愈率 某病的治愈人数 100% 该病接受治疗的人数
7/29/2020
14
漏诊率未被 确诊 实断 为为 该某 病病 的的 病病 人人 数数100%
▪ 概念:是指两个有关联的指标之比,是对比的最简 单形式。
▪ 计算公式:A/B(或100%) 表示A是B的若干倍或百分之几。
▪ 例如:BMI、性别比、CV等。
▪ 注意:1. A、B可以是性质相同的,也可以是性质不同的
2. A、B可以是绝对数,也可以是相对数或平均数
7/29/2020
22
部分国家人口性别比
7/29/2020
18
城市
农村
放置节育器
人工流产
49%
31%
15%
4% 1%
取出节育器
输卵管结扎 输精管结扎
27%
46%
12% 2% 13%
2002年全国各地城市农村计划生育手术构成(%)
7/29/2020
19
北京
50.3
青岛 12.1
36.1
26.0
14.3 9.4
42.3
9.5
家庭主妇 经商 服务 其它
Europe: France
94.8
U.K.
93.9
Sweden
97.6
中国历年报告的出生性别比
年代 70(1972-1979年)
▪ 注意:各组成部分的构成比之和为100%;
某一部分比重增大,则其它部分相应减少。
▪ 制图:一般用圆图(饼图)或百分条图
7/29/2020
17
例:某市某病患者的地区构成 人数 %
甲区
200 50.0
甲区
乙区
120 30.0
乙区
丙区
80 20.0
丙区
合计
400 100.0
合计
人数 % 300 60.0 120 24.0 80 16.0 500 100.0
可 能 发 生 某 现 象 的 观 察 单 位 总 数
如何选K?①使算得的率至少保留1~2位整数
②习惯:IMR—— ‰,MMR——/10万
注意:不受其它指标的影响;各率相互独立,求和不一定为 1(如是则属巧合)。
7/29/2020
12
常用的频率/类频率指标:
患病率
患病人数
K
调查人数
发病率 观察期内新发病例数 100% 同期内可能发生该病的总人数
7/29/2020
2
主要内容
一、分类变量概述 二、分类变量的统计描述 ▪ 相对数 ▪ 应用相对数的注意事项 ▪ 动态数列 ▪ 率的标准化 三、分类变量的统计推断 ▪ 率的标准误和可信区间 ▪ 2检验✓
第一节、分类变量概述
▪ 分类变量定义
➢ 通过确定每个观察单位的某项特征的性质或类 别得到的数据。
Country (2010 )
Sex Ratio
Africa: Uganda
96.5
Zimbabwe 95.4
North A. USA
95.1
South A.: Argentina 95.6
Asia: China
106.5
India
107.9
Bangladesh
106.1
South Korea 100.7
练习SPSS中变量转换操作: (出生体重-率.sav数据库)
将出生体重从数值变量变成分类变量(低出生体重、 正常出生体重、巨大儿)
第二节 分类变量的统计描述
一、常用相对数 二、应用相对数的注意事项 三、动态数列 四、率的标准化
7/29/2020
7
为什么引入相对数?
1. 2008年甲县心脑血管疾病死亡人数253人,乙 县为132人,能否说甲县心脑血管疾病的威胁 比乙县严重?
误诊率ImN确 被a实 诊 og不 断 e是 该某 病病 的的 病人 人数 数100%
7/29/2020
15
例:某地2007年四种常见心血管病死亡率
病名 高血压 冠心病 脑卒中 风心病
平均人口数 172665 172665 172665 172665
死亡人数 40 11 253 38
死亡率 (1/10万) 23.2