医学统计学常见统计方法的应用及注意事项课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
参数检验与非参数检验
两类统计方法的优缺点:
参数统计:检验效率较高,但使用条件较严格; 非参数统计:由于对资料无特殊要求,因此适用 范围广,但 统计效率较低。
选择:
首先考虑参数检验,当条件不符,才选择非参 数统计方法。
非参数统计适用情况
(1)偏态分布资料; (2)总体分布不明资料; (3)数据一端或两端有未确定值; (4)等级资料; (5)方差不齐资料。
计数资料统计分析—统计描述
用相对数来描述
➢率=
➢ 构成比 =
➢ 相对比 = A指标
B指标
(注意:A、B互不包含)
计数资料统计分析—组间比较
χ2检验 ➢ 用途:(1)率或构成比的假设检验
(2)其它(频数分布拟合优度检验等)
➢ 类型:(1)四格表资料χ2检验(直接、校正)
(完全随机设计两样本率比较) (2)配对四格表资料χ2检验(直接、校正) (3)行×列表资料χ2检验 (4)*Fisher确切概率法(非χ2检验方法)
48
338
ΣjΧ2
5054
2050
608
7712
X
26
18
6
22.8
计量资料统计分析—组间比较
3. 随机区组设计方差分析 ➢ 用途:随机区组设计两个或多个样本均数之间
比较 ➢ 资料要求:正态分布、方差齐性 ➢ 注意:随机区组设计检验效率要高于完全随机
设计
举例
例某研究者把24名贫血患儿按年龄及贫血程度分 成8个区组,每一区组中三名儿童用随机的方式分 配A、B和C三种不同的治疗方法,问治疗后血红蛋 白增加量有无差别?
计量资料统计分析—组间比较
1. t 检验
➢用途:两均数间比较 ➢资料要求:正态分布、方差齐性 ➢类型:(1)样本均数与总体均数比较
(2)配对设计两样本均数比较 (3)完全随机设计两样本均数比较
举例
例 2.17 某医生测得 18 例慢性支气管炎患者及 16 例健康人的尿 17 酮类固醇排出量(mg/dl)分别为 X1 和 X2,试问两组的均数有无不 同。
间交互作用的分析 ➢ 资料要求:正态分布、方差齐性 析因设计:是各因素各水平全面组合的设计。
正交设计:是各因素各水平部分组合的设计。
计量资料统计分析—组间比较
6. 重复测量设计资料方差分析 ➢ 用途:重复测量设计资料因素各水平间比较及
各因素间交互作用分析 ➢ 资料要求:正态分布、方差齐性
重复测量设计
n
( yi - yˆi )2
i 1
i 1
正常直线回归
非线性
奇异点
强影响点
上述四个数据集有相同的标准线性回归结果:斜率、截距、 相关系数、回归标准误以及统计检验结果。但残差不同
相关与回归分析
直线相关
用相关系数(r)表示两变量直线相关的密切程
度和方向(-1≤r ≤1)。
➢ 资料要求:X、Y 均服从正态分布
相关与回归分析
直线回归
➢ 表达式: yˆ a bx
➢ 资料要求:应变量 y为定量变量并服从正态分布 ➢ 用途: ①描述 y 、x 在数量上线性依存关系;
②预测;③统计控制
➢ 注意:①绘制散点图;②残差 ( y yˆ)分析
ei ( yi - yˆi )称为残差
∑ ∑ min
nFra Baidu bibliotek
2
ei
min
序号i
1 2 3 … 26 27
表15-2 27名糖尿病人的血糖及有关变量的测量结果
总胆固醇 甘油三脂 胰岛素
糖化血
血糖
(mmol/L) (mmol/L) (μU/ml) 红蛋白(%) (mmol/L)
X1 5.68
X2
X3
X4
Y
1.90
4.53
8.2
11.2
3.79
1.64
7.32
6.9
8.8
6.02
直线相关与回归、多元线性回归、logistic回归、Cox回归等
其他
生存分析、医学参考值范围制定、临床诊断试验评价等
统计方法选择使用步骤
1、区分统计资料的类型
计量资料、计数资料、等级资料
2、辨别实验设计方法
完全随机设计、配对设计、随机区组设计、重 复测量设计、析因设计、交叉设计等
3、先参数统计、后非参数统计
当前后测量设计的重复测量次数≥3时,称重复测 量设计。
表 12-3 受试者血糖浓度(mmol/L)
编号
放置时间(分)
0
45
90
135
1
5.32
5.32
4.98
4.65
2
5.32
5.26
4.93
4.70
3
5.94
5.88
5.43
5.04
4
5.49
5.43
5.32
5.04
5
5.71
5.49
5.43
4.93
等级资料统计分析—组间比较
秩和检验:
➢ 样本中位数与总体中位数比较的Wilcoxon符号秩检验 ➢ 两样本配对比较的Wilcoxon符号秩检验 ➢ 完全随机设计两个样本比较的Wilcoxon秩和检验 ➢ 完全随机设计多个样本比较的Kruskal-Waliiis H检验 ➢ 随机区组完全随机设计多个样本比较的Fridman M检验
计量资料统计分析—组间比较
4. 析因设计方差分析 ➢ 用途:两个或多个因素各水平间差异以及因素
间交互作用的分析 ➢ 资料要求:正态分布、方差齐性
是将两个或多个因素的各个水平进 行排列组合,交叉分组进行试验, 最简单的析因设计为22析因设计, 其设计模型为:
例 A、B两药治疗12名贫血病人,性别、年龄 一致,随机分成四组,治疗后一个月测得血中 红细胞增加数结果如下表。
秩相关
用秩相关系数(rs )表示两变量直线相关的密
切程度和方向(-1≤rs ≤1)。
➢ 适用情况:X、Y 不服从正态或不明或等级资料
相关与回归分析
多元线性回归
➢ 表达式: ➢ 资料要求:应变量 y 为定量变量并服从正态分布 ➢ 用途: ①多因素分析(因素筛选、混杂因素控制)
②预测;③统计控制
➢ 注意:①自变量共线性; ②残差 ( y yˆ)分析
首先考虑完全随机设计两样本均数比较的 t 检验
计量资料统计分析—组间比较
2. 完全随机设计方差分析 ➢ 用途:完全随机设计两个或多个样本均数间比
较 ➢ 资料要求:正态分布、方差齐性 注意:方差分析结果有统计学意义说明多个总体均 数不等或不全相等,若要进一步两两比较,需要专 用检验方法如LSD-t、SNK等(不能用t检验)。
3.56
6.95
10.8
12.3
…
…
…
…
…
5.84
0.92
8.61
6.4
13.3
3.84
1.20
6.45
9.6
10.4
问题
(1)欲分析影响空腹血糖浓度的有关因素,宜采用什么统
计分析方法?(多元线性回归逐步回归法)
(2)已知甘油三酯(X2)、胰岛素(X3)和糖化血红蛋白(X4)是 主要影响因素,现欲比较上述因素对血糖浓度的相对影响
基本概念
(一)非参数统计(nonparametric test): 不依赖于总体分布形式,应用时可以不考虑
被研究对象为何种分布及分布是否已知,其并非 是参数间的比较,而是用于分布之间的比较。 (二)参数统计(parametric test):
依赖于总体分布形式,总体分布是已知,而 且有规律可循,是总体参数间的比较。
强度,应计算何种指标?(标准偏回归系数)
yˆ 6.500 0.402X 0.287X 0.663X
+
11( a ) 12( b ) 23
-
2( c ) 33( d ) 35
合计
13
45
58
表格上指标 呈交叉排列
注意: b+c40,直接2检验,而 b+c 40,校正
行×列表资料χ2检验注意事项
当有1/5格子以上1 T 5或任一格T 1时, 不能直接用χ2检验
处理:1)增大样本含量 2)合理的合并或删除 3)R×C表的Fisher确切概率法
A 正常 - 教师 B 正常 - 工人 O 正常 + 职员 AB 正常 + 农民 A 异常 ++ 工人 B 正常 ++ 工人 O 异常 ++ 干部 AB 正常 +++ 干部 O 正常 + 军人
RBC (1012/L)
4.67 5.21 4.10 3.92 3.49 5.48 6.78 7.10 5.24
③自变量赋值
例为研究高血压影响因子,调查了某人群多个可 能影响因素包括职业,根据实际情况将职业分为 工人、农民、干部和职员,在作多元线性回归分 析时如何赋值?
指示 变量
X1 X2 X3
无序多项分类的哑变量赋值方法
职
业
工人
农民
干部
1
0
0
0
1
0
0
0
1
职员
0 0 0
例 27名糖尿病人的血清总胆固醇、甘油三脂、空腹 胰岛素、糖化血红蛋白、空腹血糖的测量值如下表:
RBC (1012/L)
4.67 5.21 4.10 3.92 3.49 5.48 6.78 7.10 5.24
计量资料统计分析—统计描述
1.均数±标准差( x s )
适用于正态分布资料 2. 中位数及四分位数间距:M(P75 P25)
适用于偏态分布或分布不明的资料 注意:一些偏态分布资料可通过变量变换达到正 态分布。
处理 胞磷胆碱组 脑益嗪组
合计
药物治疗脑动脉硬化的疗效
愈合
未愈合
合计 有效率(%)
41(38.18) 3(5.82) 44
93.18
18(20.82) 6(3.18) 24
75.00
59
9
68 86.76
•应用条件
(1)T 5,而且N 40
直接用2检验
(2)1 T 5,而且N 40 校正2检验
(3)T 1 或N 40,
Fisher确切概率法
•注意:上述条件是以理论数为依据,而非实际数。
例某实验室分别用乳胶凝集法和免疫荧光法对58名可 疑系统红斑狼疮患者血清中抗核抗体进行测定,结果 见表7-3。问两种方法的检测结果有无差别?
表 7-3 两种方法的检测结果
免疫荧 光法
乳胶凝集法
+
-
合计
表 5.12
ΣΧ N X
A、B 两药治疗后病人红细胞增加数(1012/L)
A 药 B 药 A+B 药 不用药
1.3
0.9
2.1
0.8
1.2
1.1
2.2
0.9
1.1
1.0
2.0
0.7
合计
3.6
3.0
6.3
2.4
15.3
3
3
3
3
12
1.2
1.0
2.1
0.8
1.275
计量资料统计分析—组间比较
5. 正交设计方差分析 ➢ 用途:两个或多个因素各水平间差异以及因素
6
6.27
6.27
5.66
5.26
7
5.88
5.77
5.43
4.93
8
5.32
5.15
5.04
4.48
计量资料统计分析—组间比较
7. 秩和检验(属非参数统计)
➢ 样本中位数与总体中位数比较的Wilcoxon符号秩检验 ➢ 两样本配对比较的Wilcoxon符号秩检验 ➢ 完全随机设计两个样本比较的Wilcoxon秩和检验 ➢ 完全随机设计多个样本比较的Kruskal-Waliiis H检验 ➢ 随机区组完全随机设计多个样本比较的Fridman M检验
根据数据资料是否服从正态分布、方差齐性等来确定
判断下表中变量或资料类型
病例 号
年龄(岁) 性别
身高 (cm)
1
35 女 165
2
44 男 174
3
26 男 180
4
25 女 161
5
41 男 171
6
45 女 158
7
50 女 160
8
28 男 176
9
31 女 162
血型 心电图 尿WBC 职业
判断下表中变量或资料类型
计量 计数 计量 计数 计数 等级 计数
计量
病例 号
年龄(岁) 性别
身高 (cm)
1
35 女 165
2
44 男 174
3
26 男 180
4
25 女 161
5
41 男 171
6
45 女 158
7
50 女 160
8
28 男 176
9
31 女 162
血型 心电图 尿WBC 职业
A 正常 - 教师 B 正常 - 工人 O 正常 + 职员 AB 正常 + 农民 A 异常 ++ 工人 B 正常 ++ 工人 O 异常 ++ 干部 AB 正常 +++ 干部 O 正常 + 军人
常见医学统计方法的应用及注意事项
医学统计工作的基本内容
(1)统计设计: 设计方法、样本含量等
(2)收集资料
(3)整理资料 (4)分析资料
统计描述 统计推断
医学常用的统计方法
统计描述
均数±标准差、中位数及四分位数间距、相对数等
组间比较
t 检验、z 检验、方差分析、χ2检验、秩和检验等
相关与回归
X1:3.14 5.83 7.35 4.62 4.05 5.08 4.98 4.22 4.35 2.35 2.89 2.16 5.55 5.94 4.40 5.35 3.80 4.12
X2:4.12 7.89 3.24 6.36 3.48 6.74 4.67 7.38 4.95 4.08 5.34 4.27 6.54 4.62 5.92 5.18
举例
某医师用A、B和C三种方案治疗婴幼儿贫血患 者,治疗一个月后,血红蛋白的增加克数如下表,问 三种治疗方案对婴幼儿贫血的疗效是否相同?
表5.1 三种方案治疗后血红蛋白增加量(g/L)
A
B
C
24
20
20
36
18
11
25
17
6
14
10
3
26
19
0
34
24
-1
23
4
5
合计
n
7
6
8
21
ΣjΧ
182
108