第4章 t检验和Z检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.5
12.25
10
15.0
8.0
7.0
49.20
11
13.0
6.5
6.5
42.25
12
10.5
合计
9.5
1.0
1.00
39(d)
195(d2)
1.建立检验假设,确定检验水准
H0:d=0; H1:d0; 0.05。
2. 计算检验统计量本例 d = 39, d 2 195。
先计算差数的标准差
Sd
平均出生体重不同。
第二节 配对样本均数t检验
❖ 简称配对t检验(paired t test),又称非独立两样 本均数t检验,适用于配对设计计量资料均数的比
较。 ❖ 配对设计(paired design)是将受试对象按某些特
征相近的原则配成对子,每对中的两个个体随机 地给予两种处理。
配对设计概述
❖ 应用配对设计可以减少实验的误差和控制非处理 因素,提高统计处理的效率。
❖ 配对设计主要有三种情况:
(1)将受试对象按某些混杂因素(如性别、年龄、窝别 等)配成对子,每对中的两个个体随机分配给两种处理 (如处理组与对照组); (2)同一受试对象或同一标本的两个部分,随机分别进 行不同处理(或测量)。 (3)同一受试对象自身前后对照。
配对t检验原理
❖ 配对设计的资料具有对子内数据一一对应的特征, 研究者应关心是对子的效应差值而不是各自的效 应值。
代入公式,得:
2953.43 182.52 1743.16 141.02
SC2
12 12 13 2
13 17.03
S X1 X 2
17.03 1 1 1.652 12 13
t 15.2110.85 2.639 1.652
❖ =n1+n2-2 =12+13-2=23; 查t界值表,t0.05/2,23=2.069. 由于 t t0.05/2,23, P 0.05, 按0.05的水准,拒绝H0,接受H1,差异有统计学意义。
第四章 t检验和Z检验
第一节 t检验
❖ 以 t分布为基础的检验为t检验。
❖ 在医学统计学中,t检验是非常活跃的 一类假设检验方法。
❖ 医疗卫生实践中最常见的是计量资料两 组比较的问题
25例糖尿病患者 随机分成两组, 总体 甲组单纯用药物 治疗,乙组采用 药物治疗合并饮 食疗法,二个月 后测空腹血糖 (mmol/L) 问两种 样本 疗法治疗后患者 血糖值是否相同?
有差别。
❖ 已知总体均数μ0一般为标准值、理论值或经大量观
察得到的较稳定的指标值。
❖ 应用条件——总体标准未知的小样本资料( 如 n<50),且服从正态分布。
单个样本 t 检验原理
在 H0 : = 0的假定下, 可以认为样本是从已知总
体中抽取的,根据t分布 的原理,单个样本t检验 的公式为:
未知总体
表 5-2 25 名糖尿病患者两种疗法治疗后二个月血糖值(mmol/L)
编号
甲组血糖值(X2)
编号
乙组血糖值(X2)
1
8.4
1
5.4
2
10.5
2
6.4
3
12.0
3
6.4
4
12.0
4
7.5
5
13.9
5
7.6
6
15.3
6
8.1
7
16.7
7
11.6
8
18.0
8
12.0
9
18.7
9
13.4
10
20.7
10
从正态分布
N(, 2 ) X
❖ 其中为原来的总体均数,
为总体标准差
❖ 为标准误 X
❖ 标准正态变量为
/ n X
Z X X
X
/ n
Z 检验原理
❖ 当总体标准差已知,或样本量较大(如n>50)时
❖ 样本均数与总体均数比较、配对设计样本均数比 较和两独立样本均数比较的假设检验,可以计算
检验统计量Z值 ❖ 标准正态变量Z的界值双侧时
已知总体
0
样本
X
自由度=n-1
例5.1 :
❖ 以往通过大规模调查已知某地新生儿出生 体重为3.30kg。从该地难产儿中随机抽取 35名新生儿,平均出生体重为3.42kg,标准 差为0.40kg,问该地难产儿出生体重是否与 一般新生儿体重不同?
1. 建立检验假设,确定检验水准
H0:0; H1:0; 0.05。
❖ (1- )即可信度(confidence level):重复抽 样时,样本区间包含总体参数(m)的百分数
X1 X2 S12 / n1 S22 / n2
Z 检验——实例分析
例5-4 ❖ 研究正常人与高血压患者胆固醇含量(mg%)的资料如
下,试比较两组血清胆固醇含量有无差别。
❖ 正常人组 n1 506, X1 180.6, S1 34.2 ❖ 高血压组 n2 142, X 2 223.6, S2 45.8
大样本时,用u检验,且正态性要求可以放宽; ❖ 两独立样本均数t检验要求方差齐性——两组总体方差相等
或两样本方差间无显著性。
第四节 方差不齐时两样本均数检验
❖ 当两总体方差不t等(方差不齐)时,两独立样本均数的比较,
可采用 检验,亦称近似t检验
❖ 方差齐性检验——F检验
❖ F检验要求资料服从正态分布
认为两种方法皮肤浸润反应结果有差别。
第三节 两独立样本t检验
❖ 两独立样本t 检验(two independent sample t-test),又称成组 t 检验。
❖ 适用于完全随机设计的两样本均数的比较,其目 的是检验两样本所来自总体的均数是否相等。
❖ 完全随机设计是将受试对象随机地分配到两组中, 每组患者分别接受不同的处理,分析比较处理的 效应。
药物治疗
1
? =
药物治疗合 并饮食疗法
2
推断
甲组
n1=12
XX1 =15.21
乙组 n2=13 X 2=10.85
t 检验——问题提出
❖ 根据研究设计,t检验有三种形式:
单个样本的t检验 配对样本均数t检验(非独立两样本均数t检
验)
两个独立样本均数t检验
第一节 单个样本t检验
❖ 又称单样本均数t检验(one sample t test),适用于 样本均数与已知总体均数μ0的比较,目的是检验样 本均数所代表的总体均数μ是否与已知总体均数μ0
Z 检验——实例分析步骤
❖ 建立检验假设, 确定检验水平 H0 : 1 2
H1 : 1 2
=0.05
❖ 计算统计量Z值
将已知数据代入公式,得
|180.6 223.6 |
Z
10.40
34.22 / 506 45.82 / 142
Z 检验——实例分析步骤
❖ 确定P值, 作出推断结论
本例Z=10.40>1.96,故P <0.05,按 =0.05水准拒绝H0,接受H1,可以认为
❖ 取α=0.05水准,若F≥F0.05(ν1,ν2),P≤0.05,拒绝H0,接 受H1,可认为两总体方差不等;
❖ 若F<F0.05(ν1,ν2),P>0.05,两总体方差相等。
第五节 Z 检验
❖ 根据数理统计的中心极限定理,不论变量X的分布是否服 从正态分布,当随机抽样的样本例数足够大,样本均数服
variance), 当两样本标准差S1和S2已知时,合
并方差Sc2为:
Sc2
(n1
1)S12 (n2 1)S22 n1 n2 2
实例分析
例5.3 ❖ 25例糖尿病患者随机分成两组,甲组单纯用药物治
疗,乙组采用药物治疗合并饮食疗法,二个月后测 空腹血糖(mmol/L)如表5-2 所示,问两种疗法治疗 后患者血糖值是否相同?
❖ 两独立样本t检验要求两样本所代表的总体服从正 态分布N(μ1,σ12)和N(μ2,σ22),且两总体方 差σ12、σ22相等,即方差齐性。
❖ 若两总体方差不等,即方差不齐,可采用t’检验,
或进行变量变换,或用秩和检验方法处理。
两独立样本t检验原理
❖ 两独立样本t检验的检验假设是两总体均数相等, 即H0:μ1=μ2,也可表述为μ1-μ2=0,这里可将 两样本均数的差值看成一个变量样本,则在H0条件 下两独立样本均数t检验可视为样本与已知总体 均数μ1-μ2=0的单样本t检验, 统计量计算公式
13.5
11
21.1
11
14.8
12
15.2
12
15.6
13
18.7
❖ 建立检验假设,确定检验水准
H0:1=2 H1:12
0.05。 ❖ 计算检验统计量
由原始数据算得:n1=12,X1=182.5,X12=2953.43,n2=13,X2=141.0,
X22=1743.16, X1=ΣX1/n1=182.5/12=15.21, X 2 =ΣX2/n2=14.16/13=10.85
2. 计算检验统计量
t X 0 X 0 3.42 3.30 1.77
S X
S
0.40 / 35
n
3. 确定P值,做出推断结论
本例自由度n-135-134,查附表2,得t0.05/2,34=2.032。 因为t t0.05/2,34,故P0.05,按 0.05水准,不拒绝H0,
差别无统计学意义,尚不能认为该地难产儿与一般新生儿
Z0.05/2 1.96, Z0.01/2 2.58
❖ 单侧时 Z0.05 1.64, Z0.01 2.33
Z 检验原理
❖ 成组设计的两样本均数比较的统计量Z值计算
中,两均数差的标准误为
S X1X2
S12 / n1 S22 / n2
❖ 统计量Z值的计算公式为
Z X1 X2 S X1 X2
d
2
d
n
2
n 1
392
195 12 2.4909
12 1
计算差值的标准误 S Sd 2.4909 0.7191 d n 3.464
按公式计算,得:
d 3.25
t
4.5195
Sd 0.7191
❖ 3.确定 P 值,作出推断结论
自由度计算为 ν=n-1=n-1=12-1=11,
查附表2,得t0.05/2,11 = 2.201, 本例t > t0.05/2,11, P < 0.05,拒绝H0,接受H1,差别有统计学意义,可
编号
标准品 新制品 差值 d
d2
1
12.0
10.0
2.0
4.00
2
14.5
10.0
4.5
20.25
3
15.5
12.5
3.0
9.00
4
12.0
13.0
-1.0
1.00
5
13.0
10.0
3.0
9.00
6
12.0
5.5
6.5
42.25
7
10.5
8.5
2.0
4.00
8
7.5
6.5
1.0
1.00
9
9.0
5.5
❖ 进行配对t检验时,首选应计算各对数据间的差值 d,将d作为变量计算均数。
❖ 配对样本t检验的基本原理是假设两种处理的效应 相同,理论上差值d的总体均数μd 为0,现有的 不等于0差值样本均数可以来自μd = 0的总体,也 可以来μd ≠ 0的总体。
配对t检验原理
❖ 可将该检验理解为差值样本均数与已知总体均数μd (μd = 0)比较的单样本t检验.其检验统计量为:
t d d d 0 d
S d
S d
Sd
n
例5.2
实例分析
❖ 有12名接种卡介苗的儿童,8周后用两批不 同的结核菌素,一批是标准结核菌素,一 批是新制结核菌素,分别注射在儿童的前 臂,两种结核菌素的皮肤浸润反应平均直 径(mm)如表5-1所示,问两种结核菌素的反 应性有无差别。
表 5-1 12 名儿童分别用两种结核菌素的皮肤浸润反应结果(mm)
根据数理统计的中心极限定理不论变量x的分布是否服从正态分布当随机抽样的样本例数足够大样本均数服从正态分布其中为原来的总体均数为总体标准差样本均数与总体均数比较配对设计样本均数比较和两独立样本均数比较的假设检验可以计算检验统计量z值00520012196258005001164233研究正常人与高血压患者胆固醇含量mg的资料如下试比较两组血清胆固醇含量有无差别
❖ 检验统计量F值按下列公式计算
F S12 (较大) S2 2 (较小)
ν1=n1-1, ν2= n2-1
方差齐性检验
❖
S12为较大的样本方差,S
2 2
为较小的样本方差;
❖ 检验统计量F值为两个样本方差之比,若样本方差的不同
仅为抽样误差的影响,F值一般不会偏离1太远。
❖ 求得F值后,查附表3(疗法治疗糖尿病患者二个月后测得的 空腹血糖值的均数不同。
❖ 几何均数资料 t 检验,服从对数正态分布,先作对数变换, 再作 t 检验。
t 检验应用条件
❖ 两组计量资料小样本比较; ❖ 样本对总体有较好代表性,对比组间有较好组间均衡性——
随机抽样和随机分组; ❖ 样本来自正态分布总体,配对t检验要求差值服从正态分布,
为:
t
| (X1
X2 ) (1
S X1 X 2
2
0) |
|
X1 X2 S X1 X 2
| ,
n1
n2
2
其中
S X1 X 2
SC 2
1 n1
1 n2
SC2
X12
X1 2 n1
X22
n1 n2 2
X2 2 n2
两独立样本t检验原理
❖ Sc2称为合并方差(combined/pooled
正常人与高血压患者的血清胆固醇含量 有差别,高血压患者高于正常人。
第六节 假设检验中两类错误
由样本推断的结果
真实结果 拒绝H0 H0成立 Ⅰ型错误
- )
不拒绝H0
推断正确(1
H0不成立 推断正确(1-b) Ⅱ型错 ❖误(b 1- b )即把握度(power of a test),也称检
验效能:两总体确有差别,被检出有差别的能力