第5章 定量资料的t检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章定量资料的t检验
第一节单样本定量资料的t检验第二节配对设计定量资料的t检验第三节两独立样本比较的t检验第四节t检验的注意事项
⏹t检验是以t分布作为其理论依据的检验方法,应用条件包括:
¤独立性要求:要求变量值(观测值)之间相互独立
;
¤正态性要求:样本所来自总体是正态分布总体;
¤方差齐性要求:在两独立样本均数比较时,两总体
方差齐性。
⏹在实际工作中,只要数据分布为单峰且近似对称分布也可应用;当样本含量较大时可用u检验。
第一节单样本定量资料的t检验
知总体均数(一般为理论值、标准值或经大量观察所得的稳定值)的比较,比较的目的是推断样本所代表的那个未知的总体均数与已知的总体均数有无差别。
☐检验统计量t 的计算公式为:00X X X t S S n
μμ--==
举例:
已知北方农村儿童前囟门闭合月龄为14.1月。
某研究人员从东北某县抽取36名儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。
问该县儿童前囟门闭合月龄的均数是否等于一般儿童?
1. 建立假设,确定检验水准
: ,该县儿童前囟门闭合月龄的平均
水平与一般儿童的平均水平相同
:.该县儿童前囟门闭合月龄的平均水平与一般儿童的平均水平不同。
0=μμ0μμ≠1H 0H 0.05
α=
下:014.314.10.236/ 5.08/36
X t S n μ--===3. 确定P 值,做推断结论:
0.05(,35)2=2.030, 0.236<2.030>0.05t P ,因此。
0H 尚不能拒绝,差别无统计学意义,
可以认为该县儿童前囟门闭合月龄的平均水平与一般儿童的平均水平相同。
⏹如果P值小于或等于检验水准α,意味着在成立的前提
下发生了小概率事件,根据“小概率事件在一次随机试
验中不(大)可能发生”的推断原理,怀疑的真实性,从而做出拒绝(reject)的决策。
⏹如果P值大于α,在成立的假设下发生较为可能的事件
,没有充足的理由对提出怀疑。
于是做出不拒绝(not reject)的决策。
⏹无论做出哪一种推断结论(接受或是拒绝),都面临
着发生判断错误的风险。
这就是假设检验的两类错误。
第二节配对设计定量资料的t检验
☐配对设计(paired design):将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机的给予两种处理,称为随机配对设计。
☐应用配对设计可以减少实验的误差和个体差异,提高统计处理的效率。
一、配对设计
二、常见的配对样本设计方法有三种:
①把除处理因素外,其他条件基本相似的受试对象配成对子,每对中的两个随机分配到两个处理组;
②在同一受试对象上进行两种不同的处理;
上述两种情况其目的是推断两种处理的效果有无差别。
③在某项处理前后观察受试对象的某指标值,通过处理前后该指标值的差推断该处理是否有效。
在时间因素对观察结果无影响时适用。
配对资料首先要计算各对观察数据之差,记为d 。
如果两种处理无差别或某项处理无效,那么两个观察数据之差的总体均值应该为0,因此这类问题可以归结为样本均数与总体均数0的差别性检验的问题。
检验方法与样本均数与总体均数的比较相同。
检验统计量计算公式为:式中表示差的均值,表示差值的标准差,表示
差值的标准误。
d d d s d s 00d d d d d d d t s s s n
μ---===
了16名健康男青年的血红蛋白含量(g/L ),检测结果见下表第(1)~(3)栏。
问:两种血红蛋白测定仪器的检测结果是否有差别? 1 113 140 27 2 125 150 25
3 126 138 12
4 130 120 -10
5 150 140 -10
6 145 145 0
7 135 135 0
8 105 115 10
9 128 135 7
10 135 130 -5
11 100 120 20
12 130 133 3
13 110 147 37
14 115 125 10
15 120 114 -6
16 155 165 10
H 1:0d μ≠,即A 、B 两种血红蛋白测定仪器检测的总体平均差异不为0。
0.05α= 本例n =16,∑d =130,∑d 2=3886,/130/168.125d d n =∑==。
222()(130)38861613.7351161d d d n S n ∑∑--===-- 8.125 2.366, 1611513.73516t ν===-= (3)确定P 值,做出推断结论
查t 界值表,得0.05(,15)2 2.131t =,2.366>2.131, P<0.05按α=0.05水准,拒绝H 0,接受H 1,差别有统计学意义。
可认为A 、
B 两种血红蛋白测定仪器检测结果的平均差异不为0,仪器B 检测的血红蛋白较高。
第三节两独立样本比较的t检验
两样本t检验(two independent sample t-
test):又称为成组t检验,适用于完全随机设计的两样本均数的比较。
完全随机设计:采用完全随机的方法把受试对象分配到各个处理组或者对照组中,或分别从不同总体中随机抽样进行研究。
可以是两样本比较,也可以是多样本;各样本含量可以相等也可以不等,但差别不宜过大。
一、总体方差齐性时两独立样本t检验
由于抽样误差的存在,即使两组总体均数相同,样本均数也往往不同。
因此,看到两个样本均数不同,特别是相差不太大时,不能仅从它们数量上的差别就认为两个总体均数相同或不相同,而应该作差别的统计检验。
为正态分布,检验假设为(两样本所属的)两个总体均数
相等,即:,: 已知当成立时,检验统计量:
1
H 0H 12μμ≠12μμ=0H 12
121212212,211()X X C X X X X t n n S S n n ν---===+-+222
211222
11221212()()(1)(1)22C
X X X X S n S n S n n n n -+--+-==+-+-∑∑
举例:为了解内毒素对肌酐的影响,将20只雌
性中年大鼠随机分为甲组和乙组。
甲组中的每只大鼠不给予内毒素,乙组中的每只大鼠则给予3mg/kg的内毒素。
分别测得两组大鼠的肌酐(mg/L)结果如下表。
问:内毒素是否对肌酐有影响?
3.7 6.8 5.811.3
2.79.4
3.99.3 6.17.3
6.7 5.6
7.87.9 3.87.2 6.98.2
1. : ,即内毒素对肌酐有影响。
= 0.05
2. 计算统计量
3. 确定P 值和作推断,下结论。
查附表2(t 分布界值表),
,得P <0.05.1
H α12μμ≠1
5.360X =1
1.699
S =28.150X =2 1.597
S =225.3608.150
3.785 ,1010218
(101) 1.699(101) 1.59711
()
101021010
t ν-=
=-=+-=-⨯+-⨯++-0.05,18 2.101t =
二、总体方差不齐性时两独立样本检验
两总体方差不齐时,可采用以下措施:
¤数据变换,将数据变换后,若方差齐同,
可采用t 检验;¤采用近似t 检验,即
检验;
¤采用秩转换的非参数检验,如秩和检验等。
'
t '
t
'
1
2
22
1212
X
X
t S S n n -=
+1
2
121
2
22(,)(,)'
22
222X X X X S t S t t S S
α
α
ννα⨯+⨯=
+对临界值进行校正
'
12221
2
12
X
X
t S S
n n -=
+1
)/(1
)
/()
//(22
222
121212222
12
1-+
-+=
νn n S n n S n S n S 对自由度进行校正
'
12221
2
12
X
X
t S S
n n -=
+22
2
1
12
22222
112212(//)-2(/)(/)
+1+1
S n S n S n S n n n ν+=+对自由度进行校正
三、方差齐性检验
应用t检验对完全随机设计的两个样本均数的差别
进行比较不仅要求样本来自正态总体而且要求两样
本的总体方差相等,即方差齐性(homogeneity of variance)。
事实上即使两总体方差相等,由于有抽样误差,样本方差数值也会有差别,因此从样本方差表面数
值的大小很难确定两总体方差是否相等,必须进行
方差齐性检验。
检验两总体方差是否相等用F检验。
检验统计量F值按公式计算:
较大方差作分子,以较小方差作分母。
F 分布具有两个自由度。
分别是分子的自由度和分母的自由度,根据各样本的自由度,查F 界值表(方差齐性检验用),按F 越大P 越小,确定概率P 。
111n ν=-221n ν=-2122
S F S
=
物体重增加量的均数是否相等?
247238 342337 443438 539536 651639 743737 848835 951933 10421037 11501139 12431234
1336
1. : 两组小白鼠体重增加量总体方差不同= 0.05
2. 计算统计量
3. 确定P 值和作推断,同时下结论。
查附表3(F 分布界值表),
,得P <0.05.1
H α2212σσ≠2122
S F S
=
2117.659
S =22 3.269
S =112n =213
n =17.659 5.402
3.269
F ==0.05(11,12) 3.37F =
方差是否齐性是确定统计量的分布的一个必要条件,若两总体方差齐,则可直接采用t 检验,若两总体方差不齐,则可采用
检验,或者进行变量变
换或用秩和检验。
若样本方差的不同仅为抽样误差的影响,则F 值一般不会偏离1太远。
方差齐性检验是双侧检验;一般F 值大于3即可认为方差不齐;当样本量很大时(大于100)可不必做方差齐性检验,认为方差齐。
t
第四节假设检验的注意事项
一、假设检验的两类错误
弃真的错误,即拒绝正确的无效假设,这类错误称为Ⅰ类错误(type Ⅰerror)。
伪真的错误,即接受错误的无效假设,这类错误称为Ⅱ类错误(type Ⅱerror)。
称为检验功效,也称为把握度,其意义是当两个总体确实有差异,按照规定的检验水准,能发现该差异的能力。
1β-
二、假设检验应注意的问题
1.要有严密的设计,是假设检验的前提,样本是
从同质总体中随机抽取或随机化分组;
2.正确的选择假设检验方法;
3.正确理解P值的意义,显著性的意义,注意单
双侧的选择;
4.正确理解统计推断的结论,不能绝对化;
5.统计结论和专业结论关于显著性的理解不同;
6.报告结论时应注明检验方法,列出检验统计量、
单侧检验还是双侧检验、检验水准以及P的确
切范围。
7.假设检验和可信区间的区别与联系。
1.目的不同:可信区间主要用于说明量的大小,
即估计总体参数的大小,假设检验主要用于判断各总体是否相同或不同;
2.可信区间可以回答假设检验的问题:若区间包
含原假设,则不拒绝H 0,若区间不包含原假设则拒绝H 0;
三、可信区间与假设检验的区别和联系
3.可信区间还可以提供比假设检验多的信息,可
以提供结果有无专业意义;
•假设检验可以提供确切的P 值,而可信区间不
可。
α1β-α
-β
四、变量变换
⏹对数变换:①对数正态分布资料;②变异系数是
常数的资料;
⏹平方根变换:①poisson分布资料;②轻度偏态分
布的资料;
⏹平方根反正弦变换:率或百分比的资料;
⏹倒数变换:两端波动较大的资料。
某口腔科测得长春市13-16岁居民男性20人的恒牙初期腭弓深度均值为17.15mm ,标准差为1.59mm ;女性34人的均值为16.92mm ,标准差为1.42mm 。
根据这份数据可否认为该市13-16岁居民腭弓深度有性别差异?作业。