第6讲 DD-t检验与u检验(2004)
u检验和t检验(课件分享)
问题:σ已知,或n较大时,用什么检验?
u检验和t检验(课件分享)
5
z 检验
复习
t 检验是根据t分布判断样本概率而进行的假设检验,而当样 本量n很大时,t分布就接近标准正态分布,标准正态分布也称为u 分布,而国外教科书则称为Z分布,这时候根据u分布判断概率所 进行的假设检验称为u检验。
应用条件: σ已知或者σ未知且n足 够大(如n>100)。
不同自由度下t界值对应的概率有差异
u检验和t检验(课件分享)
18
t 仅分布与自由度有关
h(t)[(n1)/2](1t2)(n1)/2
n(n/2) n
f(t) =∞(标准 正态 曲线)
0.3 =5
=1 0.2
0.1
-4 -3 -2 -1 0 1 2 3 4
u检验和t检验(课件分享)
19
P<0.01
们接受的公认值、习惯值。
未知总体μ
?
已知总体μ0
u检验和t检验(课件分享)
7
t 检验
例3.16 根据大量调查,已知健康成年男子听到最高声音频率的平均数 为18000Hz。某医生随机抽查25名接触噪声作业的男性工人,测得可 以听到的最高声音频率的均数为17200Hz,标准差为650Hz。试问能 否认为接触噪声作业工人的听力水平与正常成年男性的听力水平不同?
0.10 0.05 0.02
6.314 12.706 31.821
2.920 2.353 2.132 2.015
4.303 3.182 2.776 2.571
6.965 4.541 3.747 3.365
- 0t t
0.005 0.01
63.657 9.925 5.841 4.604 4.032
u检验和t检验
u检验和t检验第三节 u检验和t检验2005-08-04 00:00 来源:医学教育网u检验和t检验可用于样本均数与总体均数的比较以及两样本均数的比较。
理论上要求样本来自正态分布总体。
但在实用时,只要样本例数n较大,或n小但总体标准差σ已知时,就可应用u检验;n小且总体标准差σ未知时,可应用t检验,但要求样本来自正态分布总体。
两样本均数比较时还要求两总体方差相等。
一、样本均数与总体均数比较比较的目的是推断样本所代表的未知总体均数μ与已知总体均数μ0有无差别。
通常把理论值、标准值或经大量调查所得的稳定值作为μ0.根据样本例数n大小和总体标准差σ是否已知选用u检验或t 检验。
(一)u检验用于σ已知或σ未知但n足够大[用样本标准差s作为σ的估计值,代入式(19.6)]时。
以算得的统计量u,按表19-3所示关系作判断。
表19-3 u值、P值与统计结论α|t|值P值统计结论0.05双侧单侧<1.96<1.645>0.05不拒绝H0,差别无统计学意义0.05双侧单侧≥1.96≥1.645≤0.05拒绝H0,接受H1,差别有统计学意义0.01双侧单侧≥2.58≥2.33≤0.01拒绝H0,接受H1,差别有高度统计学意义例19.3根据大量调查,已知健康成年男子脉搏均数为72次/分,标准差为6.0次/分。
某医生在山区随机抽查25名健康成年男子,求得其脉搏均数为74.2次/分,能否据此认为山区成年男子的脉搏高于一般?据题意,可把大量调查所得的均数72次/分与标准差6.0次/分看作为总体均数μ0和总体标准差σ,样本均数x为74.2次/分,样本例数n为25.H0:μ=μ0H1:μ>μ0α=0.05(单侧检验)算得的统计量u=1.833>1.645,P<0.05,按α=0.05检验水准拒绝H0,可认为该山区健康成年男子的脉搏高于一般。
(二)t检验用于σ未知且n较小时。
以算得的统计量t,按表19-4所示关系作判断。
表19-4 |t|值、P值与统计结论α|t|值P值统计结论0.05<t0.05(v)<0.05不拒绝H0,差别无统计学意义0.05≥t0.05(v)≤0.05拒绝H0,接受H1,差别有统计学意义0.01≥t0.01(v)≤0.01拒绝H0,接受H1,差别有高度统计学意义例19.4 若例19.3中总体标准差σ未知,但样本标准差已求出,s=6.5次/分,余数据同例19.3.据题意,与例19.3不同之处在于σ未知,可用t检验。
9.4 t检验和u检验03
⑷ 有关总体参数的 95%置信区间。
3
假设检验应注意的问题:
(1)资料必须合乎随机化抽样原则;
样本 总体, 样本要有代表性和均衡性
随机 ≠ “随便”
(2)选用的假设检验方法应符合其应用条件;
资料性质、设计类型、样本量、分布类型等
u检验和 t 检验
4
(3)实际差别大小与统计意义的区别,
18
练习5
某地检查健康男性工人625人的红细胞计数,得均
数为4.8×1012/L,标准差为0.5×1012/L . 1) 根据此资料估计该地健康男性工人的红细胞计数 的95%参考值范围。 2) 根据此资料估计该地健康男性工人的红细胞计数
平均水平。
3) 以上例说明参考值范围与置信区间的含义。
19
练习5讨论要点:
11
(3)确定 P 值,判断结果
P<0.05
单侧P值
0.05
0.025 -1.75 -1.98 -1.66
12
0
1.75
t 值和对应 P值图
• 按照单侧α=0.05的水平,拒绝H0,接受H1.
• 可以认为社会经济落后地区新生儿出生体重低于 一般水平。
• 拒绝H0 ,可能犯I类错误:发现该落后地区医院 的新生儿体重低于3.1kg,但事实上该医院的新生 儿体重是3.1kg。
• 可否据此资料得到社会经济落后地区的新生儿平均体
重低于一般水平的结论?
10
练习1讨论要点:
(1)建立假设,确定检验水准
H 0 : 3.1
H1 : 3.1
0.05(单侧)
(2)选择检验方法,计算检验统计量
2.96 3.10 t 1.75, 0.80 / 100
讲稿t,u检验
刘关键
四川大学华西临床医学院 临床流行病学教研室
一. 概 述
数值变量的抽样分布
当样本含量n较大时, 当样本含量 较大时,其抽样分布服 较大时 从正态分布(中心极限定理 中心极限定理) 从正态分布 中心极限定理 ; 当样本含量n较小时 较小时, 当样本含量 较小时,若样本来源于 正态分布, 简单的说, 正态分布 , 简单的说 , 其抽样分布 服从t分布 分布; 服从 分布; 当样本含量n较小时 较小时, 当样本含量 较小时,若样本来源于 偏态或未知分布时, 偏态或未知分布时 , 其抽样分布的 未知。 未知。
统计量的计算
--0 - d d t= = S- Sd/ n d
式中 S- 为差值的标准误,Sd 为差值的标准差 d 为差值的标准误,
实例分析
某单位研究饮食中缺乏维生素E 某单位研究饮食中缺乏维生素 E 与肝 中维生素A含量的关系, 中维生素A含量的关系,将同种属的大 白鼠按性别相同,年龄、 白鼠按性别相同,年龄、体重相近者 配成对子, 配成对子,共8对, 并将每对中的两 头动物随机分到正常饲料组和维生素 E 缺乏组 , 过一定时期将大白鼠杀死 , 缺乏组,过一定时期将大白鼠杀死, 测得其肝中维生素A的含量,见下表, 测得其肝中维生素A的含量,见下表, 问不同饲料的大白鼠肝中维生素A 问不同饲料的大白鼠肝中维生素 A 含 量有无差别? 量有无差别?
二. 配对设计的 t、u检验
配对设计
这是一种比较特殊的设计方式, 这是一种比较特殊的设计方式 , 能够 很好地控制非实验因素对结果的影响, 很好地控制非实验因素对结果的影响 , 该设计有以下几种情况: 该设计有以下几种情况: ① 对同对的两个受试对象分别给予两 种处理( 异体配对) 种处理 ( 异体配对 ) ; ② 对同一受试 对象分别给予两种处理( 自身配对) 对象分别给予两种处理 ( 自身配对 ) , 目的都是推断两种处理的效果有无差 同一受试对象处理前后的比较; 别。③同一受试对象处理前后的比较; 目的是推断该处理有无作用。 目的是推断该处理有无作用。
u检验
u检验、t检验、F检验、X2检验常用显著性检验1.t检验适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。
包括配对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆。
2.t'检验应用条件与t检验大致相同,但t′检验用于两组间方差不齐时,t′检验的计算公式实际上是方差不齐时t检验的校正公式。
3.U检验应用条件与t检验基本一致,只是当大样本时用U检验,而小样本时则用t检验,t检验可以代替U检验。
4.方差分析用于正态分布、方差齐性的多组间计量比较。
常见的有单因素分组的多样本均数比较及双因素分组的多个样本均数的比较,方差分析首先是比较各组间总的差异,如总差异有显著性,再进行组间的两两比较,组间比较用q检验或LST检验等。
5.X2检验是计数资料主要的显著性检验方法。
用于两个或多个百分比(率)的比较。
常见以下几种情况:四格表资料、配对资料、多于2行*2列资料及组内分组X2检验。
6.零反应检验用于计数资料。
是当实验组或对照组中出现概率为0或100%时,X2检验的一种特殊形式。
属于直接概率计算法。
7.符号检验、秩和检验和Ridit检验三者均属非参数统计方法,共同特点是简便、快捷、实用。
可用于各种非正态分布的资料、未知分布资料及半定量资料的分析。
其主要缺点是容易丢失数据中包含的信息。
所以凡是正态分布或可通过数据转换成正态分布者尽量不用这些方法。
8.Hotelling检验用于计量资料、正态分布、两组间多项指标的综合差异显著性检验。
计量经济学检验方法讨论计量经济学中的检验方法多种多样,而且在不同的假设前提之下,使用的检验统计量不同,在这里我论述几种比较常见的方法。
在讨论不同的检验之前,我们必须知道为什么要检验,到底检验什么?如果这个问题都不知道,那么我觉得我们很荒谬或者说是很模式化。
检验的含义是要确实因果关系,计量经济学的核心是要说因果关系是怎么样的。
那么如果两个东西之间没有什么因果联系,那么我们寻找的原因就不对。
第5讲 t检验与u检验(2004)
均数差异的假设检验假设检验的具体方法,通常是以选定的检验统计量来命名的,如t检验要用特定的公式计算检验统计量t值,u检验要用特定的公式计算检验统计量u值。
应用时首先要了解各种检验方法的用途、应用条件和检验统计量的计算方法。
一、单组完全随机化设计资料均数的t检验和u检验从一个总体中完全随机地抽取一部分个体进行研究,这样的设计称为单组完全随机化设计(completely randomized design of single group)。
例题1:根据大量调查,已知健康成年男子脉搏均数为72次/分,某医生在某一山区随机抽查了25名健康成年男子,求得其脉搏均数为74.2次/分,标准差为6.0次/分,能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数?这两个均数不等有两个可能:(1)由于抽样误差所致;(2)由于环境条件的影响。
如何作出判断呢?在统计上是通过假设检验来回答这个问题。
以下介绍建设检验(t检验)的思想方法与步骤。
1、建立检验假设和确定检验水准H0:μ1=μ0(=72次/分):H1:μ1≠μ0(=72次/分):α=0.05本例分析目的是比较山区成年男子脉搏样本均数与一般成年男子脉搏总体均数有无差别?μ是未知的,可以假设μ等于某一定值μ0,μ与μ0的差等于零,这样的假设称为无差异假设或零假设(null hypothesis) 记为H0:μ1=μ0表示该山区的环境条件对脉搏数无影响,他们之间的差异是由于抽样误差所致。
与零假设相对立的假设称为对立假设或备择假设(alternative hypothesis), 符号为H1,它是在拒绝H0的情况下而接受的假设。
假设检验所用的检验统计量一般都是建立在零假设的基础上,因为H0比较单纯明确,而H1却包含着各种情况。
检验水准(size of test )亦称显著性水准(significance level),符号为α,在实际工作中常取0.05 或0.01。
第六章 t检验和u检验
(
x1 )2 / n1 x22 n1 n2 2
(
x2 )2
/ n2
1051 (67)2 / 5 3162 (136)2 / 6 25.837 562
s
x1 x2
s
2 c
(
1 n1
1
n2
)
11 25.837 ( ) 3.078
56
t x1 x 2 (1 2 ) 13.40 22.70 0 3.012
d 750( g) d 2 93500 n 10
d d 750 75( g) n 10
sd
d 2 ( d)2 / n n1
93500 (750)2 / 10 64.33(g) 10 1
sd
sd n
64.33 10
20.34(g)
t d 0 75 0 3.68
医学结论:再障患者的平均血 红蛋白量与正常成年女子的平 均血红蛋白量不同,前者低于 后者。
二、成对资料样本均数的比较 什么是成对资料 1、自身对照资料 2、配对对照资料
表 10-1、家兔骨折愈合强度测试结果(单位: g)
动物号
1 2 3 4 5 6 7 8 9 10
电刺激侧
350 350 280 170 140 220 180 200 220 200
第七讲 t 检验和u 检验
第一节 t 检验 (Student t - test)
t 检验的作用:
主要用于比较两个均数之 间的差异是否显著,既可推断 样本均数是否来自某一个已知 的总体,也可以推断两个样本 均数是否来自同一个总体。
一、样本均数与总体均数的比较
基本思想:
首先假设样本来自已知总体,然后用 标准误来度量样本均数与总体均数的差异, 如果两者的差异超过抽样误差所能解释的 范围,则认为假设是错误的,样本不是来 自已知总体。反之,则认为样本来自已知 的总体。
04t检验和u检验
TTEST过程执行成组设计的来自正态总体的两个样本均数比较的t检验。它具有对两样本方差齐性比较的的F检验功能,计算t值与t’值,并给出相应的p值。
1. TTEST过程的语句组成。
*PROC TTEST options;
*CLASS variable;
VAR variable;
M(Sign) 3.5 Pr>=|M| 0.0156
Sgn Rank 14 Pr>=|S| 0.0156
W:Normal 0.896401 Pr<W 0.3222
Quantiles(Def=5)
略
Extremes
略
从上面的结果来看:
正态性检验:W=0.896401,p<W=0.3222,说明d(d=x1-x2)服从正态分布,t检验适用条件满足。
第四章
数值资料的参数统计推断,按推断目的不同分为两大类:总体参数的区间估计及总体参数的假设检验。其中应用最广泛的是总体均数的区间估计及总体均数的假设检验。PROC MEANS过程可以进行总体均数的区间估计,而总体均数的假设检验,依据研究设计类型的不同分别由PROC MEANS过程和PROC TTEST过程完成。
t检验:T(Mean=0)=-2.01284,Pr>|T|=0.0750>0.05,按α=0.05水平,尚不能
拒绝总体均数为零的假设,即可认为装瓶机工作正常。
例4.3若上例仅已知n=10, =490.3,s=15.2392,及μ0=500,则SAS程序为:
DATA A;
N=10;MEAN=490.3;SD=15.2392;MU=500;赋初值
T=(MEAN-MU)/(SD/SQRT(N));DF=N-1;计算t统计量及其自由度
第06讲 t检验
s
s4 x
2
x1
sx
2
2
2
1
s4 x
2
n1 1 n2 1
t 检验
• Satterthwaite法近似t检验、Welch法近似t检验和 Cochran & Cox法近似t 检验 • Cochran & Cox法是对临界值校正
• Satterthwaite法和Welch法是对自由度进行校正
查表,P<0.002 拒绝H 0
正态性检验
• 正态分布有两个特征:一是对称性,二是 正态峰。若分布不对称则称偏态分布:峰 偏左,长尾向右侧拖尾,称右偏态(正偏 态);峰偏右,长尾向左侧拖尾,称左偏 态(负偏态)。下图分别为两个特征的示 意图。
负偏态
正 态
正偏态
-5
-4
-3
-2
-1
0
1
2
3
4
5
t
尖峭峰 正态峰 平阔峰
H0:d=0,A、B两法测量结果相同
H1:d≠0, A、B两法测量结果不相同
=0.05。
t d sd 8.125 2.366 n 13.735 / 16
按 = n-1=15,查t值表,则0.02<P<0.05,拒绝H0, 可认为A、B两法测量结果不相同,B法结果高于A法。
三、两独立样本t检验
• 介绍Satterthwaite法和Cochran & Cox法
三种形式的t检验比较
资料
样本均数 和总体均 数比较
检验假设 应用条件
H0 : 0 H0 : d 0 H0 : 1 2
计算公式
t X 0 s n
医学统计学--t检验和u检验PPT课件
562500
7
3450
8
3050
2500 1750
550
302500
合计
—
—
1050 1102500
1. 建立假设,确定检验水准
H0:d 0 两种饲料喂养的大白鼠肝中维生素含量相等 ;
H1:d 0
两种饲料喂养的大白鼠肝中维生素含量不 等。
0.05
2. 选择检验方法,计算统计量 t d 0 812.5 4.207 sd n 546.25 / 8
代入公式,得:
2953.43 182.52 1743.16 141.02
SC2
12 12 13 2
13 17.03
S X1 X 2
17.03 1 1 1.652 12 13
– 按公式计算,算得:
t 15.2110.85 2.639 1.652
• 确定P值,作出推断结论 两独立样本t检验自由度为 =n1+n2-2 =12+13-2=23; 查t界值表,t0.05(23)=2.069,t0.01(23)=2.807.
四 u 检验
1、样本与总体的u检验
u X 0 0 n
u X 0
Sn
2、两样本的u检验
u
x1 x2
s12
s
2 2
n1 n2
σ0已知 σ0未知
第二节 第一类错误与第二类错误
假设检验是反证法的思想,依据 样本统计量作出的统计推断,其推断 结论并非绝对正确,结论有时也可能 有错误,错误分为两类。
n 1 81 7
3.确定P值,判断结果
查t界值表,P 0.005 ,按 0.05 水准,拒绝H0 ,接受H1,可认为两 组大白鼠肝中维生素A的含量不等,维 生素E缺乏饲料组的大白鼠肝中维生素 A含量低。
t检验和u检验 统计学
t检验和u检验统计学§9.4 t 检验和u 检验♦ 假设检验的方法通常是以选定的检验统计量而命名的,如t 检验和u 检验♦ t 检验(t -test )的应用条件: ①正态性 变量x 服从正态分布 ②方差齐性 两总体方差相等一、样本均数与总体均数的比较♦ 总体均数 是指已知的理论值或经大量观测所得到的稳定值,记作μ0例9-15 已知某小样本中含CaCO 3的真值是20.7mg/L 。
现用某法重复测定15次,CaCO 3含量(mg/L )如下,问该法测得的均数与真值有无差别?20.99 20.41 20.62 20.75 20.10 20.00 20.80 20.910 1 2 3 4 5-1-2-3-4-50.00.1 0.2 0.3 0.4ν=3 ν=1ν=∞ (标准正态分布)22.60 22.30 20.99 20.41 20.50 23.00 22.601.建立假设,确定检验水准H0:μ=μ0H1:μ≠μ0α=0.052.选定检验方法,计算检验统计量t值x=ΣX/n=316.98/15=21.13S=()122-∑-∑nnxx=()1151598.31698.67112--=0.98按公式9-16计算t=1598.07.2013.21-=1.703.确定P值,判断结果ν=n-1=15-1=14查表9-8 t界值表,t0.05,14=2.145现t=1.70,1.70<2.145,故P>0.05,按α=0.05水准,不拒绝H0,尚不能认为该法测得的均数与真值不同(统计结论)。
表9-8 t界值表自由度概率Pν双侧: 0.10 0.05 0.02 0.01单侧: 0.05 0.025 0.01 0.0051 6.314 12.706 31.821 63.6572 2.920 4.303 6.965 9.9253 2.353 3.182 4.541 5.8414 2.132 2.776 3.747 4.6045 2.015 2.571 3.365 4.0326 1.943 2.447 3.143 3.7077 1.895 2.365 2.998 3.4998 1.860 2.306 2.896 3.3559 1.833 2.262 2.821 3.25010 1.812 2.228 2.764 3.16911 1.796 2.201 2.718 3.10612 1.782 2.179 2.681 3.05513 1.771 2.160 2.650 3.01214 1.761 2.145 2.624 2.97715 1.753 2.131 2.602 2.94716 1.746 2.120 2.583 2.92117 1.740 2.110 2.567 2.89818 1.734 2.101 2.552 2.87819 1.729 2.093 2.539 2.86120 1.725 2.086 2.528 2.845单侧: 0.05 0.025 0.01 0.00521 1.721 2.080 2.518 2.83122 1.717 2.074 2.508 2.81923 1.714 2.069 2.500 2.80724 1.711 2.064 2.492 2.79725 1.708 2.060 2.485 2.78726 1.706 2.056 2.479 2.77927 1.703 2.052 2.473 2.77128 1.701 2.048 2.467 2.76329 1.699 2.045 2.462 2.75630 1.697 2.042 2.457 2.750 40 1.685 2.021 2.423 2.704 50 1.676 2.009 2.403 2.678 60 1.671 2.000 2.390 2.660 70 1.667 1.994 2.381 2.648 80 1.664 1.990 2.374 2.639 90 1.662 1.987 2.368 2.632 100 1.660 1.984 2.364 2.626200 1.653 1.972 2.345 2.601 500 1.648 1.965 2.334 2.586 ∞1.645 1.9602.326 2.576二、配对数据的比较♦ 配对设计 (要求基线情况相同) ①自身比较,是指处理前后比较②平行比较,每个样品同时用两种方法检验③成对比较,两个基本条件一致的个体构成一个对子,分别给予两种处理♦ 检验统计量t 值按公式9-24计算t =d S d 0-=n S d d, ν=n -1 (9-24)d:差值的均数d S :差值均数的标准误S d :差值的标准差 n :对子数S d =()122--∑∑n nd d例9-16 应用某药治疗8例高血压患者,观察患者治疗前后舒张压变化情况,如表9-9,问该药是否对高血压患者治疗前后舒张压变化有影响?表9-10 用某药治疗高血压患者前后舒张压(mmHg )变化 病人编号治疗前 治疗后 差值d ⑴ ⑵ ⑶ ⑷=⑵-⑶1 96 88 82 112 108 43 108 102 64 102 98 45 98 100 -26 100 96 47 106 102 4 81009281.建立假设,确定检验水准μd =0, H 0:μd =0 H 1:μd ≠0 α=0.05 2.选择检验方法,按公式9-24计算检验统计量t 值t =d S d 0-=dS dd =n d∑=836=4.50S d =()122--∑∑n nd d=188362322--=3.16d S =n S d=816.3=1.12t =dS d =12.150.4=4.023.确定P 值,判断结果自由度ν=n -1=8-1=7,查表9-8 t 界值表,t 0.05,7=2.365,今4.02>2.365,故P <0.05,故按α=0.05水准,拒绝H 0,接受H 1(统计推论),可以认为该药有降低舒张压的作用(实际推论)。
t检验和u检验-6版
和Cochran & Cox法近似t检验。其中Cochran &
Cox法是对临界值校正 ;而Satterthwaite法和 Welch法是对自由度进行校正。
第三节
t 检验中的注意事项
第四节
假设检验中两类错误
• 假设检验是针对H0,利用小概率事件的原理对总 体参数做出统计推论。无论拒绝H0还是接受H0,
2
41.2 217.26 8
2
982
0.459
1 1 S X1 X 2 0.459 0.329 9 8
得出统计量t 值:
t | 2.656 5.150 | 7.581 0.329
查t界值表,t0.05/2,15=2.131, t t0.05/2,(15),P 0.05,按
药物治疗
1
? =
推 断
药物治疗合 并饮食疗法
2
甲组 n1=12 =15.21 XX 1
乙组
n2=13 =10.85 X2
实例分析
例7-1
以往通过大规模调查已知某地新生儿出生
体重为3.30kg.从该地难产儿中随机抽取35名新生 儿作为研究样本,平均出生体重为3.42kg,标准差为 0.40kg,问该地难产儿出生体重是否与一般新生儿 体重不同? 本例已知总体均数0=3.30kg,但总体标准差未
3.检验步骤 建立检验假设,确定检验水准 ◦ H0:1=2,两种环境中运动者的心肌血流量的
总体均数相同;
◦ H1:12,两种环境中运动者的心肌血流量的
总体均数不同;
◦ 0.05。 计算检验统计量
由原始数据得:
Two sample t-test
代入公式得:
4.3t检验和u检验
当两样本均大于50,即使总体分布偏离正态,其 样本均数仍近似正态分布,可用 u 检验。
x1 x2 u Sx x
1 2
x1 x2
2 2 S1 S2 n1 n2
假设检验的注意事项
1. 严密的研究设计
这是假设检验的前提。包括随机抽样和组 间的可比性等。
2. 选择适宜的假设检验方法
① σ 未知但 n 较大(如 n > 100) ② n 较小但σ 已知。
1. 样本均数与总体均数比较的 t 检验
样本均数与已知总体均数(理论值、标准值或经过
大量观察所得的稳定值)比较的目的,是推断样本所
代表的未知总体均数 u 与已知总体均数 u0有无差别。
x u0 t S n
若 n 较大,则t . t . , 可按算得的 t 值用 v = ∞ 查 t 界值表( t 即为 u )得P值。
2 x1 2 2 x2 2 x1 x2 n1 n2 n1 1 n2 1
2 n1 1S12 n2 1S 2
2 Sc
n1 n2 2
4. 成组设计两样本均数比较的 u 检验 当n 较大或总体标准差已知时,t 分布与 标准正态分布很接近,此时可用 u 检验。
3. 成组设计两样本均数比较的 t 检验
x1 x2 t Sx x
1 2
v n1 n2 2
S x x 为两样本均数差值的标准误 1 2
1 1 S n n 2 1
2 c
Sx x
1
2
在两总体方差相等的条件下,可将两方差合并, 求合并方差(pooled variance) S
2. 配对设计均数比较的 t 检验(配对t 检验)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
均数差异的假设检验假设检验的具体方法,通常是以选定的检验统计量来命名的,如t检验要用特定的公式计算检验统计量t值,u检验要用特定的公式计算检验统计量u值。
应用时首先要了解各种检验方法的用途、应用条件和检验统计量的计算方法。
一、单组完全随机化设计资料均数的t检验和u检验从一个总体中完全随机地抽取一部分个体进行研究,这样的设计称为单组完全随机化设计(completely randomized design of single group)。
例题1:根据大量调查,已知健康成年男子脉搏均数为72次/分,某医生在某一山区随机抽查了25名健康成年男子,求得其脉搏均数为74.2次/分,标准差为6.0次/分,能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数?这两个均数不等有两个可能:(1)由于抽样误差所致;(2)由于环境条件的影响。
如何作出判断呢?在统计上是通过假设检验来回答这个问题。
以下介绍建设检验(t检验)的思想方法与步骤。
1、建立检验假设和确定检验水准H0:μ1=μ0(=72次/分):H1:μ1≠μ0(=72次/分):α=0.05本例分析目的是比较山区成年男子脉搏样本均数与一般成年男子脉搏总体均数有无差别?μ是未知的,可以假设μ等于某一定值μ0,μ与μ0的差等于零,这样的假设称为无差异假设或零假设(null hypothesis) 记为H0:μ1=μ0表示该山区的环境条件对脉搏数无影响,他们之间的差异是由于抽样误差所致。
与零假设相对立的假设称为对立假设或备择假设(alternative hypothesis), 符号为H1,它是在拒绝H0的情况下而接受的假设。
假设检验所用的检验统计量一般都是建立在零假设的基础上,因为H0比较单纯明确,而H1却包含着各种情况。
检验水准(size of test )亦称显著性水准(significance level),符号为α,在实际工作中常取0.05 或0.01。
2、选定检验方法和计算统计量本例:n=25, -x=74.2次/分,S=6.0次/分。
检验统计量公式为:1-n , 0=-=νμxs x t将以上数据代入公式,得:241-25 , 1.833 25/0.60.722.74===-=νt要根据研究类型和统计推断目的选用不同检验方法,不同检验方法有相应的检验统计量,本例的检验统计量t 服从 ν=n-1 的 t 分布。
建设检验方法通常是以检验统计量来命名的,故,本例检验称为t 检验。
3、确定P 值和作出推断结论查t 界值表, 得出结论为,按α=0.05水准,拒绝H 0 ,接受H 1 认为该山区的成年男子脉搏均数高于一般的成年男子脉搏均数。
关于检验水准是取0.05、0.01或其他数值,要根据不同的实验而定。
α取值较小,有利于提高“阳性”统计检验结果的可靠性;α取值较大,有利于发现研究总体可能存在的差异,但可靠性降低。
较好的做法是精确地计算出P 值, 这会对人们认识你所作的实验有很大的参考价值。
二、 随机化配对设计资料均数的t 检验配对设计资料分三种情况:(1)配成对子的同对受试对象分别给予两种不同的处理;(2)同一受试对象分别接受两种不同处理;(3)同一受试对象处理前后的比较。
同对或同一受试对象分别接受两种不同处理结果的比较,其目的是推断两种处理的效果有无差别;自身处理前后结果的比较,其目的是推断某种处理有无作用。
因此,应该首先计算出各对差值d 的均数。
当两种处理结果无差别或某种处理不起作用时,理论上差值 d 的总体均数μd =0。
故可将配对设计资料的假设检验视为样本均数与总体均数μd =0的比较,配对设计资料以小样本居多,故常用t 检验。
其计算公式为:1-n , /==-=νμnd dddd t s s例题2、将大白鼠配成8对,每对分别饲以正常饲料和缺乏维生素E 饲料,测得两组大白鼠肝中维生素A 的含量如下表,试比较两组大白鼠中维生素A 的含量有无差别。
表 不同饲料组大白鼠肝中维生素A 的含量(U/g )大白鼠 配对号 正常饲料组 维生素E 缺乏组 差数,dd 21 3550 2450 1100 12100002 2000 2400 -400 1600003 3000 1800 1200 14400004 3950 3200 750 5625005 3800 3250 550 3025006 3750 2700 1050 11025007 3450 2500 950 9025008 3050 1750 1300 1690000 合计----650073700001) H 0: μd =0, H 1: μd ≠ 0, α=0.05 2)计算统计量7 4.2070, 193.12980-812.5 /)/(1298.193)18(88/)6500(7370000)1(/)(dS (U/g)812.5 86500222d ===-==-⨯-=--=====∑∑∑νμnS d t g U n n n d n S nd d d dd3)确定P 值下结论查t 界值表(双側),t > t 0.01, 7 =3.499, P<0.01 结论:按 α=0.01 水准,拒绝H 0,接受H 1。
4)题目结论:可以认为两种饲料喂养的大白鼠肝中维生素A的含量有差别,正常饲料组比缺乏维生素E饲料组的含量要高。
例3:胃癌或巨型胃溃疡13人, 在实行全胃切除术前后的体重(kg )如下:试比较手术前后体重有无变化?时间 1 2 3 4 5 6 7 8 9 10 11 12 13术前 42.5 48.0 39.0 46.0 58.5 47.5 39.0 58.0 51.0 43.0 38.0 50.0 57.5 术后 52.0 51.5 45.0 52.5 49.0 55.0 52.0 52.0 50.5 50.0 41.0 51.5 72.2d 9.50 3.50 6.00 6.50 -9.50 7.50 13.0 –6.0 -0.5 7.00 3.00 1.50 14.701、H 0: μd =0, H 1: μd ≠ 0, α=0.052、计算统计量12, 2.27 1.9044.323)(1.904 S (kg)323.4132.56d ========∑νt kg nS nd d d3、确定P 值下结论查t 界值表(双側),t > t 0.05, 12 =2.179, P<0.05 结论:按 α=0.05 水准,拒绝H 0,接受H 1。
4、题目结论:可以认为术前后体重有显著性差别。
三、 两组完全随机化设计资料均数的t 检验与u 检验 1、t 检验将受试对象完全随机地分配到两组中,这两组分别接受不同的处理。
这样的设计称为两组完全随机化设计(completely randomized design of two groups )。
有些研究设计既不能作自身对比,也不便于配对。
如实验中只有把受试动物杀死后才能获得所需数据,则不可能对动物在处理前后各进行一次测定;再如比较两种治疗方法对同一疾病的疗效,每个患者一般只能接受一种方法的治疗,把受试患者配成若干对在实际工作中又非常困难,这时只能进行两组间均数的比较。
在两组比较的资料中,每个观察对象都应按照随机的原则进行分组,两组样本量可以相同,也可以不同,但只有在两组例数相同时检验效率才最高。
统计量计算公式为:2121x 212121S X)()(xxx X S X X t ---=---=μμ221-+=n n ν⎪⎪⎭⎫ ⎝⎛++-+-+-=+=∑∑∑∑-2121222221212121112/)(/)()11(221n n n n n X x n x xn n S S c x x)1()1()1()1(212222112-+--+-=n n S n S n S c例题 某医院研究乳酸脱氢同工酶(LDH )测定对心肌梗死的诊断价值时,曾用随机抽样方法比较了10例心肌梗死患者与10例健康人LDH 测定值的差别,结果如下,试问LDH 测定值在两组间有无差别?患者(X 1) 23.2 45.0 45.0 40.0 35.0 44.1 42.0 52.5 50.0 58.0 健康人(X 2) 20.0 31.0 30.5 23.1 24.2 38.0 35.5 37.8 39.0 131.0(1)、H 0:μ1=μ2 H 1:μ1≠μ2 α=0.05本例:74.6S ,01.31X ,59.10025X ,10.310X ,1064.9S ,48.43X ,30.19742X ,80.434X ,10222222112111==========∑∑∑∑n n(2)、计算统计量:将上述数据代入公式,得:182-1010 ,3506.37217.301.3148.43(%)7217.3)101101(2101010/10.31059.1002510/8.434230.19742221=+==-==+-+-+-=-νt S x x(3)、确定P 界作出结论 本例 t > t 0.05,18 =3.197, P<0.05(4)、结论: 按α=0.05 水准,拒绝H 0,接受H 1。
可以认为乳酸脱氢同工酶测定值在心肌梗死与健康人之间有差别,心肌梗死患者的含量比健康人的要高。
如果例3用随机样本设计的t 检验计算得到如下结果:0875.7S 8615.51X 132585.7S 5385.47X 13222111======、、、、n n242-1313 ,536.18145.2323.48145.2861.51538.47)(8145.2)131131(213130875.71-135857.21-132221=+===-==+-++=-νt kg S x x )()(查t 界值表(双側),t < t 0.05, 24 =2.064, P > 0.05结论:按 α=0.05 水准,接受H 0, 可以认为术前后体重有显著性差别。
2、 U 检验(两大样本均数的假设检验)以两个正态或非正态总体独立地抽取含量分别为n 1 和 n 2 的样本,当n 1 和 n 2均较大时,比如均大于100时,那么样本均数的和与差的分布也服从正态分布,即:)n ( ),(~)(2221212121⎥⎦⎤⎢⎣⎡+-±σσμμn N X X故当两样本均数较多时,即使总体分布呈偏离正态,其样本均数的分布仍近似正态分布,且这时用S 估计σ的误差较小,故可用u 检验,即用正态分布的原理作两个均数间的假设检验。
关于非正态分布资料均数差别的检验医学上有许多资料是服从正态分布的,但有不少资料不是正态分布,例如血清抗体滴度、传染病潜伏期、动物对毒物的耐受量等。