第4章 t检验和Z检验
假设检验与样本数量分析①——单样本Z检验和单样本t检验
X
32.03 + 32.14 + … + 31.87 15
…
1.9 2.0
…
0.029 0.023
…
0.028 0.022
…
0.027 0.022
…
0.0226 0.020
…
0.025 0.020
…
0.024 0.019
…
0.024 0.019
…
0.023 0.018
原假设 (零假设)即上述的可能,符号是H0
备择假设(与原假设对立的假设),符号是H1
如本例:假设外径尺寸 H0:(μ = 32) H1: (μ≠32) 确立检验水准: α——显著水平(通常取α=0.05)
显著水平α是当原假设正确却被拒绝的概率 通常人们取0.05或0.01 这表明,当做出接受原假设的决定时,其正确的可 能性(概率)95% 或99% 概率是0~1之间的一个数,因此小概率就是接近0的 一个数 英国统计家Ronald Fisher 把0.05作为标准,从此0.05 或比0.05小的概率都被认为是小概率
8 作出不拒绝零假设的统计结论,即外径尺寸 均值没有偏离目标Ф 32
<6>
单样本 Z 检验 单样本 t 检验
预备知识
接上页
假设检验的例子(1)
检验 α = 0.05
临界值 临界值
2
=0.025
拒绝范围
1 – α = 95%
不拒绝H0范围
2
=0.025
根据小概率原理,可以先假设总体参数的 某项取值为真,也就是假设其发生的可能 性很大,然后抽取一个样本进行观察,如 果样本信息显示出现了与事先假设相反的 结果(显示出小概率),则说明原来假定 的小概率事件(一次实验中是几乎不可能发 生)在一次实验中居然真的发生了,这是 一个违背小概率原理的不合理现象,因此 有理由怀疑和拒绝原假设;否则不能拒绝 原假设。 在给定了显著水平α 后,根据容量为n的样 本,按照统计量的理论概率分布规律,可 以确定据以判断拒绝和接受原假设的检验 统计量的临界值。 临界值将统计量的所有可能取值区间分为 两个互不相交的部分,即原假设的拒绝域 和接受域。
t检验医学统计学PPT课件
[
sc2
( x12
x1)2 ][ n1
( x22
n1 n2 2
x2)2 ] n2
(n1 1)s12 (n2 1)s22 n1 n2 2
第36页/共78页
例8-7 :
表8-4 男女大学生的血清谷胱甘肽过氧化酶(GSH-PX)
性别 例 数 均 数 标准差 男 48 96.53 7.66 女 46 93.73 8.23
身高与以往男子平均身高相等
H1:µ≠µ0=170cm,即即现在该地20岁男子平均
身高与以往男子平均身高不等
α= 0.05,双侧检验
第9页/共78页
⑵ 选定检验方法,计算检验统计量 根据题目资料类型,可见,该资料是样本与
总体之间的比较,且σ已知可用样本-总体的Z
检验。依公式计算检验统计量:
z x 0 x 0
值样本是否来自零总体(μd=0 ),如来自零总体
,则两方法检测值相同,如不是来自零总体,则 表明两方法检测值的不一致,不是由抽样误差引 起,而是来自不同的总体。
第25页/共78页
⑴ 建立检验假设,确定检验水准
H0:µd=0,即两方法检测结果相同 H1:µd≠0,即两方法检测结果不同 α= 0.05 ,双侧检验
第6页/共78页
在 H0 成立的前提条件下,检验统计量计算公式:
① σ已知或σ未知但n足够大:
z x
x
( )
② σ未知且n较小:
t x μ0 x μ0
sx
s n
第7页/共78页
(n1)
例8-1 根据大量调查得知,某地20岁健康成年男子平 均身高为170cm,标准差为cm。今随机抽查了该地25 名健康成年男子,求得其身高均数为172cm,标准差 为cm,能否据此认为该地现在20岁成年男子平均身高 与以往不同?
t检验和Z检验
药物治疗
1
? =
药物治疗合 并饮食疗法
2
推断
甲组
n1=12
XX1 =15.21
乙组 n2=13 X 2=10.85
t 检验——问题提出
▪ 根据研究设计,t检验有三种形式:
➢单个样本的t检验 ➢配对样本均数t检验(非独立两样本均数t
检验)
➢两个独立样本均数t检验
第一节 单个样本t检验
▪ 又称单样本均数t检验(one sample t test),适 用于样本均数与已知总体均数μ0的比较,目的是 检验样本均数所代表的总体均数μ是否与已知总 体均数μ0有差别。
▪ 配对设计主要有三种情况:
(1)将受试对象按某些混杂因素(如性别、年龄、窝别 等)配成对子,每对中的两个个体随机分配给两种处理 (如处理组与对照组); (2)同一受试对象或同一标本的两个部分,随机分别进 行不同处理(或测量)。 (3)同一受试对象自身前后对照。
配对t检验原理
▪ 配对设计的资料具有对子内数据一一对应的特征, 研究者应关心是对子的效应差值而不是各自的效 应值。
表 5-1 12 名儿童分别用两种结核菌素的皮肤浸润反应结果(mm)
编号
标准品 新制品 差值 d
d2
1
12.0
10.0
2.0
4.00
2
14.5
10.0
4.5
20.25
3
15.5
12.5
3.0
9.00
4
12.0
13.0
-1.0
1.00
5
13.0
10.0
3.0
9.00
6
12.0
5.5
6.5
42.25
z检验u检验、t检验、F检验、卡方检验使用条件(草稿)
z 检验/u 检验、t 检验、F 检验、卡方检验使用条件1. z 检验/u 检验(1)当样本容量30n >,即大样本时,样本相关系数r 就近似服从正态分布,经过对r 标准化变换后,则得到检验统计量:r r u σ= 或 σ=r rz 式中,r σ表示样本相关系数r 的抽样平均误差,即样本相关系数与总体相关系数之间的平均偏差。
(2)当在0ρ≠的总体中随机抽样时,样本相关系数r 并不呈正态分布,若要测定相关系数与0ρ≠的数值是否显著,或测定两个相关系数之间的差异是否显著,即从两个已知样本相关系数推断其总体相关系数是否相等的假设,费歇(Fisher )在1921年提出了如下方法: 012:H ρρ= 112:H ρρ≠11ln 21r r z r +=- 经过对r 变化,则r z 就接近正态分布。
r z 的标准差为:()r z σ= 在简单直线方程式中只有两个参数,故2m =,则()r z σ=因此,此时可用正态分布方法进行检验。
The general form of a lower-tail test, whereis the stated value for the population mean, follows.Large-Sample (30≥n ) Hypothesis Test About a Population Mean for a One-Tailed Test of the Form00:μμ≥H 0:μμ<a HTest Statistic :σ Assumed Knownn x z /0σμ-=Test Statistic :σ Estimated by s0μn s x z /0μ-=Rejection RuleUsing test statistic :Reject 0H if α<-z zUsing -p value :Reject 0H if α<-value p2.t 检验当样本容量30n <,即小样本时,如果总体相关系数0ρ=,则样本相关系数r 的抽样分布随着样本容量n 的增大而逐渐地趋近于自由度为n m -的t 分布。
t检验与z检验.PPT
差异有统计学意义(P<0.01),
故拒绝H0,认为该地男、女间红细胞数
有显著差别,男高于女。
.
24
t 检验的应用条件
1、正态性 2、方差齐性
.
25
方差齐性检验
两独立样本均数比较的t 检验,
要求相应的两总体方差相等,即方 差具有齐性。为此,我们要对两样 本的方差作统计学检验
140
27
2
150
138
-12
3
150
140
-10
4
135
135
0
5
128
135
7
6
100
120
20
7
110
147
37
8
120
114
-6
9
130
138
8
10
123
120
-3
使用配对t检验
解:1.建立检验假设,确定检验水准
H0:μd=0,假设该药不影响血红蛋白的变
化,即治疗前后总体差数为0。
H1:μd≠0 ,假设该药影响血红蛋白的变
.
21
1. H0 : μ1= μ2 ,即该地男、女红细胞数相
同,
H1 : μ1 ≠ μ2 ,该地男、女红细胞数不相
同。
α=0.05.
.
22
2. 计算Z 值
Z
X1 X2
S
2 1
S
2 2
n1 n 2
4.654.22
6.97
(0.55)2 (0.44)2
156 104
第4章 t检验和Z检验
13.5
11
21.1
11
14.8
12
15.2
12
15.6
13
18.7
❖ 建立检验假设,确定检验水准
H0:1=2 H1:12
0.05。 ❖ 计算检验统计量
由原始数据算得:n1=12,X1=182.5,X12=2953.43,n2=13,X2=141.0,
X22=1743.16, X1=ΣX1/n1=182.5/12=15.21, X 2 =ΣX2/n2=14.16/13=10.85
正常人与高血压患者的血清胆固醇含量 有差别,高血压患者高于正常人。
第六节 假设检验中两类错误
由样本推断的结果
真实结果 拒绝H0 H0成立 Ⅰ型错误
- )
不拒绝H0
推断正确(1
H0不成立 推断正确(1-b) Ⅱ型错 ❖误(b 1- b )即把握度(power of a test),也称检
验效能:两总体确有差别,被检出有差别的能力
表 5-2 25 名糖尿病患者两种疗法治疗后二个月血糖值(mmol/L)
编号
甲组血糖值(X2)
编号
乙组血糖值(X2)
1
8.4
1
5.4
2
10.5
2
6.4
3
12.0
3
6.4
4
12.0
4
7.5
5
13.9
5
7.6
6
15.3
6
8.1
7
16.7
7
11.6
8
18.0
8
12.0
9
18.7
9
13.4
10
20.7
10
教育科研中的统计方法——Z检验和t检验
教育科研中的统计方法——Z检验和t检验乌海市海勃湾区教研室王根运通常我们用平均分比较两个班的成绩的优劣是不妥的。
即某次考试中初二、二班数学成绩平均分低于初二、五班的平均分,不一定说明初二、二班数学真实成绩比初二、五班的差。
这是因为一个班的的平均成绩具有统计意义,存在抽样误差,其平均成绩在一定范围内波动,假如再进行一次考试也许初二、二班数学成绩平均分高于初二、五班的平均分。
所以比较成绩时应用平均数差异的显著性检验更科学。
统计学中平均数差异的显著性检验时规定一个显著性水平,经过检验所得差异超过这个显著性水平,表明这个差异不属于抽样误差,确实存在差异,反之属于抽样误差。
这个平均数差异的显著性检验在教育科研统计中总结为Z检验或t 检验。
一般地样本容量大于30时,用Z检验;样本容量小于30时,用t检验。
当问题所给的条件用t检验方便时,样本容量虽然大于30,也可以用t检验。
下面是样本容量大于30时的Z检验和样本容量小于30时的t检验案例。
一、样本容量大于30时的Z检验案例:比较初三第一学期期末实验班和对比班的化学成绩表1、初三、八班(实验班)第一学期期末化学成绩表表2、初三、七7班(对比班)第一学期期末化学成绩表时间:2010年1月实验班和对比班学生人数均为52,样本容量大于30,用Z 检验看实验班和对比班成绩有无显著性差异(用计算机处理)。
实验班:初三、八班,据表1,样本容量:n 1=52,平均分:1X =11n X∑=69.84每个学生分数与平均分离差的平方和:∑21d ==-∑211)(X X 13243.86 标准差:S 1=121n d ∑=15.96对比班:初三、七班,据表2,样本容量:n 2=52, 平均分 :2X =22n X ∑=66.92每个学生分数与平均分离差的平方和:∑22d ==-∑222)(X X 7967.19标准差:S 2=222n d ∑=12.38, Z=22212121n S n S X X +-=1.043Z 检验的判断方法: 0<Z <1.96时,两个班的成绩无显著性差异;1.96<Z <2.58时,两个班的成绩成绩有显著性差异。
4第四章 假设检验、t检验和Z检验
0.05
2.选定检验方法,计算检验统计量t值
d d / n 44 / 10 4.4 sd t
d ( d ) / n
2 2
d sd / n
n 1 4.4 2.12 / 10
234 (44) 2 / 10 2.12 10 1 v 10 1 9
0.05
2.选定检验方法,计算检验统计量t值
t x 0 s/ n 75.0 72 5.0 / 25 3.00, v 25 1 24
3.确定P值,作出推断结论 H1,差异有高度统计学意义。
P<0.05,按α=0.05水准,拒绝H0,接受
第二节 单样本t检验和Z检验
41044222???????????????????vnsdtnnddsndddd第四节两独立样本比较的t检验和z检验一方差齐性检验二两独立样本t检验三两独立样本t检验四两独立样本z检验2111222211sfnns?????较大较小1121111212122221121212212121nnnnsnsnxxnnsxxsxxtcxx??????????????22212121nsnsxxt???2222212211xxxxsststst????????221121212221212111nsnsxxssxxsxxzxxxx?????????两独立样本t检验例45某医生为探讨强迫症与超氧化物歧化酶sod的关系随机抽得30例强迫症患者测得sod的均数为30125numl标准差为2801numl
2 2
0.05
5.4086
3.确定P值,作出推断结论
有高度统计学意义。
P<0.01。按α=0.05水准,拒绝H0,接受H1,差异
《统计学(第二版)》电子课件 第4章 假设检验
显著性检验本身对原假设起保护作用,水平越小, 检验犯第一类错误的概率就越小,换言之,越有 可能不拒绝原假设。
2021/8/7
《统计学》第4章假设检验
4-29
4.1.5 双侧检验和单侧检验
常见的三种显著性假设检验形式: (1)双侧检验 H0 : 0 H1 : 0 (2)右侧检验 H0 : 0 H1 : 0 (3)左侧检验 H0 : 0 H1 : 0
从该批产品中随机抽取了100件,发现其中有4件 次品,即样本次品率为4%,A公司认为样本次品 率4%大于1%,所以不接受B公司的这批产品,B 公司则认为虽然样本次品率为4%,但并不能说明 10万件产品的次品率大于1%,因为样本量很小;
2021/8/7
《统计学》第4章假设检验
4-3
问题
(1)A公司是否应该接受该批产品? (2)如果随机抽取了100件产品有3件次品,
H0:pp01%
2021/8/7
《统计学》第4章假设检验
4-12
记X为100件产品中次品的数目,直观上看, X越大,原假设越值得怀疑,反之, X越小, 对原假设越有利;问题是, X大到多少应 该拒绝原假设?
两种处理方法:
2021/8/7
《统计学》第4章假设检验
4-13
1. 假定H0成立,计算事件X≥4的概率
4-32
4.2 一个正态总体的检验
4.2.1 总体均值μ的检验: Z检验 考虑如下三种检验问题
H0:0 H1:0 H0:0 H1:0 H0:0 H1:0
(4.4) (4.5) (4.6)
2021/8/7
《统计学》第4章假设检验
4-33
z检验和t检验的区别
z检验和t检验的区别
卡方检验是对两个或两个以上样本率(构成比)进行差别比较的统计方法。
t检验,主要是用于小样本(样本容量小于30)的两个平均值差异程度的检验方法。
它是用t分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。
t检验的适用条件:正态分布资料。
1、卡方检验是用途非常广的一种假设检验方法,它在分类资料统计推断中的应用,
包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡仿检验以及分
类资料的相关分析等。
2、t检验,亦称student t检验( student's ttest) ,主要用作样本含量较小(比
如n大于30) ,总体标准差o未明的正态分布。
t检验就是用t原产理论去推断差异出现
的概率,从而比较两个平均数的差异与否明显。
t检验
3、t检验共分成三种方法,分别就是单一制样本t检验,接合样本t检验和单样本t
检验。
单一制样本t检验和单因素方差分析功能上基本一致,但是单一制样本t检验就可
以比较两组选项的差异,比如说男性和女性。
相对来讲,独立样本t检验在实验比较时使用频率更高,尤其是生物、医学相关领域。
针对问卷研究,如果比较的类别为两组,独立样本t检验和单因素方差分析均可实现,研
究者自行选择使用即可。
4、卡方分析:卡方检验用作分析定类数据与定类数据之间的关系情况。
比如研究人
员想要晓得两组学生对于手机品牌的偏好差异情况,则必须采用卡方分析。
卡方就是通过
分析相同类别数据的相对挑选频数和比重情况,进而展开差异推论,单选题或多选题均可
以采用卡方分析展开对照差异分析。
统计学检验方法比较
统计学检验方法比较统计学检验方法是在统计学中用来判断研究假设是否成立的一种方法。
它通过分析样本数据来推断总体参数,并根据结果得出判断。
在进行统计学检验之前,我们首先需要明确研究问题和研究假设。
接下来,我将介绍一些常见的统计学检验方法的比较。
1.T检验和Z检验T检验和Z检验都是用来推断一个样本的均值是否与总体均值有显著差异。
T检验主要用于小样本,而Z检验适用于大样本。
相较于Z检验,T检验考虑到了样本的自由度,因此对于小样本的推断更加准确。
2.单样本检验和双样本检验单样本检验用于比较一个样本的均值是否与一个已知的总体均值有显著差异。
双样本检验则用于比较两个样本的均值是否存在显著差异。
双样本检验可以进一步分为独立样本检验和配对样本检验。
独立样本检验适用于两个独立的样本,而配对样本检验适用于同一组个体在不同时间或不同处理下的两次测量。
3.卡方检验和F检验卡方检验主要用于判断两个分类变量之间是否存在相关性。
它将观察频数与期望频数进行比较,以确定差异的显著性。
F检验则用于比较两个或更多个总体方差是否相等。
它将组间离散度与组内离散度进行比较,从而推断总体方差是否存在显著差异。
4.非参数检验和参数检验非参数检验不依赖于总体的特定分布,而是对总体的分布进行较少的假设。
它通过对数据的排序和秩次转换来进行推断。
非参数检验一般适用于数据不服从正态分布或样本量较小的情况。
参数检验则建立在对总体参数分布的假设上,通常假设数据服从正态分布。
参数检验的推断结果相对较为准确,但对数据的假设要求较高。
综上所述,不同的统计学检验方法适用于不同的研究问题和数据类型。
选择合适的统计学检验方法可以提高推断结果的准确性。
因此,在进行统计学检验之前,我们需要充分理解研究问题的背景,研究假设的特点以及数据的类型和分布,从而选择适当的检验方法。
同时,还需要注意检验过程中的假设和限制,以及结果的解释和推断的合理性。
z检验与t检验的比较分析
population
sample 2
X2
……
sample r
Xr
observation X:z X (3 13) sample mean X: z X
n
is unknown
mean X: t X ,
Sn
df n 1
X
~N
,
2
n
z-distribution versus t-distribution
Testing sample X should be a sample of a normal random variable. 检验样本是 来自正态总体的随机样本
If X is not normal, t will have an unknown distribution and, strictly speaking, the t-test is inapplicable. However, according to the central limit theorem, as the sample size increases, the distribution of t tends to be normal. Therefore, if the sample size is big, we can use the t-test even if X is not normal. But there is no way to find out what value is big enough. This value depends on how X deviates from the normal distribution. Some sources claim that n should be greater than 30, but sometimes even this size is not enough. Alternatively, we can use non-parametric test: Wilcoxon rank-sign test.〔见p79,第九章〕
t检验和z检验专业知识
设H0∶μ=0,若μ确实为0,则H0实际上
是成立旳。
但是,因为抽样旳偶尔性,得到了较大旳t 值,因而t >tα ,而按所取旳检验水准, 拒绝H0 ,结论为μ≠0(假阳性),此推断当
然是错误旳,其错误旳概率为。
2.不拒绝实际上不成立旳H0 ,称为第二
类错误,它旳概率用β表达。
设H0 :μ=0,但实质上μ≠0,即H0
差别有统计学意义(P<0.01),
故拒绝H0,以为该地男、女间红细胞数
有明显差别,男高于女。
t 检验旳应用条件
1、正态性 2、方差齐性
方差齐性检验
两独立样本均数比较旳t 检验,
要求相应旳两总体方差相等,即方 差具有齐性。为此,我们要对两样 本旳方差作统计学检验
方差齐性旳检验用F 检验, 统计量F 值旳计算公式为:
A.两样本均数差别越大 B.两总体差别越大 C.越有理由以为两总体均数不同 D.越有理由以为两样本均数不同
2. 按α=0.10水准做t检验,P>0.10,不能以为两
P值很小时拒绝H0,接受H1,但
是不要把很小旳P值误以为总体均数间
差别很大。
Significance并不含“明显”之意。
7.进行统计分析后,报告成 果旳写法。
应写出统计量值、详细P值
单侧时应注明;95%CI既能阐 明差别旳大小,也具有检验旳 作用,提议使用。
选择题:
1.两个样本均数比较,经t检验,差别 有统计学意义,p越小,阐明( )
t X1 X2
S12
S
2 2
n1 n2
tα’界线值计算公式
ta
S2 X1
ta,1 S2
X1
S
2 X
第十章第四节 t检验和z检验2014.
第四节 t 检验和u检验
t-test或称Student’s t-test; u-test或称Z-test
应用: 用于两均数比较的假设检验;
资料要求: (1)资料随机取自正态总体 (2)两总体方差齐性(相等)
除上述条件外,u检验还要求: 样本含量比较大(如n≥50), 或n虽小但σ已知
(很少见)。 (t分布逼近u分布,或本身呈u分布)
注意:统计分析是 在H0前提下进行的
H0: = 0 (72次/分)
H1: > 0
单侧: = 0.05
t X 0
S/ n
74.2 72 1.833 6.0 / 25
=74.2
此图为从 0总体中抽样(n=25)得 到的样本均数分布图
=n- 1=25 -1=24 查t界值表(P302),得单侧 t0.05,24 = 1.711 因: t =1.833> t0.05,24 所以:P < 0.05
方差齐 性检验
Equa l varian ces assum ed Equa l varian ces not assume d
Leve ne 's Te st fo r Equa lity of Variance s
F
S i g.
.015
.905
t-test for Equa lity of Mea ns
x
/ n
则 u 服从标准正态分布 N(0,1)
实际工作中, 往往未知,s 代替, 此时
就不是u代换,而是 t 代换。
t X X
Sx S/ n
无数t点所组成的分布,称t分布。
t 分布的特征: (1)以 0 为中心,两侧对称的单峰分布 (2)与 u 分布比较,峰值较低,两边上翘
t检验及z检验
t检验和z检验的比较
检验类型单样本资料的t检验配对设计资料的t检验两独立样本资料的t检验两独立样本资料的z检验
应用条件当样本例数n较小,样本来自正态总体,总体标准差未知。
在作两个样本均数比较时,还要求两样本
相应的两总体方差相等。
(用于定量资料)
两个样本含量n较大(均大于50)
的情况
举例已知一个样本的指标的真值,现
在重复测定15次,问此法测得的
均数与真值有无差别(P296例)
用某药治疗8例高血压患者,观
察治疗前后舒张压的变化情况,
问该药是否对高血压患者治疗前
后舒张压变化有影响(P297例)
两组雄性大鼠(n1=12,n2=12)
分别用高蛋白和低蛋白饲料喂
养,问体重的增加有无差别
(P299例)
某医院用120名2型糖尿病患者
分成两组,用不同降血糖药,比
较两种降糖药的降血糖效果是否
不同(P299例)
假设(注意单侧和双侧假设区别)H 0:μ=μ0
H 1:μ≠μ0 α= 0.05
H 0:μd=0
H 1:μd≠0 α= 0.05
H 0:μ1=μ2
H 1:μ1≠μ2 α= 0.05
H 0:μ1=μ2
H 1:μ1≠μ2 α= 0.05
计算公式
比较,结论t>t界值(z>z界值),p≤0.05,拒绝Ho,接受H1,差异有统计学意义,可以认为······
t<t界值(z<z界值),p>0.05,不拒绝Ho,差异无统计学意义,尚不能认为······(根据题目下结论)。
T检验与Z检验中态性的理解
T检验与Z检验中态性的理解
统计书上说当样本足够大时,无论X服从什么分布,只要各X间相互独立,且Xi同分布,期望、方差有界(这一条件大多数情况都是成立的),根据中心极限定理即可得X服从正态分布。
现在问题来了,为什么书上又说无论什么情况下采用Z检验都得进行正态性检验呢,即使样本已经很大了?(注意Xi的分布和X的是不同的)
首先得明确我们的目的是什么,我们是检验总体的平均数,当该总体不服从正态分布时,所得的X(算数平均数)用来表示平均数是不恰当的,而Z检验和T检验都是检验的算数平均数与目标数的差异,所以必须在做Z、T检验前需正态性检验。
仍Z检验和T检验有一点不同的是,在X分布为非正态,n很大时,
σ/n
服从正态分布,而
就不一定服从T分布了。
所以理论上当不服从
s/n
正态分布的X的算数平均数(一定要是算数平均数)做Z检验是可以的,而做T检验是不行的。
另外有同学可能对σx 不好理解,觉得既然都是总体的均数了,那还来的标准误。
确实σx 是总体均数的标准误,但是他是把每一个Xi看成一个随机变量,而我们样本中的每一个值只是某一个Xi的一次实现(Xi 应该有无穷多个值,我们只能得到其中的一个值)。
就例如有一个总体,进行两次普查,得到两个x ,而这两个值有可能不一样,也就存在标准误了。
z检验与t检验
t
X 0 X 0 3.42 3.30 1.77 S SX 0.40 / 35 n
3. 确定P值,做出推断结论
=TDIST(1.77,34,2)
=0.085695
本例自由度n-135-134,查附表2,得t0.05/2,34=2.032。 因为t t0.05/2,34,故P0.05,表明差异无统计学意义,按 a0.05水准不拒绝H0,根据
z
X 0
0 / n
74.2 72 3.3846 6.5 / 100
A sampling distribution for H0 showing the region of rejection for a = .05 in a 2-tailed z-test(双侧z 检验) X 0 74.2 72 z 3.38 0 / n 6.5 / 100
解:0=3.30kg,未知,n=35为小样本,,S=0.40kg,故选用单样本t检验。
1. 建立检验假设,确定检验水准
H0:0,该地难产儿与一般新生儿平均出生体重相同; H1:0,该地难产儿与一般新生儿平均出生体重不同; a0.05。
2. 计算检验统计量 在μ =μ 0成立的前提条件下,计算统计量为:
检验假设 H0: 1 2 ,或 1 2 0 ;在 H0 成立的假定下,差
2 值 X1 X 2 服从正态分布 N (0, X
1 X 2
两样本均数比较 z 检验的检验统 ),
计量:
X 已知,z
1
X 2 1 2
X
1X2
, X1 X 2
SX =
SS= S=
0.003 0.018 0.006
SPSS数据分析 第四章 t检验
3. 被称为观察到的(或实测的)显著性水平
4. 决策规则:若p值<, 拒绝 H0
双侧检验的P 值
/2
拒绝H0
1/2 P 值
/2
拒绝H0
1/2 P 值
临界值 0
临界值
Z
计算出的样本统计量
计算出的样本统计量
左侧检验的P 值
抽样分布
拒绝H0
P值
异较大。其图形如下:
f(t)
ν─>∞(标准正态曲线)
ν=5
ν=1
-5.0
-4.0
-3.0
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
5.0
t
图3-3 不同自由度下的t 分布图
3.特征:
① 单峰分布,以 0 为中心,左右对称; ② 自由度 越小,则 t 值越分散,t 分布的峰部
越矮而尾部翘得越高; ③当 逼近, SX 逼近 X , t 分布逼近 u 分布,故标
解:研究者想收集证据予以证明的 假设应该是“生产过程不正常”。 建立的原假设和备择假设为
H0 : 10cm H1 : 10cm
【例】某品牌洗涤剂在它的产品说明书中声称: 平均净含量不少于500克。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设
行比较
3. 作出决策
双侧检验:统计量的绝对值 > 临界值,拒 绝H0
左侧检验:统计量 < 临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
利用 P 值 进行决策
什么是P 值?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3. 确定P值,做出推断结论 本例自由度n-135-134,查附表2,得t0.05/2,34=2.032。 因为t t0.05/2,34,故P0.05,按 0.05水准,不拒绝H0, 差别无统计学意义,尚不能认为该地难产儿与一般新生儿 平均出生体重不同。
建立检验假设,确定检验水准
H0:1=2 H1:12
0.05。
计算检验统计量
由原始数据算得:n1=12,X1=182.5,X12=2953.43,n2=13,X2=141.0, X22=1743.16, X 1 =ΣX1/n1=182.5/12=15.21, X 2 =ΣX2/n2=14.16/13=10.85
接受H1,可认为两总体方差不等; 若F<F0.05(ν
1,ν 2),P>0.05,两总体方差相等。
第五节
Z 检验
根据数理统计的中心极限定理,不论变量X的分布是否 服从正态分布,当随机抽样的样本例数足够大,样本均 数服从正态分布 N (, 2 ) 其中为原来的总体均数, 为总体标准差 为标准误 X
即H0:μ 1=μ 2,也可表述为μ 1-μ 2=0,这里可将 两样本均数的差值看成一个变量样本,则在H0条件 下两独立样本均数t检验可视为样本与已知总体 均数μ 1-μ 2=0的单样本t检验, 统计量计算公式
为:
| ( X1 X 2 ) ( 1 2 0) | | X1 X 2 | t , n1 n2 2 S X1 X 2 S X1 X 2
Sc
2
(n1 1)S1 (n2 1)S 2 n1 n2 2
2
2
实例分析
例5.3
25例糖尿病患者随机分成两组,甲组单纯用药物
治疗,乙组采用药物治疗合并饮食疗法,二个月
后测空腹血糖(mmol/L)如表5-2 所示,问两种疗 法治疗后患者血糖值是否相同?
表 5-2 编号 1 2 3 4 5 6 7 8 9 10 11 12
药物治疗
1
? =
推 断
药物治疗合 并饮食疗法
2
甲组 n1=12 X 1 =15.21
乙组
X
n2=13
X 2=10.85
t 检验——问题提出
根据研究设计,t检验有三种形式:
单个样本的t检验
配对样本均数t检验(非独立两样本均数t
检验)
两个独立样本均数t检验
第一节
单个样本t检验
又称单样本均数t检验(one sample t test),适 用于样本均数与已知总体均数μ 0的比较,目的是 检验样本均数所代表的总体均数μ 是否与已知总 体均数μ 0有差别。
代入公式,得:
2 182.5 2953 .43 2 141.0 1743 .16
SC
2
12 12 13 2
13
17.03
S X1 X 2
1 1 17.03 1.652 12 13
15.21 10.85 t 2.639 1.652
表 5-1
12 名儿童分别用两种结核菌素的皮肤浸润反应结果(mm) 编号 1 2 3 4 5 6 7 8 9 10 11 12 合计 标准品 12.0 14.5 15.5 12.0 13.0 12.0 10.5 7.5 9.0 15.0 13.0 10.5 新制品 10.0 10.0 12.5 13.0 10.0 5.5 8.5 6.5 5.5 8.0 6.5 9.5 差值 d 2.0 4.5 3.0 -1.0 3.0 6.5 2.0 1.0 3.5 7.0 6.5 1.0 39(d) d2 4.00 20.25 9.00 1.00 9.00 42.25 4.00 1.00 12.25 49.20 42.25 1.00 195(d2)
已知总体均数μ 0一般为标准值、理论值或经大量 观察得到的较稳定的指标值。 应用条件——总体标准未知的小样本资料( 如 n<50),且服从正态分布。
单个样本 t 检验原理
在 H0 : = 0的假定下, 可以认为样本是从已知总 体中抽取的,根据t分布 的原理,单个样本t检验 的公式为:
单侧时 Z0.05 1.64, Z0.01 2.33
Z 检验原理
成组设计的两样本均数比较的统计量Z值计
算中,两均数差的标准误为
S X 1 X 2 S12 / n1 S22 / n2
统计量Z值的计算公式为
X1 X 2 Z S X1 X 2 X1 X 2
25 名糖尿病患者两种疗法治疗后二个月血糖值(mmol/L) 甲组血糖值(X2) 8.4 10.5 12.0 12.0 13.9 15.3 16.7 18.0 18.7 20.7 21.1 15.2 编号 1 2 3 4 5 6 7 8 9 10 11 12 13 乙组血糖值(X2) 5.4 6.4 6.4 7.5 7.6 8.1 11.6 12.0 13.4 13.5 14.8 15.6 18.7
2 S12 / n1 S2 / n2
Z 检验——实例分析
例5-4
研究正常人与高血压患者胆固醇含量(mg%)的资 料如下,试比较两组血清胆固醇含量有无差别。 正常人组 n 506, X 1 180.6, S 34.2 1 1 高血压组
n2 142, X 2 223.6, S2 45.8
=n1+n2-2 =12+13-2=23; 查t界值表,t0.05/2,23=2.069. 由于 t t0.05/2,23,
P 0.05,
按0.05的水准,拒绝H0,接受H1,差异有统计空腹血糖值的均数不同。
几何均数资料 t 检验,服从对数正态分布,先作对数变换, 再作 t 检验。
2.4909 Sd 0.7191 n 3.464
Sd
按公式计算,得:
d 3.25 t 4.5195 S d 0.7191
3.确定 P 值,作出推断结论
自由度计算为 ν =n-1=n-1=12-1=11,
查附表2,得t0.05/2,11 = 2.201,
本例t > t0.05/2,11,
d d d 0 d t Sd Sd Sd
n
实例分析
例5.2 有12名接种卡介苗的儿童,8周后用两批不 同的结核菌素,一批是标准结核菌素,一 批是新制结核菌素,分别注射在儿童的前 臂,两种结核菌素的皮肤浸润反应平均直 径(mm)如表5-1所示,问两种结核菌素的反 应性有无差别。
第二节 配对样本均数t检验
简称配对t检验(paired t test),又称非独立两样
本均数t检验,适用于配对设计计量资料均数的比 较。 配对设计(paired design)是将受试对象按某些特 征相近的原则配成对子,每对中的两个个体随机 地给予两种处理。
配对设计概述
应用配对设计可以减少实验的误差和控制非处理 因素,提高统计处理的效率。 配对设计主要有三种情况:
配对样本t检验的基本原理是假设两种处理的效应 相同,理论上差值d的总体均数μd 为0,现有的 不等于0差值样本均数可以来自μd = 0的总体,也 可以来μd ≠ 0的总体。
配对t检验原理
可将该检验理解为差值样本均数与已知总体均数 μ d(μ d = 0)比较的单样本t检验.其检验统计 量为:
第四节 方差不齐时两样本均数检验
当两总体方差不等(方差不齐)时,两独立样本均数的比 较,可采用
t 检验,亦称近似t检验
方差齐性检验——F检验
F检验要求资料服从正态分布
检验统计量F值按下列公式计算
F
S1 (较大) S 2 (较小)
2
2
ν1=n1-1, ν2= n2-1
方差齐性检验
1.建立检验假设,确定检验水准 H0:d=0; H1:d0; 0.05。 2. 计算检验统计量本例 d = 39, d 2 195。
先计算差数的标准差
Sd
计算差值的标准误
d d n
2
2
n 1
2 39 195
12 2.4909 12 1
S
2 为较大的样本方差, 2 为较小的样本方差; 2 1
S
检验统计量F值为两个样本方差之比,若样本方差的不同
仅为抽样误差的影响,F值一般不会偏离1太远。 求得F值后,查附表3(方差齐性检验用的F界值表)得P值。
取α =0.05水准,若F≥F0.05(ν 1,ν 2),P≤0.05,拒绝H0,
未知总体 已知总体
0
样本
X
自由度=n-1
例5.1 :
以往通过大规模调查已知某地新生儿出生 体重为3.30kg。从该地难产儿中随机抽取 35名新生儿,平均出生体重为3.42kg,标准 差为0.40kg,问该地难产儿出生体重是否与 一般新生儿体重不同?
1. 建立检验假设,确定检验水准 H0:0; H1:0; 0.05。 2. 计算检验统计量
P < 0.05,拒绝H0,接受H1,差别有统计学意义,可
认为两种方法皮肤浸润反应结果有差别。
第三节 两独立样本t检验
两独立样本t 检验(two independent sample
t-test),又称成组 t 检验。
适用于完全随机设计的两样本均数的比较,其目 的是检验两样本所来自总体的均数是否相等。 完全随机设计是将受试对象随机地分配到两组中, 每组患者分别接受不同的处理,分析比较处理的 效应。
(1)将受试对象按某些混杂因素(如性别、年龄、窝别 等)配成对子,每对中的两个个体随机分配给两种处理 (如处理组与对照组); (2)同一受试对象或同一标本的两个部分,随机分别进 行不同处理(或测量)。