第四章-假设检验.PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 某校一个班进行比奈智力测验,X=110,班 级人数n=50,该测验常模0=100,0=16。 该班智力水平1(不是这一次测验结果) 是否与常模水平有差异?
研究假设和虚无假设
• 研究假设 H1 research hypothesis
– 又叫备择假设 alternative hypothesis,指待验证的 假设,一般假设差异显著
2
接
受
假
设H
,两
0
种
教
学方法无
显
著差异
Z检验和t检验
• 两种检验的前提之一
– 总体正态分布
• 当n≥50时,两种检验的临界值差不多相等, 即 Z/2 t/2 (n) (Z0.05/2 1.960, Z0.01/2 2.576
n
30 50 100 150 200 500 1000 5000
例子:
• 学生的学习成绩与教师的教学方法有关。 某校一教师采用了一种他认为新式有效的 教学方法。经过一学年的教学后,从该教 师所教班级中随机抽取了6名学生的考试成 绩,分别为48.5, 49.0, 53.5, 49.5, 56.0, 52.5, 而在该学年考试中,全年级的总平均分数 为52.0,试分析采用这种教学方法与未采用 新教学方法的学生成绩有无显著的差异 (已知考试成绩服从正态分布,取=0.05)
• 虚无假设 H0 null hypothesis
– 又叫零假设 zero hypothesis,原假设,与研究假 设对立的假设,一般假设差异不显著
• H1:1 0 • Z检验
• 取=0.05
• 接受H0:X 0 1.96 0
拒绝H0:X 0 1.96 0
或Z 1.96,或Z 1.96
2
X i X 445.82,
S22
17 7 1 i1
Yi
Y
2
425.33,
由于S12和S22差不多,可以认为方差相等,
t
120 101
1.91
12 1445.82 7 1425.33 1 1
解:
X 51.5,S 2.98, (1)建立假设
H0 : 0
H1 : 0
(2)t X 0 51.5 52.0 0.41
S n 2.98 6
(3)临界值t (5) 2.571
2
(4) t 0.41 0.41 2.571 t (5)
(
2
,
2 2
n2
)
D X
X
1
X
的分布
2
仍为
正态分
布,
D
X
=1
,不同
2
条
件下
标
准误
公式不
同
3.1.1 总体方差已知,独立样本
X,Y独立,则
2 (X
Y
)
2 X
2 Y
,
X
与
1
X
独
2
立
时,
2 D
X
SED2 X
SE2 X1
SE2 X2
2 1
2
n1 n2
30 27
所以,男女儿童的身高差异不显著。
3.1.2 总体方差已知,相关样本
设r为两变量之间的相关系数
2 ( X Y )
2 X
2 XY
2 Y
,
D X
X1 X2,
SED2 X
SE2 X1
SE2 X2
2 SE SE ,
X1
X2
SEDX
t分布的特点: (1)对称。左侧为负,右侧为正,均值为0; (2)-<t<+; (3)n 时, t分布为正态分布,方差为1;
n-1>30时, t分布为接近正态分布,方差>1, n-1<30时, t分布与正态分布相差较大,随n-1减小方差越大
n>45时, t分布与正态分布没有多大差异 在小样本n<30时, t分布具有重要作用。
(4)显然 Z 5.58 1.96,即拒绝原假设H0 可以认为该校的学生考试成绩与全市的平均成绩有 显著差异。
2.2总体正态但总体方差未知
已知样本x1, x2, xn来自正态总体X ~ N 0, 2 ,
问样本均值与总体均值之间是否有显著差异? t检验
1 建立假设
H0 : 0 H1 : 0
假设检验
本章基本内容
• 假设检验的基本原理和步骤
– 虚无假设和备择假设 – 错误和错误 – 单侧检验和双侧检验
• 差异的显著性检验
– 均值 – 方差 – 比例、相关系数
1.1 假设检验和参数估计
• 参数估计
– 用样本统计量估计总体参数
• 假设检验
– 先对总体参数提出一个假设,然后利用样本信 息检验这个假设是否成立
– 男生12人:83、146、119、104、120、161、 134、115、129、99、123
– 女生7人:70、118、101、85、107、132、94试 确定男、女生的平均成绩有无显著的差异(取 =0.05)
解: X
120,Y
101, S12
1 12 1
12 i 1
解:单侧检验
H 0 : 1 2 , H1 : 1 2 ,
SEDX
162 162 2 0.74162 1.65, 49
D Z X
SEDX
110 106 1.65 2.43 2.33 Z0.01,
即p 0.01,可以认为一年后儿童
智商有了显著的提高。
¡Ý 0 < 0
£ Z
Z < £ Z £ t(n-1) t < £ t(n-1)
× ¢ £º µ±× Ü Ìå ²» ÊÇ Õý ̬ · Ö ²¼ ʱ£¬ Èç ¹û Ñù ± ¾ ÈÝ Á¿ n¡Ý 50£¬ ¿É ÒÔ ¿¼ ÂÇ ÓÃ
Z ' X 0 À´ × ö ¼ì Ñé
1.4 假设检验的步骤
• 建立虚无假设和备择假设 • 确定适当的检验统计量 • 指定检验中的显著性水平,计算检验统计
量的值,建立拒绝虚无假设的规则 • 作出统计决策
– 将检验统计量的值与拒绝规则所指定的临界值 相比较,确定是否拒绝虚无假设
– (计算p值,利用p值确定是否拒绝虚无假设)
1.5.1 假设检验的一个例子
t0.05(n) 2.042 2.009 1.984 1.976 1.972 1.965 1.962 1.960
t0.01(n) 2.750 2.678 2.626 2.609 2.601 2.586 2.581 2.577
小结
¼Ù Éè
× Ü Ìå Õý ̬ £¬ · ½ ²î 2 ÒÑ × Ü Ìå Õý ̬ £¬ · ½ ²î 2 δ Öª £¬
Öª £¬ Z ¼ì Ñé
t ¼ì Ñé
H0
H1
ÁÙ ½ç Öµ ¾Ü ¾ø H0 ÁÙ ½ç Öµ
¾Ü ¾ø H0
Ë« ²à ¼ì Ñé µ¥ ²à ¼ì Ñé
= 0
¡Ù 0 Z/2
¡Ü 0 > 0
Z
|Z| > Z/2 Z > Z
t/2(n-1) t(n-1)
|t| > t/2(n-1) t > t(n-1)
n1
2 2
,
n2
SEDX
2 1
2 2
,
n1 n2
则Z ( X1 X 2 ) (1 2 )
SEDX
当H 0
: 1
2假设成立时,Z
X1 X2 SEDX
X1 X2
2 1
2 2
n1 n2
• 例: 某地区的六岁儿童中随机抽取男生30 人,其平均身高为114cm,抽取女生27人, 平均身高112.5cm。根据以往资料,该区六 岁男女儿童身高的标准差男童为5cm,女童 为6.5cm,问该区六岁男女儿童身高有无显 著差异? (=0.05)
• 根据以往的比分(总体信息)推断该比分是否足球 赛比分
– 从样本的差异推论总体差异的过程
1.2 假设检验的主要内容: 差异检验
样本统计量与总 差异显著 该样本基本不属
体参数的差异
于已知总体
两个样本统计量 之间的差异
差异显著
两个总体的参数 之间存在差异
1.3假设检验的基本原理
• 小概率原理
– 小概率事件在一次试验中几乎不可能发生 – 小概率一般指 p < 0.05
1 建立假设
H0 : 0 H1 : 0
2 计算统计量 Z X 0 n
3 查临界值Z
2
4若
Z
Z
,
拒
绝H
,
0
Z Z , 接受H0
2
2
例题:
• 全市统一考试的数学平均分0=62分,标准 差0=10.2,一个学校的90名学生该次考试 的平均成绩为68分,问该校成绩与全市平 均差异是否显著。( 取 =0.05)
H0:1 = 0
n, 0 1.96 0 n ,或 Z 1.96,
n 或X 0 1.96 0 n ,
1.5.2 错误和错误
• 错误(I型错误)type I error
– H0为真时却被拒绝,弃真错误
• 错误(II型错误)type II error
– H0为假时却被接受,取伪错误
2 计算统计量 t X 0
Sn
3 查临界值t n 1
2
4若
t
Hale Waihona Puke Baidu
t
,
拒绝H
,
0
t t , 接受H0
2
2
T统计量的分布 设X1,X2,…,Xn是来自正态总体N(,2)的一个样本,
X
1 n
n i 1
Xi,S2
1 n 1
n
(Xi
i 1
X )2,
称 T n( X ) 为T统计量,它服从自由度为n-1
解答
(1)建立检验假设
H0 : 62 H1 : 62 (2)0 62, 0 10.2, X 68, n 90, Z X 0 68 62 5.58
0 n 10.2 / 90 (3)由已给出的显著性水平 0.05,查表得到Z 2 1.96
S
的t分布,即 T~t(n-1)
意义:当正态总体方差2已知时,样本平均数的分布为正态
分布X~ N(,2/n);当总体方差2未知时,用S2作为2的估计
值,当样本容量小于30时,分布
X
S
不接近正态分布,而是
X
自由度为n-1的t分布, n>30时接近正态分布,n趋向于无穷时,
它是正态分布。
S
2 p
(n1
1)S12 (n2 1)S22 n1 n2 2
,
SEDX
S
2 p
1 n1
1 n2
,
t
X1 X2 SEDX
~ tn1 n2
2
• 例:某校进行一项智力速度测验,共有19 名学生参加,其中男生12人,女生7人。测 验共200道题目,在规定时间里,答对一题 记1分,测验结束后,得到以下的测验成绩
3.2两总体方差未知
3.2.1 两总体方差相等独立样本
D =X X
1-X
的
2
标准误为SED
X
=
2 1
2 2
,
n1 n2
两总体方差相等
12=
22=
2 0
SEDX =
2 1
2 2
=
n1 n2
2 0
1 n1
1 n2
,
02未知, 用S12和S22的加权平均代替,
假设检验中各种可能结果的概率
H0为真 H0为伪
接受H0
拒绝H0,接受H1
1-(正确决策) (弃真错误)
(取伪错误) 1- (正确决策)
2. 总体均值的显著性检验
2.1 总体正态且总体方差己知
已知样本x1, x2, xn来自正态总体X ~ N 0, 2 ,
其均值与总体均值0是否有显著差异? Z检验
Sn
3. 两总体均值差异的显著性检验 3.1 两总体方差已知
两个正态总体,均值为1, 2 ,两个样本均值为X1, X 2, 由X1 X 2的差异验证1 2的差异。
如果两个总体方差已知:
X X
1~N
(
1,
2 1
)
2~N
(
2
,
2 2
)
X1
~
N (1,
2 1
n1
)
X2
~
N
解:
X1 114, X 2 112.5,1 5, 2 6.5, n1 30, n2 27, H0 : 1 2 , H1 : 1 2 ,
Z
X1 X2
2 1
2 2
114 112.5 52 6.52
0.97 1.96 Z 0.05 ,
2 1
2 2
2
1
2
n1 n2
n1 n2
2 1
2 2
21 2
,
n
检验统计量为:
Z
X1 X2
2 1
2 2
2 1
2
n
• 例:某幼儿园在儿童入园时对49名儿童进 行了比奈智力测验(=16),结果平均智商X1 =106,一年后再对同组被试施测,结果 X2=110,已知两次测验结果的相关系数 r=0.74,问能否说随着年龄增长与一年的教 育,儿童智商有了显著提高。 (=0.01)
研究假设和虚无假设
• 研究假设 H1 research hypothesis
– 又叫备择假设 alternative hypothesis,指待验证的 假设,一般假设差异显著
2
接
受
假
设H
,两
0
种
教
学方法无
显
著差异
Z检验和t检验
• 两种检验的前提之一
– 总体正态分布
• 当n≥50时,两种检验的临界值差不多相等, 即 Z/2 t/2 (n) (Z0.05/2 1.960, Z0.01/2 2.576
n
30 50 100 150 200 500 1000 5000
例子:
• 学生的学习成绩与教师的教学方法有关。 某校一教师采用了一种他认为新式有效的 教学方法。经过一学年的教学后,从该教 师所教班级中随机抽取了6名学生的考试成 绩,分别为48.5, 49.0, 53.5, 49.5, 56.0, 52.5, 而在该学年考试中,全年级的总平均分数 为52.0,试分析采用这种教学方法与未采用 新教学方法的学生成绩有无显著的差异 (已知考试成绩服从正态分布,取=0.05)
• 虚无假设 H0 null hypothesis
– 又叫零假设 zero hypothesis,原假设,与研究假 设对立的假设,一般假设差异不显著
• H1:1 0 • Z检验
• 取=0.05
• 接受H0:X 0 1.96 0
拒绝H0:X 0 1.96 0
或Z 1.96,或Z 1.96
2
X i X 445.82,
S22
17 7 1 i1
Yi
Y
2
425.33,
由于S12和S22差不多,可以认为方差相等,
t
120 101
1.91
12 1445.82 7 1425.33 1 1
解:
X 51.5,S 2.98, (1)建立假设
H0 : 0
H1 : 0
(2)t X 0 51.5 52.0 0.41
S n 2.98 6
(3)临界值t (5) 2.571
2
(4) t 0.41 0.41 2.571 t (5)
(
2
,
2 2
n2
)
D X
X
1
X
的分布
2
仍为
正态分
布,
D
X
=1
,不同
2
条
件下
标
准误
公式不
同
3.1.1 总体方差已知,独立样本
X,Y独立,则
2 (X
Y
)
2 X
2 Y
,
X
与
1
X
独
2
立
时,
2 D
X
SED2 X
SE2 X1
SE2 X2
2 1
2
n1 n2
30 27
所以,男女儿童的身高差异不显著。
3.1.2 总体方差已知,相关样本
设r为两变量之间的相关系数
2 ( X Y )
2 X
2 XY
2 Y
,
D X
X1 X2,
SED2 X
SE2 X1
SE2 X2
2 SE SE ,
X1
X2
SEDX
t分布的特点: (1)对称。左侧为负,右侧为正,均值为0; (2)-<t<+; (3)n 时, t分布为正态分布,方差为1;
n-1>30时, t分布为接近正态分布,方差>1, n-1<30时, t分布与正态分布相差较大,随n-1减小方差越大
n>45时, t分布与正态分布没有多大差异 在小样本n<30时, t分布具有重要作用。
(4)显然 Z 5.58 1.96,即拒绝原假设H0 可以认为该校的学生考试成绩与全市的平均成绩有 显著差异。
2.2总体正态但总体方差未知
已知样本x1, x2, xn来自正态总体X ~ N 0, 2 ,
问样本均值与总体均值之间是否有显著差异? t检验
1 建立假设
H0 : 0 H1 : 0
假设检验
本章基本内容
• 假设检验的基本原理和步骤
– 虚无假设和备择假设 – 错误和错误 – 单侧检验和双侧检验
• 差异的显著性检验
– 均值 – 方差 – 比例、相关系数
1.1 假设检验和参数估计
• 参数估计
– 用样本统计量估计总体参数
• 假设检验
– 先对总体参数提出一个假设,然后利用样本信 息检验这个假设是否成立
– 男生12人:83、146、119、104、120、161、 134、115、129、99、123
– 女生7人:70、118、101、85、107、132、94试 确定男、女生的平均成绩有无显著的差异(取 =0.05)
解: X
120,Y
101, S12
1 12 1
12 i 1
解:单侧检验
H 0 : 1 2 , H1 : 1 2 ,
SEDX
162 162 2 0.74162 1.65, 49
D Z X
SEDX
110 106 1.65 2.43 2.33 Z0.01,
即p 0.01,可以认为一年后儿童
智商有了显著的提高。
¡Ý 0 < 0
£ Z
Z < £ Z £ t(n-1) t < £ t(n-1)
× ¢ £º µ±× Ü Ìå ²» ÊÇ Õý ̬ · Ö ²¼ ʱ£¬ Èç ¹û Ñù ± ¾ ÈÝ Á¿ n¡Ý 50£¬ ¿É ÒÔ ¿¼ ÂÇ ÓÃ
Z ' X 0 À´ × ö ¼ì Ñé
1.4 假设检验的步骤
• 建立虚无假设和备择假设 • 确定适当的检验统计量 • 指定检验中的显著性水平,计算检验统计
量的值,建立拒绝虚无假设的规则 • 作出统计决策
– 将检验统计量的值与拒绝规则所指定的临界值 相比较,确定是否拒绝虚无假设
– (计算p值,利用p值确定是否拒绝虚无假设)
1.5.1 假设检验的一个例子
t0.05(n) 2.042 2.009 1.984 1.976 1.972 1.965 1.962 1.960
t0.01(n) 2.750 2.678 2.626 2.609 2.601 2.586 2.581 2.577
小结
¼Ù Éè
× Ü Ìå Õý ̬ £¬ · ½ ²î 2 ÒÑ × Ü Ìå Õý ̬ £¬ · ½ ²î 2 δ Öª £¬
Öª £¬ Z ¼ì Ñé
t ¼ì Ñé
H0
H1
ÁÙ ½ç Öµ ¾Ü ¾ø H0 ÁÙ ½ç Öµ
¾Ü ¾ø H0
Ë« ²à ¼ì Ñé µ¥ ²à ¼ì Ñé
= 0
¡Ù 0 Z/2
¡Ü 0 > 0
Z
|Z| > Z/2 Z > Z
t/2(n-1) t(n-1)
|t| > t/2(n-1) t > t(n-1)
n1
2 2
,
n2
SEDX
2 1
2 2
,
n1 n2
则Z ( X1 X 2 ) (1 2 )
SEDX
当H 0
: 1
2假设成立时,Z
X1 X2 SEDX
X1 X2
2 1
2 2
n1 n2
• 例: 某地区的六岁儿童中随机抽取男生30 人,其平均身高为114cm,抽取女生27人, 平均身高112.5cm。根据以往资料,该区六 岁男女儿童身高的标准差男童为5cm,女童 为6.5cm,问该区六岁男女儿童身高有无显 著差异? (=0.05)
• 根据以往的比分(总体信息)推断该比分是否足球 赛比分
– 从样本的差异推论总体差异的过程
1.2 假设检验的主要内容: 差异检验
样本统计量与总 差异显著 该样本基本不属
体参数的差异
于已知总体
两个样本统计量 之间的差异
差异显著
两个总体的参数 之间存在差异
1.3假设检验的基本原理
• 小概率原理
– 小概率事件在一次试验中几乎不可能发生 – 小概率一般指 p < 0.05
1 建立假设
H0 : 0 H1 : 0
2 计算统计量 Z X 0 n
3 查临界值Z
2
4若
Z
Z
,
拒
绝H
,
0
Z Z , 接受H0
2
2
例题:
• 全市统一考试的数学平均分0=62分,标准 差0=10.2,一个学校的90名学生该次考试 的平均成绩为68分,问该校成绩与全市平 均差异是否显著。( 取 =0.05)
H0:1 = 0
n, 0 1.96 0 n ,或 Z 1.96,
n 或X 0 1.96 0 n ,
1.5.2 错误和错误
• 错误(I型错误)type I error
– H0为真时却被拒绝,弃真错误
• 错误(II型错误)type II error
– H0为假时却被接受,取伪错误
2 计算统计量 t X 0
Sn
3 查临界值t n 1
2
4若
t
Hale Waihona Puke Baidu
t
,
拒绝H
,
0
t t , 接受H0
2
2
T统计量的分布 设X1,X2,…,Xn是来自正态总体N(,2)的一个样本,
X
1 n
n i 1
Xi,S2
1 n 1
n
(Xi
i 1
X )2,
称 T n( X ) 为T统计量,它服从自由度为n-1
解答
(1)建立检验假设
H0 : 62 H1 : 62 (2)0 62, 0 10.2, X 68, n 90, Z X 0 68 62 5.58
0 n 10.2 / 90 (3)由已给出的显著性水平 0.05,查表得到Z 2 1.96
S
的t分布,即 T~t(n-1)
意义:当正态总体方差2已知时,样本平均数的分布为正态
分布X~ N(,2/n);当总体方差2未知时,用S2作为2的估计
值,当样本容量小于30时,分布
X
S
不接近正态分布,而是
X
自由度为n-1的t分布, n>30时接近正态分布,n趋向于无穷时,
它是正态分布。
S
2 p
(n1
1)S12 (n2 1)S22 n1 n2 2
,
SEDX
S
2 p
1 n1
1 n2
,
t
X1 X2 SEDX
~ tn1 n2
2
• 例:某校进行一项智力速度测验,共有19 名学生参加,其中男生12人,女生7人。测 验共200道题目,在规定时间里,答对一题 记1分,测验结束后,得到以下的测验成绩
3.2两总体方差未知
3.2.1 两总体方差相等独立样本
D =X X
1-X
的
2
标准误为SED
X
=
2 1
2 2
,
n1 n2
两总体方差相等
12=
22=
2 0
SEDX =
2 1
2 2
=
n1 n2
2 0
1 n1
1 n2
,
02未知, 用S12和S22的加权平均代替,
假设检验中各种可能结果的概率
H0为真 H0为伪
接受H0
拒绝H0,接受H1
1-(正确决策) (弃真错误)
(取伪错误) 1- (正确决策)
2. 总体均值的显著性检验
2.1 总体正态且总体方差己知
已知样本x1, x2, xn来自正态总体X ~ N 0, 2 ,
其均值与总体均值0是否有显著差异? Z检验
Sn
3. 两总体均值差异的显著性检验 3.1 两总体方差已知
两个正态总体,均值为1, 2 ,两个样本均值为X1, X 2, 由X1 X 2的差异验证1 2的差异。
如果两个总体方差已知:
X X
1~N
(
1,
2 1
)
2~N
(
2
,
2 2
)
X1
~
N (1,
2 1
n1
)
X2
~
N
解:
X1 114, X 2 112.5,1 5, 2 6.5, n1 30, n2 27, H0 : 1 2 , H1 : 1 2 ,
Z
X1 X2
2 1
2 2
114 112.5 52 6.52
0.97 1.96 Z 0.05 ,
2 1
2 2
2
1
2
n1 n2
n1 n2
2 1
2 2
21 2
,
n
检验统计量为:
Z
X1 X2
2 1
2 2
2 1
2
n
• 例:某幼儿园在儿童入园时对49名儿童进 行了比奈智力测验(=16),结果平均智商X1 =106,一年后再对同组被试施测,结果 X2=110,已知两次测验结果的相关系数 r=0.74,问能否说随着年龄增长与一年的教 育,儿童智商有了显著提高。 (=0.01)