第三讲 统计假设检验与参数估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ቤተ መጻሕፍቲ ባይዱ0 0 A
0
结论:采用新曲种酿造食醋,其醋酸含量有显著改变。
1.4 双侧检验与单侧检验
双侧检验
在上述显著性检验中,对应于无效假设H 0: 0
的备择假设为
H A: 0
。它包含了 0
或 0 两种可能。 因而有两个否定域, 分别为于分布曲线的两尾。这个假设检验的 目的在于判断μ 与μ 0有无差异,而不考虑谁
1 1 ( ) n1 n2
28 21.6 1 1 ( ) 0.742 (10 1) (10 1) 10 10
x1 x 2 11 9.2 t 2.426 S x1 x2 0.742
上一张 下一张 主 页 退 出
进一步估计|t|≥2.426的两尾概率,即
上一张 下一张 主 页
退 出
按所建立的 H 0 :1 = 2 ,试验的表面效应 是试验误差的概率在 0.01 ─ 0.05 之间,小 于0.05,故有理由否定 H 0 :1 = 2 ,从而接 1 受 H A : 1 ≠ 2。
综上所述,显著性检验,从提出无效假设与备 择假设到根据小概率事件实际不可能性原理来 否定或接受无效假设,这一过程实际上是应用 所谓“概率性质的反证法”对试验样本所属总 体所作的无效假设的统计推断。
图4-1 双侧检验时H0的接受域和否定域
对前例分析:
0=0.0975
0.053 = =0.0097 n 30
所以在a=0.05水平上的接受域为 (0.0785< x <0.1165) 否定域为 x ≤0.0785,x ≥0.1165 试验结果 x =0.1199,落入否定区间, 所以否定 H := =9.75%,接受 H :
与 1
计算所得的t值的右上方标记“*”;
上一张 下一张 主 页
退 出
若|t|≥t0.01,则说明试验的表面效应属于 试验误差的概率P不超过0.01,即P ≤0.01, 表面效应属于试验误差的可能性更小 , 应否 定 : =
H 0 1 ,接受 : 2
≠ H,统计学上 A
1 把这一检验结果表述为:“两个总体平均数 2
1 1 ( ) n1 n2
S x1 x2 叫做均数差异标准误;
n1、n2为两样本的含量。 所得的统计量 t服从自由度
df =(n1-1)+(n2-1)的t分布。
上一张 下一张 主 页
退 出
根据两个样本的数据,计算得: 1 - x2=11x 9.2=1.8;
S x1 x2
(x
x1 ) 2 ( x2 x2 ) 2 1 (n1 1) (n2 1)
上一张 下一张 主 页 退 出
由两样本数据计算所得的t值为2.426,介 于两个临界t值之间,即:
t0.05<2.426<t0.01
所以,| t |≥2.426的概率P介于0.01和
0.05之间,即:0.01 <P< 0.05。
如图所示,| t |≥2.426的两尾概率,说明 无效假设成立的可能性, 即试验的表面效应为试 验误差引起的可能性在0.01─ 0.05之间。
与
差异极显著”,在计算所得的t值的右上 2 1
方标记“* *”。
上一张 下一张 主 页 退 出
1.2 统计假设检验的步骤
建立假设。对样本所属总体提出假设,包括无效 假设H0和备择假设HA; 确定显著水平α。常用的显著水平α=0.05和α= 0.01; 从无效假设H0出发,根据样本提供信息构造适宜 统计量,并计算统计量值或概率; 由附表查出相应的统计量临界值,比较样本统计 量值与临界值大小,根据小概率原理做出统计推 断(或由概率大小做出判断)。
上一张 下一张 主 页 退 出
= 如前例,原假设H0: =9.75% ,即假设
0
由新曲种酿造出的食醋的醋酸含量与原菌种
酿造的食醋醋酸含量相等,这个假设表明采
用新曲种酿造食醋对提高醋酸含量是无效的,
试验的表面效应是随机误差引起的。
对应的备择假设为 =9.75% ,即表明
0
采用新曲种酿造食醋能够改变醋酸含量,试 验的处理效应存在。
3. 根据“小概率事件实际不可能性原理”否 定或接受无效假设 当试验的表面效应是试验误差的概率小于 0.05时 ,可以认为在一次试 验中试验表面效 应是试验误差实际上是不可能的,因而否定原 先所作的无效假设H0,接受备择假设HA,即 认为试验的处理效应是存在的。
当试验的表面效应是试验误差的概率大于 0.05时, 则说明无效假设成立的可能性大 , 不能被否定,因而也就不能接受备择假设。
上一张 下一张 主 页 退 出
若t0.05≤|t|< t0.01,则 说明 试验的表面
效应属于试验误差的概率P在0.01—0.05之间,
即0.01 <P≤0.05,表面效应属于试验误差的 可能性较小,应否定 :H 0= 1 , 2 接
差异显著”,在 2
受H A : 1 ≠ 2 ,统计学上把这一检验结果表述 为:“两个总体平均数
1 统计假设检验概述
1.1 统计假设检验的意义和基本原理
1.1.1 统计假设检验的意义
例1:某一酿造厂新引进一种酿醋曲种,以原 曲种为对照进行试验。已知原曲种酿出的食醋 醋酸含量平均为μ 0=9.75%,其标准差为σ =5.30%。现采用新曲种酿醋,得到30个醋 样,测得其醋酸含量平均为 x = 11.99%。 试问,能否由这30个醋样的平均数 判断新 x 曲种好于原曲种?
食醋醋酸含量的差异是由于采用新曲种引起的还是由于试验误差引起的? 上一张 下一张 主 页 退 出
1.1.2 统计假设检验的基本思想
小概率事件实际不可能性原理
0.05 0.01 0.001 称 之 为 小 概 率 事 件。
上一张 下一张 主 页 退 出
小概率事件不是不可能事件,但在一次试验 中出现的可能性很小, 不出现的可能性很大 ,以 至于实际上可以看成是不可能发生的。在统计学 上,把小概率事件在一次试验中看成是实际不可 能发生的事件称为小概率事件实际不可能性原理, 亦称为小概率原理
为双侧检验的 u
临界u值。
上一张 下一张 主 页
退 出
单测检验
如酿醋厂的企业标准规定,曲种酿造醋的醋酸含量应保持在
12%以上(μ 0),如果进行抽样检验,样本平均数 , x
0
该批醋为合格产品,但如果 x
0
时,可能是一批不合格产
品。对这样的问题,我们关心的是 x 所在总体平均数μ 是否
上一张 下一张 主 页 退 出
1.1.4 统计假设检验的显著水平
在统计假设检验中,否定或接受无效
假设的依据是“小概率事件实际不可能性
原理”。用来确定否定或接受无效假设的
概率标准 叫 显 著 水 平(significance
level),记作α。 在试验研究中常取α=0.05或 α=0.01。
上一张 下一张 主 页 退 出
大谁小。
上一张 下一张 主 页 退 出
这样,在α水平上否定域有两
和 ,对称 , u u , 地分配在u分布曲线的两侧尾 个
部,每侧的概率为α/2,如图 所示。这种利用两尾概率进行 的检验叫 双侧检验(two-sided
test),也叫双尾检验(twotailed test),
n
由正态分布双侧分位数(uа)可知
P u 1.96 0.05 =
P u 2.58 0.01 =
本例计算出的统计量u=2.315,
1.96<
u
<2.58,所以可推知其概率
0.01< P u 2.315 < 0.05 本试验的表面效应
x
0
完全由试验
误差造成的概率在0.01-0.05之间。
从而否定H0。也就是说箱中不止1个黑球。
上一张 下一张 主 页 退 出
1.1.3 统计假设检验的基本原理
1. 根据研究目的,对研究总体提出假设
H0 HA
原假设、无效假设、零假设(null hypothesis)
是被检验的假设,通过检验可能被接受,也 可能被否定。 备择假设(alternative hypothesis) 与H0对应的假设,只有是在无效假设被否定 后才可接受的假设。无充分理由是不能轻率 接受的。
2. 在无效假设成立的前提下,构造合适的 统计量,并由该统计量的抽样分布计算样本 统计量的概率。
当无效假设H0成立时,表明试验表面
效应纯属试验误差引起,处理效应不存在
。此时,可根据题意构造适当统计量,计 算样本统计量值。
上一张 下一张 主 页 退 出
% 对前例分析,无效假设H0: = =9.75 成立,
0
试验的表面效应是随机误差引起的。那么,可以把
试验中所获得的
看成是从 x
0 总体中抽取的一个
样本平均数,由样本平均数的抽样分布理论可知,
x
构造统计量:
~ N(μ0,σ2/n)。
u
x 0
2
x 0 / n
n
由样本值计算统计量u值,
u x 0
2
x 0 / n 0.119 0.0975 = =2.315 0.053/ 30
小概率事件实际不可能性原理是统计学上进行假设 检验(显著性检验)的基本依据。
举一例子,箱子中有黑球和白球,总数100个,
但不知黑球白球各多少个。现提出假设H0:“箱
子中有99个白球”,暂时设H0正确。
那么从箱子中任取一球,得黑球的概率0.01, 是一小概率事件。今取球一次,如果居然取到了黑 球,那么,自然会使人对H0的正确性产生怀疑,
第三章 统计假设检验与参数估计
统计推断是根据样本分布规律和概率理 论,由样本结果去推断总体特征。它主要包 括假设检验 ( test of hypothesis) 和 参数估计(parametric estimation)
两部分内容。
上一张 下一张 主 页 退 出
假设检验又叫显著性 检验
(test of
significance)。显著性检验的方法很多
,常用
的有u检验、t检验、F检验和2检验等。尽管 这些检验方法的用途及使用条件不同,但其检
验的基本原理是相同的。
参数估计有点估计(point estimation)和 区间估计(interval estimation)。
上一张 下一张 主 页 退 出
小于已知总体平均数数μ 0(即产品是否不合格)。此时,无
效假设应为
H 0: 0 (产品合格),备择假设则应为
HA : 0(产品不合格) 。这样,只有一个否定域,并且 位于分布曲线的左尾,为左尾检验,如图4-3B所示,左侧 的概率为α 。
上一张 下一张 主 页 退 出
利用一尾概率进行的检验叫单侧检验(onesided test),也叫单尾检验(one-tailed test)。此 时uα为单侧检验的临界u值。 单侧检验的uα=双侧检验的u2α。
1.3 统计假设检验的几何意义
1.3.1 统计假设检验的几何意义
统计假设检验从本质上来说,就是根据 显著水平а将统计量(数)的分布划分为接受 区和否定区两部分。前者为接受原假设H0的 区间,后者为否定H0,而接受HA的区间。当 试验结果落入接受区,就接受H0;反之,否 定H0,而接受HA。否定区的概率为α ,接受区 的概率为1- а 。
估计P(|t|≥2.426)是多少?
查附表3,在df =(n1-1)+ (n2-1) =18时,
两尾概率为0.05的临界值:t 0.05(18) =2.101, 两尾概率为0.01的临界t值: 0.01(18) =2.878, t
即:
P(|t|>2.101)= P(t>2.101) + P(t <-2.101)=0.05 P(|t|>2.878)= P(t>2.878) + P(t<-2.878)=0.01
上一张 下一张 主 页 退 出
对于来自两个总体的样本,研究在无效假 设 H 0 : 1 = 2 成立的前提下,统计量 ( x1 - x2)的抽样分布。经统计学研究,得 到一个统计量t: x1 x 2
t S x1 x2
~ t(df)
其中
S x1 x2 =
( x1 x1 ) 2 ( x2 x2 ) 2 (n1 1) (n2 1)
统计假设检验结果说明(两个样本):
若|t|< t0.05 ,则说明试验的表面效应属 于试验误差引起的概率P>0.05,即表面效应属 于试验误差的可能性大,不能否定 H 0 :1 = 2,
统计学上把这一检验结果表述为:“两个总体平
均数 1 与 2 差异不显著”,在计算所得的t值 的右上方标记“ns”或不做任何标记;
0
结论:采用新曲种酿造食醋,其醋酸含量有显著改变。
1.4 双侧检验与单侧检验
双侧检验
在上述显著性检验中,对应于无效假设H 0: 0
的备择假设为
H A: 0
。它包含了 0
或 0 两种可能。 因而有两个否定域, 分别为于分布曲线的两尾。这个假设检验的 目的在于判断μ 与μ 0有无差异,而不考虑谁
1 1 ( ) n1 n2
28 21.6 1 1 ( ) 0.742 (10 1) (10 1) 10 10
x1 x 2 11 9.2 t 2.426 S x1 x2 0.742
上一张 下一张 主 页 退 出
进一步估计|t|≥2.426的两尾概率,即
上一张 下一张 主 页
退 出
按所建立的 H 0 :1 = 2 ,试验的表面效应 是试验误差的概率在 0.01 ─ 0.05 之间,小 于0.05,故有理由否定 H 0 :1 = 2 ,从而接 1 受 H A : 1 ≠ 2。
综上所述,显著性检验,从提出无效假设与备 择假设到根据小概率事件实际不可能性原理来 否定或接受无效假设,这一过程实际上是应用 所谓“概率性质的反证法”对试验样本所属总 体所作的无效假设的统计推断。
图4-1 双侧检验时H0的接受域和否定域
对前例分析:
0=0.0975
0.053 = =0.0097 n 30
所以在a=0.05水平上的接受域为 (0.0785< x <0.1165) 否定域为 x ≤0.0785,x ≥0.1165 试验结果 x =0.1199,落入否定区间, 所以否定 H := =9.75%,接受 H :
与 1
计算所得的t值的右上方标记“*”;
上一张 下一张 主 页
退 出
若|t|≥t0.01,则说明试验的表面效应属于 试验误差的概率P不超过0.01,即P ≤0.01, 表面效应属于试验误差的可能性更小 , 应否 定 : =
H 0 1 ,接受 : 2
≠ H,统计学上 A
1 把这一检验结果表述为:“两个总体平均数 2
1 1 ( ) n1 n2
S x1 x2 叫做均数差异标准误;
n1、n2为两样本的含量。 所得的统计量 t服从自由度
df =(n1-1)+(n2-1)的t分布。
上一张 下一张 主 页
退 出
根据两个样本的数据,计算得: 1 - x2=11x 9.2=1.8;
S x1 x2
(x
x1 ) 2 ( x2 x2 ) 2 1 (n1 1) (n2 1)
上一张 下一张 主 页 退 出
由两样本数据计算所得的t值为2.426,介 于两个临界t值之间,即:
t0.05<2.426<t0.01
所以,| t |≥2.426的概率P介于0.01和
0.05之间,即:0.01 <P< 0.05。
如图所示,| t |≥2.426的两尾概率,说明 无效假设成立的可能性, 即试验的表面效应为试 验误差引起的可能性在0.01─ 0.05之间。
与
差异极显著”,在计算所得的t值的右上 2 1
方标记“* *”。
上一张 下一张 主 页 退 出
1.2 统计假设检验的步骤
建立假设。对样本所属总体提出假设,包括无效 假设H0和备择假设HA; 确定显著水平α。常用的显著水平α=0.05和α= 0.01; 从无效假设H0出发,根据样本提供信息构造适宜 统计量,并计算统计量值或概率; 由附表查出相应的统计量临界值,比较样本统计 量值与临界值大小,根据小概率原理做出统计推 断(或由概率大小做出判断)。
上一张 下一张 主 页 退 出
= 如前例,原假设H0: =9.75% ,即假设
0
由新曲种酿造出的食醋的醋酸含量与原菌种
酿造的食醋醋酸含量相等,这个假设表明采
用新曲种酿造食醋对提高醋酸含量是无效的,
试验的表面效应是随机误差引起的。
对应的备择假设为 =9.75% ,即表明
0
采用新曲种酿造食醋能够改变醋酸含量,试 验的处理效应存在。
3. 根据“小概率事件实际不可能性原理”否 定或接受无效假设 当试验的表面效应是试验误差的概率小于 0.05时 ,可以认为在一次试 验中试验表面效 应是试验误差实际上是不可能的,因而否定原 先所作的无效假设H0,接受备择假设HA,即 认为试验的处理效应是存在的。
当试验的表面效应是试验误差的概率大于 0.05时, 则说明无效假设成立的可能性大 , 不能被否定,因而也就不能接受备择假设。
上一张 下一张 主 页 退 出
若t0.05≤|t|< t0.01,则 说明 试验的表面
效应属于试验误差的概率P在0.01—0.05之间,
即0.01 <P≤0.05,表面效应属于试验误差的 可能性较小,应否定 :H 0= 1 , 2 接
差异显著”,在 2
受H A : 1 ≠ 2 ,统计学上把这一检验结果表述 为:“两个总体平均数
1 统计假设检验概述
1.1 统计假设检验的意义和基本原理
1.1.1 统计假设检验的意义
例1:某一酿造厂新引进一种酿醋曲种,以原 曲种为对照进行试验。已知原曲种酿出的食醋 醋酸含量平均为μ 0=9.75%,其标准差为σ =5.30%。现采用新曲种酿醋,得到30个醋 样,测得其醋酸含量平均为 x = 11.99%。 试问,能否由这30个醋样的平均数 判断新 x 曲种好于原曲种?
食醋醋酸含量的差异是由于采用新曲种引起的还是由于试验误差引起的? 上一张 下一张 主 页 退 出
1.1.2 统计假设检验的基本思想
小概率事件实际不可能性原理
0.05 0.01 0.001 称 之 为 小 概 率 事 件。
上一张 下一张 主 页 退 出
小概率事件不是不可能事件,但在一次试验 中出现的可能性很小, 不出现的可能性很大 ,以 至于实际上可以看成是不可能发生的。在统计学 上,把小概率事件在一次试验中看成是实际不可 能发生的事件称为小概率事件实际不可能性原理, 亦称为小概率原理
为双侧检验的 u
临界u值。
上一张 下一张 主 页
退 出
单测检验
如酿醋厂的企业标准规定,曲种酿造醋的醋酸含量应保持在
12%以上(μ 0),如果进行抽样检验,样本平均数 , x
0
该批醋为合格产品,但如果 x
0
时,可能是一批不合格产
品。对这样的问题,我们关心的是 x 所在总体平均数μ 是否
上一张 下一张 主 页 退 出
1.1.4 统计假设检验的显著水平
在统计假设检验中,否定或接受无效
假设的依据是“小概率事件实际不可能性
原理”。用来确定否定或接受无效假设的
概率标准 叫 显 著 水 平(significance
level),记作α。 在试验研究中常取α=0.05或 α=0.01。
上一张 下一张 主 页 退 出
大谁小。
上一张 下一张 主 页 退 出
这样,在α水平上否定域有两
和 ,对称 , u u , 地分配在u分布曲线的两侧尾 个
部,每侧的概率为α/2,如图 所示。这种利用两尾概率进行 的检验叫 双侧检验(two-sided
test),也叫双尾检验(twotailed test),
n
由正态分布双侧分位数(uа)可知
P u 1.96 0.05 =
P u 2.58 0.01 =
本例计算出的统计量u=2.315,
1.96<
u
<2.58,所以可推知其概率
0.01< P u 2.315 < 0.05 本试验的表面效应
x
0
完全由试验
误差造成的概率在0.01-0.05之间。
从而否定H0。也就是说箱中不止1个黑球。
上一张 下一张 主 页 退 出
1.1.3 统计假设检验的基本原理
1. 根据研究目的,对研究总体提出假设
H0 HA
原假设、无效假设、零假设(null hypothesis)
是被检验的假设,通过检验可能被接受,也 可能被否定。 备择假设(alternative hypothesis) 与H0对应的假设,只有是在无效假设被否定 后才可接受的假设。无充分理由是不能轻率 接受的。
2. 在无效假设成立的前提下,构造合适的 统计量,并由该统计量的抽样分布计算样本 统计量的概率。
当无效假设H0成立时,表明试验表面
效应纯属试验误差引起,处理效应不存在
。此时,可根据题意构造适当统计量,计 算样本统计量值。
上一张 下一张 主 页 退 出
% 对前例分析,无效假设H0: = =9.75 成立,
0
试验的表面效应是随机误差引起的。那么,可以把
试验中所获得的
看成是从 x
0 总体中抽取的一个
样本平均数,由样本平均数的抽样分布理论可知,
x
构造统计量:
~ N(μ0,σ2/n)。
u
x 0
2
x 0 / n
n
由样本值计算统计量u值,
u x 0
2
x 0 / n 0.119 0.0975 = =2.315 0.053/ 30
小概率事件实际不可能性原理是统计学上进行假设 检验(显著性检验)的基本依据。
举一例子,箱子中有黑球和白球,总数100个,
但不知黑球白球各多少个。现提出假设H0:“箱
子中有99个白球”,暂时设H0正确。
那么从箱子中任取一球,得黑球的概率0.01, 是一小概率事件。今取球一次,如果居然取到了黑 球,那么,自然会使人对H0的正确性产生怀疑,
第三章 统计假设检验与参数估计
统计推断是根据样本分布规律和概率理 论,由样本结果去推断总体特征。它主要包 括假设检验 ( test of hypothesis) 和 参数估计(parametric estimation)
两部分内容。
上一张 下一张 主 页 退 出
假设检验又叫显著性 检验
(test of
significance)。显著性检验的方法很多
,常用
的有u检验、t检验、F检验和2检验等。尽管 这些检验方法的用途及使用条件不同,但其检
验的基本原理是相同的。
参数估计有点估计(point estimation)和 区间估计(interval estimation)。
上一张 下一张 主 页 退 出
小于已知总体平均数数μ 0(即产品是否不合格)。此时,无
效假设应为
H 0: 0 (产品合格),备择假设则应为
HA : 0(产品不合格) 。这样,只有一个否定域,并且 位于分布曲线的左尾,为左尾检验,如图4-3B所示,左侧 的概率为α 。
上一张 下一张 主 页 退 出
利用一尾概率进行的检验叫单侧检验(onesided test),也叫单尾检验(one-tailed test)。此 时uα为单侧检验的临界u值。 单侧检验的uα=双侧检验的u2α。
1.3 统计假设检验的几何意义
1.3.1 统计假设检验的几何意义
统计假设检验从本质上来说,就是根据 显著水平а将统计量(数)的分布划分为接受 区和否定区两部分。前者为接受原假设H0的 区间,后者为否定H0,而接受HA的区间。当 试验结果落入接受区,就接受H0;反之,否 定H0,而接受HA。否定区的概率为α ,接受区 的概率为1- а 。
估计P(|t|≥2.426)是多少?
查附表3,在df =(n1-1)+ (n2-1) =18时,
两尾概率为0.05的临界值:t 0.05(18) =2.101, 两尾概率为0.01的临界t值: 0.01(18) =2.878, t
即:
P(|t|>2.101)= P(t>2.101) + P(t <-2.101)=0.05 P(|t|>2.878)= P(t>2.878) + P(t<-2.878)=0.01
上一张 下一张 主 页 退 出
对于来自两个总体的样本,研究在无效假 设 H 0 : 1 = 2 成立的前提下,统计量 ( x1 - x2)的抽样分布。经统计学研究,得 到一个统计量t: x1 x 2
t S x1 x2
~ t(df)
其中
S x1 x2 =
( x1 x1 ) 2 ( x2 x2 ) 2 (n1 1) (n2 1)
统计假设检验结果说明(两个样本):
若|t|< t0.05 ,则说明试验的表面效应属 于试验误差引起的概率P>0.05,即表面效应属 于试验误差的可能性大,不能否定 H 0 :1 = 2,
统计学上把这一检验结果表述为:“两个总体平
均数 1 与 2 差异不显著”,在计算所得的t值 的右上方标记“ns”或不做任何标记;