参数假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 2. 3. H0 : 100
而.
HA : > 100
3 36 0.5
n = 36, = 3, 而且 X = 101, X 检验统计量
利用Z分布
Z
X 0
X
101 100 2 0.5
与总体均值有关的决策
4. 右侧尾部检验 , = 0.01
Z Z 0.01 2.325
1.
H0 : 8.7
而
HA : < 8.7
利用
2. n = 15, X = 7.2, s = 2.5, 而且 s 2.5 0.6455 X 15 t14分布
与总体均值有关的决策
3. 4. 检验统计量
t X 0 7.2 8.7 2.32 sX 0.6455
1.
2.
H0 : = $575
而
HA : $575
181 33 31.51 利用 Z分布
n = 33, X = 518.5, s = 181, 而且 s X
与总体均值有关的决策
3. 4. 检验统计量
X 0 518.5 575 Z 1.79 sX 31.5
H 0 : 0 vs. H : 0 A
H 0 : 0 vs. H : 0 A
双尾
左侧尾部
右侧尾部
构造假设
举例:
一个电灯泡生产商想生产平均寿命为1,000小时的灯泡,如 果灯泡寿命太短,他就会失去客户;如果灯泡寿命太长,生 产成本则会上升。为此,他从灯泡中抽取了一个样本来观察 其平均寿命是否可以达到1,000小时。请构造H0 和 HA。
步骤5
步骤6
得出结论并进行解释
§ 5.2 一个正态总体下的参数假设检验
1、关于正态总体均值 的假设检验
关于均值的假设检验,可分如下三种情况: (1)已知方差2,假设 H0 := 0,通过样本观测值x1, x2,·,xn ,检验H0 是否成立。 · · (2)未知方差2,假设 H0 := 0,通过样本观测值x1, x2,·,xn ,检验H0 是否成立。 · ·
备择假设H1 :10(毫米)
其次: 构造一个统计量, 也要满足: a. 其分布和参数 已知; b . 在已知条件下, 能算出这个 统计量.
构造统计量为:
X T ~ t ( n 1) S n
/2
/2
-t
t
由 P( |T| t0.025 ) = , 取=0.05. 算得 |t | =1.414, t0.025 =3.182. 有|t | < t0.025. 所以接受原假设. 4、未知方差2,检验假设 H1 : > 0 (这是作为备择假 设出现) 例:已知生产线上生产出来的零件抗剪强度服从服从正态 分布,以往的数据表明抗剪强度的均值 0 =10(毫米). 现在 改用一种新材料来生产该零件,得到一组零件的抗剪强度 的样本观测值: 10.01, 10.02, 10.02, 9.99.
Z
X
X
、标准差为 X
n
X
~ N (0, 1)
与总体均值有关的决策
举例: 一家医院正在使用某种药品,已知药品每包的平均剂量为 100 cm3,标准差为3cm3。随机抽取36包药品作为一个样本, 并得到每包药品的平均剂量为101cm3。检验当 = 0.01时, 每包药品的剂量是否过大。
决策原则 – 临界区域法:
什么是“临界值” (CV) – “显著水平” 单尾或双尾检验 Z分布或者t分布
什么是“临界区域” (CR) 或 拒绝 域 尾部区域超过了临界值
原假设 (H0) 或备择假设(HA) – 检验统计量落在临界区域之外 接受 H0 检验统计量落在临界区域之内 拒绝 H0
左侧尾部检验 , = 0.05 t n1, t14,0.05 1.761 临界 值= – 1.761
CR = 0.05
95%的面积
5.
检验统计量落在临界区域之内 拒绝 H0
CV = –1.761 TS = – 2.32
t14
6.
数据显示:当显著水平 = 0.05时,这家体育馆会员资格的平 均年限明显小于8.7年
/2 = 0.025
双尾检验 , = 0.05 Z Z0.025 1.96 临界 值= 1.96
2
/2 = 0.025
95%的面积
5.
检验统计量落在临界区域之外 接受 H0
Z
CV = –1.96 TS = –1.79 CV = 1.96
6.
当 = 0.05时,数据看来支持信贷经理的陈述 审计人员无 需审查所有的赊购帐户 。
临界值 = 2.325 检验统计量落在临界区域之外 接受 H0
99 %的面积 TS = 2.0
临界区域
= 0.01
Z
CV = 2.325
5.
6.
数据显示:当显著水平 = 0.01时,每包药品的剂量不大
例:已知生产线上生产出来的零件直径服从正态分布,已 知方差为0.09(毫米2) , 现有假设 H0 :=10(毫米). 这个假设 可以是生产标准的要求. 现有一组样本观测值: 10.01, 10.02, 10.02, 9.99 (在实际问题样本容量大些更好). 请判断这批零件的平均直径 =10(毫米)是否正确.
X近似服从以下参数的正态分布 X
ˆ X sX
检验统计量
Z X ~ N (0, 1) sX
s n
与总体均值有关的决策
举例:
一家大型电子商店的信贷经理说,该商店赊购帐户上的平均余额 为575元。一名审计人员随机抽取了33名顾客作为一个样本,结果 发现赊购帐户上的平均余额为518.5元、标准差为181元。如果信 贷经理的陈述得不到数据支持,审计人员将检查所有的赊购帐户。 请问当 = 0.05时,审计人员应当采取什么行动?
Fra Baidu bibliotek
两类错误
统计意义上的“对”与“不对”,就有可能犯错误。
当我们认为参数的某个假设 H0 正确时(接受假设H0时), 有可能假设 H0 本身是错误的,而我们把它当作正确的,
称犯了第二类错误(“存伪”的错误),我们应当保证犯
这种错误的概率很小,也就是概率=P{接受H0 | H0为假} 很小。
反之,当我们拒绝假设H0 时,也可能犯“以真为假”的错
误(“弃真”的错误),称为犯第一类错误。当然,我们也
希望所犯的“以真为假”错误的概率很小,也就是 =P{
拒绝H0 | H0为真}很小。
实际情况 H 0 为真
结论 接受 H 0 拒绝 H 0
H 0 为假
第 II 类错误
第 I 类错误
=第I类错误的概率 = Pr{拒绝 H0 | H0 为真} 显著水平 =第II类错误的概率 = Pr{接受 H0 | H0 为假}
与 之间的关系 – 与 之间具有反向关系 当进行假设检验时,必须预先确定与 哪个更重要 为了防止错误拒绝 H0 尽量减少拒绝H0 的机率 降低 ,提高 为了防止错误接受H0 尽量减少接受H0 的机率 提高,降低
举例:
测试一座桥梁是否可以安全地承受至少50吨的运输量 a)你是想犯第I 类错误还是第II类错误? b)你是采用较低的显著水平还是较高的显著水平? H0 : 50 而 HA : < 50
1、参数假设检验: 已知总体分布,猜出总体的某个参数(假设H0),用一组 样本来检验这个假设是否正确(是接受还是拒绝H0 )。 2、非参数假设检验:
猜出总体分布(假设H0),用一组样本来检验这个假设是
否正确(是接受还是拒绝H0 )。 在检验中,我们通常设法保证“弃真”(以真为假)的错 误的概率很小,也就是概率 P{拒绝H0 | H0为真}很小。这是
构造假设
决策原则 – p值法: 什么是“‘p值” – 如果H0 为真, 几乎不可能获得样本统计量的值,或者说在研究过程中 获得样本统计量值的概率非常小。 p值大 p值小 H0 可能为真 H0可能为假
原假设 (H0) 或备择假设(HA) – p值 > 显著水平 () p值 < 显著水平 ()
我们在假设检验时,分析问题的主线。
原假设 (H0)
对被研究的总体参数做试探性的假设
备择假设 (HA) 原假设(H0)的对立面 H0 和 HA 是两个对抗性陈述 ----- 被观察的样本数据只能支 持其中一个陈述 .
构造假设
H 0 : 0 vs. H : 0 A
第五章
参数假设检验
构造假设
§ 5.1 假设检验的概念
什么是“假设检验” – 处理“可信度”的基本概念 判断样本统计量值与总体(参数)假设值之间是否存在可 以观察到的差值,以及这种差值在统计上是否明显. 可以观察到的差值 由于随机原因
或者
存在实质性的差别
假设检验可分为:参数假设检验和非参数假设检验。
接受 H0 拒绝 H0
与总体均值有关的决策
步骤1 构造H0和 HA
步骤2
整理基本信息 , 确定“抽样分布”(Z 分布或 t分布) 计算检验统计量
步骤3
与总体均值有关的决策
步骤4 确定检验类型(单尾或双尾)以及 确定 p值 或者 确定临界值和临界区域 做出决定 –决定“拒绝”或者“接受” H0 H0
称为显著性水平.
/2
/2
-k
k
算得该 z =0.067, (取=0.05 )小于 k= z 0.025=1.96, 所以 不应当拒绝假设H0 :=10(毫米).
与总体均值有关的决策
未知 – 大样本 无论X服从什么分布,当样本容量 n 30时,可以用样 本标准差s来估计未知标准差
解: 首先设: 原假设H0 :=10(毫米) 备择假设H1 :10(毫米) 其次: 构造一个统计量, 要满足: a. 其分布和参数已 知; b . 在已知条件下, 能算出这个 统计量.
构造统计量为:
Z X
~ N (0,1)
n
设原假设H0成立, 如果原假设H0是正确的, 我们希望拒绝 H0(犯错误)的概率很小, 也就是 P( |Z| k ) = 很小.
vs.
H0 : HA :
= 1,000 1,000
构造假设
举例:
一名销售经理要求其销售人员将每天的交通费用控制在100 元之内,为此,他从日常交通费用中抽取了一个样本来检查 是否将有关费用控制在规定的范围内。请构造原假设和备择 假设。
vs.
H0 :
HA :
100
> 100
例:已知生产线上生产出来的零件直径服从正态分布,现 有假设 H0 :=10(毫米). 这个假设可以是生产标准的要求. 现有一组样本观测值: 10.01, 10.02, 10.02, 9.99 (在实际问题 样本容量大些更好).
请判断假设H0 :=10(毫米)是否正确. 解: 首先设: 原假设H0 :=10(毫米)
举例:
当地一家体育馆新上任的经理被他的前任告知:会员资格的平均 年限为8.7年。为此,他随机抽取了15份会员文件,结果发现会员 资格的平均年限为7.2年,标准差为2.5年。假设这家体育馆的会 员资格年限近似服从正态分布。当显著水平 = 0.05时,样本结 果是否表明这家体育馆的实际会员资格年限小于8.7年?
(3)未知方差2,假设 H0 : 0 (或 0), 通过样本 观测值x1,x2,·,xn ,检验H0 是否成立。 · ·
与总体均值有关的决策
已知 X 服从均值为 、标准差为 (已知)的正态分布 ; 或者 虽然X不 服从正态分布,但其样本容量 n 30,而且已 知其均值为 、标准差为 X 服从均值 的正态分布 检验统计量
第I类错误 = Pr{拒绝H0 | H0 为真} 第II类错误 = Pr{接受 H0 | H0为假} 第II类错误会导致非常严重的后果(断定桥梁安全, 而事实上它并不安全)
提高 ,降低
什么是“检验统计量”? –
“检验统计量”是指:样本统计量值与总体参数假 设值之间可以观察到的差值,它可以用标准误差来 表示。
与总体均值有关的决策
未知 –小样本 X的分布是正态分布或接近正态分布
当样本容量 n < 30时,可以用样本标准差s来估计未知标 准差
X 近似服从自由度为n – 1的t分布 s ˆ X sX X 而且 n
t X ~ t n1 sX
检验统计量
与总体均值有关的决策
而.
HA : > 100
3 36 0.5
n = 36, = 3, 而且 X = 101, X 检验统计量
利用Z分布
Z
X 0
X
101 100 2 0.5
与总体均值有关的决策
4. 右侧尾部检验 , = 0.01
Z Z 0.01 2.325
1.
H0 : 8.7
而
HA : < 8.7
利用
2. n = 15, X = 7.2, s = 2.5, 而且 s 2.5 0.6455 X 15 t14分布
与总体均值有关的决策
3. 4. 检验统计量
t X 0 7.2 8.7 2.32 sX 0.6455
1.
2.
H0 : = $575
而
HA : $575
181 33 31.51 利用 Z分布
n = 33, X = 518.5, s = 181, 而且 s X
与总体均值有关的决策
3. 4. 检验统计量
X 0 518.5 575 Z 1.79 sX 31.5
H 0 : 0 vs. H : 0 A
H 0 : 0 vs. H : 0 A
双尾
左侧尾部
右侧尾部
构造假设
举例:
一个电灯泡生产商想生产平均寿命为1,000小时的灯泡,如 果灯泡寿命太短,他就会失去客户;如果灯泡寿命太长,生 产成本则会上升。为此,他从灯泡中抽取了一个样本来观察 其平均寿命是否可以达到1,000小时。请构造H0 和 HA。
步骤5
步骤6
得出结论并进行解释
§ 5.2 一个正态总体下的参数假设检验
1、关于正态总体均值 的假设检验
关于均值的假设检验,可分如下三种情况: (1)已知方差2,假设 H0 := 0,通过样本观测值x1, x2,·,xn ,检验H0 是否成立。 · · (2)未知方差2,假设 H0 := 0,通过样本观测值x1, x2,·,xn ,检验H0 是否成立。 · ·
备择假设H1 :10(毫米)
其次: 构造一个统计量, 也要满足: a. 其分布和参数 已知; b . 在已知条件下, 能算出这个 统计量.
构造统计量为:
X T ~ t ( n 1) S n
/2
/2
-t
t
由 P( |T| t0.025 ) = , 取=0.05. 算得 |t | =1.414, t0.025 =3.182. 有|t | < t0.025. 所以接受原假设. 4、未知方差2,检验假设 H1 : > 0 (这是作为备择假 设出现) 例:已知生产线上生产出来的零件抗剪强度服从服从正态 分布,以往的数据表明抗剪强度的均值 0 =10(毫米). 现在 改用一种新材料来生产该零件,得到一组零件的抗剪强度 的样本观测值: 10.01, 10.02, 10.02, 9.99.
Z
X
X
、标准差为 X
n
X
~ N (0, 1)
与总体均值有关的决策
举例: 一家医院正在使用某种药品,已知药品每包的平均剂量为 100 cm3,标准差为3cm3。随机抽取36包药品作为一个样本, 并得到每包药品的平均剂量为101cm3。检验当 = 0.01时, 每包药品的剂量是否过大。
决策原则 – 临界区域法:
什么是“临界值” (CV) – “显著水平” 单尾或双尾检验 Z分布或者t分布
什么是“临界区域” (CR) 或 拒绝 域 尾部区域超过了临界值
原假设 (H0) 或备择假设(HA) – 检验统计量落在临界区域之外 接受 H0 检验统计量落在临界区域之内 拒绝 H0
左侧尾部检验 , = 0.05 t n1, t14,0.05 1.761 临界 值= – 1.761
CR = 0.05
95%的面积
5.
检验统计量落在临界区域之内 拒绝 H0
CV = –1.761 TS = – 2.32
t14
6.
数据显示:当显著水平 = 0.05时,这家体育馆会员资格的平 均年限明显小于8.7年
/2 = 0.025
双尾检验 , = 0.05 Z Z0.025 1.96 临界 值= 1.96
2
/2 = 0.025
95%的面积
5.
检验统计量落在临界区域之外 接受 H0
Z
CV = –1.96 TS = –1.79 CV = 1.96
6.
当 = 0.05时,数据看来支持信贷经理的陈述 审计人员无 需审查所有的赊购帐户 。
临界值 = 2.325 检验统计量落在临界区域之外 接受 H0
99 %的面积 TS = 2.0
临界区域
= 0.01
Z
CV = 2.325
5.
6.
数据显示:当显著水平 = 0.01时,每包药品的剂量不大
例:已知生产线上生产出来的零件直径服从正态分布,已 知方差为0.09(毫米2) , 现有假设 H0 :=10(毫米). 这个假设 可以是生产标准的要求. 现有一组样本观测值: 10.01, 10.02, 10.02, 9.99 (在实际问题样本容量大些更好). 请判断这批零件的平均直径 =10(毫米)是否正确.
X近似服从以下参数的正态分布 X
ˆ X sX
检验统计量
Z X ~ N (0, 1) sX
s n
与总体均值有关的决策
举例:
一家大型电子商店的信贷经理说,该商店赊购帐户上的平均余额 为575元。一名审计人员随机抽取了33名顾客作为一个样本,结果 发现赊购帐户上的平均余额为518.5元、标准差为181元。如果信 贷经理的陈述得不到数据支持,审计人员将检查所有的赊购帐户。 请问当 = 0.05时,审计人员应当采取什么行动?
Fra Baidu bibliotek
两类错误
统计意义上的“对”与“不对”,就有可能犯错误。
当我们认为参数的某个假设 H0 正确时(接受假设H0时), 有可能假设 H0 本身是错误的,而我们把它当作正确的,
称犯了第二类错误(“存伪”的错误),我们应当保证犯
这种错误的概率很小,也就是概率=P{接受H0 | H0为假} 很小。
反之,当我们拒绝假设H0 时,也可能犯“以真为假”的错
误(“弃真”的错误),称为犯第一类错误。当然,我们也
希望所犯的“以真为假”错误的概率很小,也就是 =P{
拒绝H0 | H0为真}很小。
实际情况 H 0 为真
结论 接受 H 0 拒绝 H 0
H 0 为假
第 II 类错误
第 I 类错误
=第I类错误的概率 = Pr{拒绝 H0 | H0 为真} 显著水平 =第II类错误的概率 = Pr{接受 H0 | H0 为假}
与 之间的关系 – 与 之间具有反向关系 当进行假设检验时,必须预先确定与 哪个更重要 为了防止错误拒绝 H0 尽量减少拒绝H0 的机率 降低 ,提高 为了防止错误接受H0 尽量减少接受H0 的机率 提高,降低
举例:
测试一座桥梁是否可以安全地承受至少50吨的运输量 a)你是想犯第I 类错误还是第II类错误? b)你是采用较低的显著水平还是较高的显著水平? H0 : 50 而 HA : < 50
1、参数假设检验: 已知总体分布,猜出总体的某个参数(假设H0),用一组 样本来检验这个假设是否正确(是接受还是拒绝H0 )。 2、非参数假设检验:
猜出总体分布(假设H0),用一组样本来检验这个假设是
否正确(是接受还是拒绝H0 )。 在检验中,我们通常设法保证“弃真”(以真为假)的错 误的概率很小,也就是概率 P{拒绝H0 | H0为真}很小。这是
构造假设
决策原则 – p值法: 什么是“‘p值” – 如果H0 为真, 几乎不可能获得样本统计量的值,或者说在研究过程中 获得样本统计量值的概率非常小。 p值大 p值小 H0 可能为真 H0可能为假
原假设 (H0) 或备择假设(HA) – p值 > 显著水平 () p值 < 显著水平 ()
我们在假设检验时,分析问题的主线。
原假设 (H0)
对被研究的总体参数做试探性的假设
备择假设 (HA) 原假设(H0)的对立面 H0 和 HA 是两个对抗性陈述 ----- 被观察的样本数据只能支 持其中一个陈述 .
构造假设
H 0 : 0 vs. H : 0 A
第五章
参数假设检验
构造假设
§ 5.1 假设检验的概念
什么是“假设检验” – 处理“可信度”的基本概念 判断样本统计量值与总体(参数)假设值之间是否存在可 以观察到的差值,以及这种差值在统计上是否明显. 可以观察到的差值 由于随机原因
或者
存在实质性的差别
假设检验可分为:参数假设检验和非参数假设检验。
接受 H0 拒绝 H0
与总体均值有关的决策
步骤1 构造H0和 HA
步骤2
整理基本信息 , 确定“抽样分布”(Z 分布或 t分布) 计算检验统计量
步骤3
与总体均值有关的决策
步骤4 确定检验类型(单尾或双尾)以及 确定 p值 或者 确定临界值和临界区域 做出决定 –决定“拒绝”或者“接受” H0 H0
称为显著性水平.
/2
/2
-k
k
算得该 z =0.067, (取=0.05 )小于 k= z 0.025=1.96, 所以 不应当拒绝假设H0 :=10(毫米).
与总体均值有关的决策
未知 – 大样本 无论X服从什么分布,当样本容量 n 30时,可以用样 本标准差s来估计未知标准差
解: 首先设: 原假设H0 :=10(毫米) 备择假设H1 :10(毫米) 其次: 构造一个统计量, 要满足: a. 其分布和参数已 知; b . 在已知条件下, 能算出这个 统计量.
构造统计量为:
Z X
~ N (0,1)
n
设原假设H0成立, 如果原假设H0是正确的, 我们希望拒绝 H0(犯错误)的概率很小, 也就是 P( |Z| k ) = 很小.
vs.
H0 : HA :
= 1,000 1,000
构造假设
举例:
一名销售经理要求其销售人员将每天的交通费用控制在100 元之内,为此,他从日常交通费用中抽取了一个样本来检查 是否将有关费用控制在规定的范围内。请构造原假设和备择 假设。
vs.
H0 :
HA :
100
> 100
例:已知生产线上生产出来的零件直径服从正态分布,现 有假设 H0 :=10(毫米). 这个假设可以是生产标准的要求. 现有一组样本观测值: 10.01, 10.02, 10.02, 9.99 (在实际问题 样本容量大些更好).
请判断假设H0 :=10(毫米)是否正确. 解: 首先设: 原假设H0 :=10(毫米)
举例:
当地一家体育馆新上任的经理被他的前任告知:会员资格的平均 年限为8.7年。为此,他随机抽取了15份会员文件,结果发现会员 资格的平均年限为7.2年,标准差为2.5年。假设这家体育馆的会 员资格年限近似服从正态分布。当显著水平 = 0.05时,样本结 果是否表明这家体育馆的实际会员资格年限小于8.7年?
(3)未知方差2,假设 H0 : 0 (或 0), 通过样本 观测值x1,x2,·,xn ,检验H0 是否成立。 · ·
与总体均值有关的决策
已知 X 服从均值为 、标准差为 (已知)的正态分布 ; 或者 虽然X不 服从正态分布,但其样本容量 n 30,而且已 知其均值为 、标准差为 X 服从均值 的正态分布 检验统计量
第I类错误 = Pr{拒绝H0 | H0 为真} 第II类错误 = Pr{接受 H0 | H0为假} 第II类错误会导致非常严重的后果(断定桥梁安全, 而事实上它并不安全)
提高 ,降低
什么是“检验统计量”? –
“检验统计量”是指:样本统计量值与总体参数假 设值之间可以观察到的差值,它可以用标准误差来 表示。
与总体均值有关的决策
未知 –小样本 X的分布是正态分布或接近正态分布
当样本容量 n < 30时,可以用样本标准差s来估计未知标 准差
X 近似服从自由度为n – 1的t分布 s ˆ X sX X 而且 n
t X ~ t n1 sX
检验统计量
与总体均值有关的决策