统计学 第6章 统计推断(3节)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样分布 置信水平 拒绝域 1-
图2
H0值 临界值 样本统计量
19
例如,某灯泡制造商声称,该企业所生产的灯 泡的平均使用寿命在1000小时以上 除非样本能提供证据表明使用寿命在1000 小时以下,否则就应认为厂商的声称是正 确的 建立的原假设与备择假设应为 H0: 1000 H1: 1000
1.用于假设检验决策的统计量
2.选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本
总体方差已知还是未知
例如前面引例中检验统计量的基本形式
x 0 3.95 4 Z 5 n 0.1/ 100
16
什么是显著性水平? 1. 是一个概率值 2. 3. 4. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 由研究者事先确定
0
1.645
Z
29
n 2. 小样本( 30) (2 已知或2未知)
假定条件: 总体服从正态分布, 小样本(n 30) 检验统计量 x 2 已知: z
0
2 未知:
t
n x 0
~ N (0,1)
s n
~ t (n 1)
30
2 已知小样本均值的检验
有证据表明这批灯泡的使用 寿命有显著提高
0
1.645
Z
32
2 未知小样本均值的检验
(例题分析)
【例】某机器制造出的肥 皂厚度为5cm,今欲了解 机器性能是否良好,随机 抽取10块肥皂为样本,测 得平均厚度为5.3cm,标 准 差 为 0.3cm , 试 以 0.05 的显著性水平检验机器性 能良好的假设。
36
单侧检验!
均值的单尾 t 检验
(计算结果)
H0: 40000 检验统计量: x 0 H1: < 40000 t s n = 0.05 df = 20 - 1 =19 41000 40000 0.894 临界值(s): 5000 20
拒绝域 .05
决策:
在 = 0.05的水平上不拒绝H0
例如:某企业用一台包装机包装食品,标准 重量为500g,假设食品重量服从正态分布, 且有长期经验知道其标准差为15 g,某日开 工后从生产的包装食品中随机抽取9包,测 得它们的平均重量为511 g,试检验包装机 包装的食品重量是否显著高于规定水平?
解:建立的假设为:
H 0 : 500
H1 : 500
2 未知:
Z
X 0 S n
~ N (0,1)
24
2 已知大样本均值的检验
【例】 一种罐装饮料采用自动生
产线生产,每罐的容量是255ml, 标准差为5ml。为检验每罐容量是 否符合要求,质检人员在某天生产 的饮料中随机抽取了40罐迚行检验, 测得每罐平均容量为255.8ml。取 显著性水平=0.05 ,检验该天生 产的饮料容量是否符合标准要求?
有参数假设检验和非参数假设检 验
6
假设检验的过程
(提出假设→抽取样本→作出决策)
提出假设 作出决策
拒绝假设! 别无选择.
总体
我认为人口的平 均年龄是50岁
抽取随机样本
均值 X = 20
7
原假设和备择假设
什么是原假设? 也叫待检验的假设,又称“0假设” 研究者想收集证据予以反对的假设 总是有等号 , 或 表示为 H0 H0: 某一数值 或 某一数值 或 某一数值 例如, H0: 4cm
22
二、 总体平均数的检验
大
样本容量n
否 是
小
是
是否已 知
是否已 知
来自百度文库
否
z 检验
z
x 0
z 检验
z 检验
t 检验
n
z
x 0 s n
z
x 0
n
t
x 0 s n
23
1.大样本( n 30 )(2 已知或2未知)
假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似 (n30) 使用Z-统计量 X 0 Z ~ N (0,1) n 2 已知:
双侧检验
33
2 未知小样本均值的检验
(例题分析)
检验统计量: H0 : = 5 x 0 5.3 5 H1: 5 t 3.16 = 0.05df = 10 - 1 = 9 s n 0.3 10 决策: 临界值(s):
拒绝 H0
.025
拒绝 H0
.025
在 = 0.05的水平上拒绝H0
2 已知均值的检验
(小样本例题分析)
H0: 1020 检验统计量: x 0 1080 1020 H1: > 1020 z 2.4 n 100 16 = 0.05 n = 16 决策: 临界值(s): 在 = 0.05的水平上拒绝H
拒绝域 0.05
0
结论:
工艺改革前后零件的长度 是否发生了显著的变化?
1.基本概念
假设是指对总体参数的的数值所作 的一种陈述
总体参数包括总体均值、比例、方差等
分析之前必需陈述
我认为该企业生 产的零件的平均 长度为4厘米!
5
1.基本概念
假设检验是指事先对总体参数或分 布形式作出某种假设,然后利用样 本信息来判断原假设是否成立
(小样本例题分析)
【例】根据过去大量资料, 某厂生产的灯泡的使用寿命 服 从 正 态 分 布 N~(1020 , 1002)。现从最近生产的一批 产品中随机抽取16只,测得 样本平均寿命为1080小时。 试在0.05的显著性水平下判 断这批产品的使用寿命是否 有显著提高?(=0.05)
单侧检验
31
结论:
说明该机器的性能不好
-2.262
0
2.262
t
34
2 未知小样本均值的检验
(P 值的计算与应用)
第1步:迚入Excel表格界面,选择“插入”下拉菜 单 第2步:选择“函数”点击,并在函数分类中点击 “统 计” ,然后,在函数名的菜单中选择字符 “TDIST”,确定 第3步:在弹出的X栏中录入计算出的t值3.16 在自由度(Deg-freedom)栏中录入9 在Tails栏中录入2,表明是双侧检验(单测 检验则在该栏内录入1) P值的结果为0.01155<0.025,拒绝H0
不拒绝H0
拒绝 H0
0.025
结论:
样本提供的证据还不足以推翻 “该天生产的饮料符合标准要 求 ”的看法
26
-1.96
0
1.96
z
2 已知均值的检验
(P 值的计算与应用)
第1步:迚入Excel表格界面,直接点击【f(x)】 第2步:在函数分类中点击【统计】,并在函数名 菜单下选择【NORMSDIST】,然后【确定】 第3步:将 z 的绝对值1.01录入,得到的函数值为 0.843752345 P值=2(1-0.843752345)=0.312495 P值进进大于,故不拒绝H0
1. 第一类错误(弃真错误) 原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为 被称为显著性水平 2. 第二类错误(取伪错误) 原假设为假时接受原假设 第二类错误的概率为 (Beta)
10
假设检验中的两类错误
(决策结果)
H0: 无罪
假设检验就好像 一场审判过程
统计检验过程
陪审团审判 裁决 无罪 实际情况 无罪 正确 有罪 错误 决策 接受H0
35
2 未知小样本均值的检验
(例题分析)
【例】一个汽车轮胎制造商声 称,某一等级的轮胎的平均寿 命在一定的汽车重量和正常行 驶条件下大于40000公里,对一 个由20个轮胎组成的随机样本 作了试验,测得平均值为41000 公里,标准差为5000公里。已 知轮胎寿命的公里数服从正态 分布,我们能否根据这些数据 作出结论,该制造商的产品同 他所说的标准相符?( = 0.05)
17
将检验统计量的值与 水平的临界值迚行比 较,得出拒绝或不拒绝原假设的结论。 具体结论还要看是双侧检验还是单侧检验。 双侧检验是指拒绝域在两侧的检验,如图1所 示。原假设用符号“=”来表示。决策规则为: 若|检验统计量| > 临界值,则拒绝H0 ;或者根 据检验统计量可以计算出相应的概率P,与显 著性水平/2大小迚行比较,若 p / 2,则拒 绝H0 。
双侧检验
绿色 健康饮品
绿色
健康饮品
255
255
25
总体均值的检验( 2 已知)
(例题分析)
H0 : = 255 H1 : 255 = 0.05 n = 40
临界值(c): 拒绝 H0
0.025
检验统计量: x 0 255.8 255 z 1.01 n 5 40 决策:
单侧检验
28
2 未知大样本均值的检验
(例题分析)
H0: 1200 H1: >1200 = 0.05 n = 100 临界值(s):
拒绝域 0.05
检验统计量:
z
x 0
n
1245 1200 300 100
1.5
决策:
在 = 0.05的水平上不拒绝H0
结论:
不能认为该厂生产的元件寿命 显著地高于1200小时
H0 检验 实际情况 H0为真 1- H0为假
有罪
错误
正确
拒绝H0
第二类 错误() 第一类 功效(1) 错误()
11
假设检验中的两类错误
3. 错误和 错误的关系 和的关系就像翘翘 板,小就大, 大 就小
12
2 原理
主要是指小概率事件原理 指发生概率很小的随机事件在一次试验中 是几乎不可能发生的。
8
原假设和备择假设
什么是备择假设?
与原假设对立的假设,也称“研究假设”
研究者想收集证据予以支持的假设
总是有不等号: , 或 表示为 H1 H1: 某一数值, <某一数值,或 某一 数值 例如, H1: 4, < 4cm,或 4cm
9
假设检验中的两类错误
第六章
统计 推 断
第一节 统计推断及其特点
第二节 总体参数估计 第三节 假设检验
第三节
假设检验
一、 基本概念、原理及步骤
二、总体平均数的检验 三、总体比例的检验
四、总体方差的检验
一、基本概念、原理与步骤
1.基本概念 2.原理 3.步骤
3
引例:某企业生产一种零件,过去的大量资 料表明,零件的平均长度为4CM,标准差为 0.1CM.改革工艺后,抽查了100个零件,测得 样本平均长度为3.95CM。
20
右侧检验是指拒绝域在右侧的检验,如图3 所示。原假设用符号“ ”来表示。决策规 则为:统计量 > 临界值,拒绝H0 ;或者根据 检验统计量可以计算出相应的概率P,与显著 p 性水平大小迚行比较,若 ,则拒绝H0 。
抽样分布 置信水平 拒绝域
1-
图3
H0值 临界值 样本统计量
21
结论:
t
不能认为制造商的产品同他所 说的标准不相符
37
-1.7291 0
例如:某厂产品的合格率是99%,从一批 (100件)产品中随机抽取一件,恰好是次品的 概率为1%,随机抽取一件是次品,几乎是不可 能发生的。但是这种情况发生了,我们有利用怀 疑该厂的产品合格率为99%,这时我们犯错误的 概率是1%。这个1%就是小概率事件。
13
3 步骤
提出假设,即原假设和备择假设。
抽样分布 置信水平 拒绝域 拒绝域 /2 1- /2
图1
H0值 临界值
样本统计量
18
单侧检验又分为左侧检验和右侧检验。 左侧检验是指拒绝域在左侧的检验。如图2 所示。原假设用符号“ ”来表示。决策规 则为:若检验统计量 < –临界值,则拒绝H0 ; 或者根据检验统计量可以计算出相应的概率 P,与显著性水平大小迚行比较,若 p , 则拒绝H0 。
确定适当的检验统计量,并计算其
值。 确定显著性水平,并查出其相应 临界值。 作出统计决策。
14
例如前面例子中,认为工艺改革后该企 业生产的零件的平均长度也为4 CM,即 与工艺改革前没有变化, 则原假设: 4CM , 其对立假设即备择假设为: 4CM
15
什么是检验统计量?
27
2 未知大样本均值的检验
(例题分析) 【例】某电子元件批量生产的 质量标准为平均使用寿命1200 小时。某厂宣称他们采用一种 新工艺生产的元件质量大大超 过规定标准。为了迚行验证, 随机抽取了100件作为样本,测 得平均使用寿命1245小时,标 准差300小时。能否说该厂生产 的电子元件质量显著地高于规 定标准? (=0.05)
图2
H0值 临界值 样本统计量
19
例如,某灯泡制造商声称,该企业所生产的灯 泡的平均使用寿命在1000小时以上 除非样本能提供证据表明使用寿命在1000 小时以下,否则就应认为厂商的声称是正 确的 建立的原假设与备择假设应为 H0: 1000 H1: 1000
1.用于假设检验决策的统计量
2.选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本
总体方差已知还是未知
例如前面引例中检验统计量的基本形式
x 0 3.95 4 Z 5 n 0.1/ 100
16
什么是显著性水平? 1. 是一个概率值 2. 3. 4. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 由研究者事先确定
0
1.645
Z
29
n 2. 小样本( 30) (2 已知或2未知)
假定条件: 总体服从正态分布, 小样本(n 30) 检验统计量 x 2 已知: z
0
2 未知:
t
n x 0
~ N (0,1)
s n
~ t (n 1)
30
2 已知小样本均值的检验
有证据表明这批灯泡的使用 寿命有显著提高
0
1.645
Z
32
2 未知小样本均值的检验
(例题分析)
【例】某机器制造出的肥 皂厚度为5cm,今欲了解 机器性能是否良好,随机 抽取10块肥皂为样本,测 得平均厚度为5.3cm,标 准 差 为 0.3cm , 试 以 0.05 的显著性水平检验机器性 能良好的假设。
36
单侧检验!
均值的单尾 t 检验
(计算结果)
H0: 40000 检验统计量: x 0 H1: < 40000 t s n = 0.05 df = 20 - 1 =19 41000 40000 0.894 临界值(s): 5000 20
拒绝域 .05
决策:
在 = 0.05的水平上不拒绝H0
例如:某企业用一台包装机包装食品,标准 重量为500g,假设食品重量服从正态分布, 且有长期经验知道其标准差为15 g,某日开 工后从生产的包装食品中随机抽取9包,测 得它们的平均重量为511 g,试检验包装机 包装的食品重量是否显著高于规定水平?
解:建立的假设为:
H 0 : 500
H1 : 500
2 未知:
Z
X 0 S n
~ N (0,1)
24
2 已知大样本均值的检验
【例】 一种罐装饮料采用自动生
产线生产,每罐的容量是255ml, 标准差为5ml。为检验每罐容量是 否符合要求,质检人员在某天生产 的饮料中随机抽取了40罐迚行检验, 测得每罐平均容量为255.8ml。取 显著性水平=0.05 ,检验该天生 产的饮料容量是否符合标准要求?
有参数假设检验和非参数假设检 验
6
假设检验的过程
(提出假设→抽取样本→作出决策)
提出假设 作出决策
拒绝假设! 别无选择.
总体
我认为人口的平 均年龄是50岁
抽取随机样本
均值 X = 20
7
原假设和备择假设
什么是原假设? 也叫待检验的假设,又称“0假设” 研究者想收集证据予以反对的假设 总是有等号 , 或 表示为 H0 H0: 某一数值 或 某一数值 或 某一数值 例如, H0: 4cm
22
二、 总体平均数的检验
大
样本容量n
否 是
小
是
是否已 知
是否已 知
来自百度文库
否
z 检验
z
x 0
z 检验
z 检验
t 检验
n
z
x 0 s n
z
x 0
n
t
x 0 s n
23
1.大样本( n 30 )(2 已知或2未知)
假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似 (n30) 使用Z-统计量 X 0 Z ~ N (0,1) n 2 已知:
双侧检验
33
2 未知小样本均值的检验
(例题分析)
检验统计量: H0 : = 5 x 0 5.3 5 H1: 5 t 3.16 = 0.05df = 10 - 1 = 9 s n 0.3 10 决策: 临界值(s):
拒绝 H0
.025
拒绝 H0
.025
在 = 0.05的水平上拒绝H0
2 已知均值的检验
(小样本例题分析)
H0: 1020 检验统计量: x 0 1080 1020 H1: > 1020 z 2.4 n 100 16 = 0.05 n = 16 决策: 临界值(s): 在 = 0.05的水平上拒绝H
拒绝域 0.05
0
结论:
工艺改革前后零件的长度 是否发生了显著的变化?
1.基本概念
假设是指对总体参数的的数值所作 的一种陈述
总体参数包括总体均值、比例、方差等
分析之前必需陈述
我认为该企业生 产的零件的平均 长度为4厘米!
5
1.基本概念
假设检验是指事先对总体参数或分 布形式作出某种假设,然后利用样 本信息来判断原假设是否成立
(小样本例题分析)
【例】根据过去大量资料, 某厂生产的灯泡的使用寿命 服 从 正 态 分 布 N~(1020 , 1002)。现从最近生产的一批 产品中随机抽取16只,测得 样本平均寿命为1080小时。 试在0.05的显著性水平下判 断这批产品的使用寿命是否 有显著提高?(=0.05)
单侧检验
31
结论:
说明该机器的性能不好
-2.262
0
2.262
t
34
2 未知小样本均值的检验
(P 值的计算与应用)
第1步:迚入Excel表格界面,选择“插入”下拉菜 单 第2步:选择“函数”点击,并在函数分类中点击 “统 计” ,然后,在函数名的菜单中选择字符 “TDIST”,确定 第3步:在弹出的X栏中录入计算出的t值3.16 在自由度(Deg-freedom)栏中录入9 在Tails栏中录入2,表明是双侧检验(单测 检验则在该栏内录入1) P值的结果为0.01155<0.025,拒绝H0
不拒绝H0
拒绝 H0
0.025
结论:
样本提供的证据还不足以推翻 “该天生产的饮料符合标准要 求 ”的看法
26
-1.96
0
1.96
z
2 已知均值的检验
(P 值的计算与应用)
第1步:迚入Excel表格界面,直接点击【f(x)】 第2步:在函数分类中点击【统计】,并在函数名 菜单下选择【NORMSDIST】,然后【确定】 第3步:将 z 的绝对值1.01录入,得到的函数值为 0.843752345 P值=2(1-0.843752345)=0.312495 P值进进大于,故不拒绝H0
1. 第一类错误(弃真错误) 原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为 被称为显著性水平 2. 第二类错误(取伪错误) 原假设为假时接受原假设 第二类错误的概率为 (Beta)
10
假设检验中的两类错误
(决策结果)
H0: 无罪
假设检验就好像 一场审判过程
统计检验过程
陪审团审判 裁决 无罪 实际情况 无罪 正确 有罪 错误 决策 接受H0
35
2 未知小样本均值的检验
(例题分析)
【例】一个汽车轮胎制造商声 称,某一等级的轮胎的平均寿 命在一定的汽车重量和正常行 驶条件下大于40000公里,对一 个由20个轮胎组成的随机样本 作了试验,测得平均值为41000 公里,标准差为5000公里。已 知轮胎寿命的公里数服从正态 分布,我们能否根据这些数据 作出结论,该制造商的产品同 他所说的标准相符?( = 0.05)
17
将检验统计量的值与 水平的临界值迚行比 较,得出拒绝或不拒绝原假设的结论。 具体结论还要看是双侧检验还是单侧检验。 双侧检验是指拒绝域在两侧的检验,如图1所 示。原假设用符号“=”来表示。决策规则为: 若|检验统计量| > 临界值,则拒绝H0 ;或者根 据检验统计量可以计算出相应的概率P,与显 著性水平/2大小迚行比较,若 p / 2,则拒 绝H0 。
双侧检验
绿色 健康饮品
绿色
健康饮品
255
255
25
总体均值的检验( 2 已知)
(例题分析)
H0 : = 255 H1 : 255 = 0.05 n = 40
临界值(c): 拒绝 H0
0.025
检验统计量: x 0 255.8 255 z 1.01 n 5 40 决策:
单侧检验
28
2 未知大样本均值的检验
(例题分析)
H0: 1200 H1: >1200 = 0.05 n = 100 临界值(s):
拒绝域 0.05
检验统计量:
z
x 0
n
1245 1200 300 100
1.5
决策:
在 = 0.05的水平上不拒绝H0
结论:
不能认为该厂生产的元件寿命 显著地高于1200小时
H0 检验 实际情况 H0为真 1- H0为假
有罪
错误
正确
拒绝H0
第二类 错误() 第一类 功效(1) 错误()
11
假设检验中的两类错误
3. 错误和 错误的关系 和的关系就像翘翘 板,小就大, 大 就小
12
2 原理
主要是指小概率事件原理 指发生概率很小的随机事件在一次试验中 是几乎不可能发生的。
8
原假设和备择假设
什么是备择假设?
与原假设对立的假设,也称“研究假设”
研究者想收集证据予以支持的假设
总是有不等号: , 或 表示为 H1 H1: 某一数值, <某一数值,或 某一 数值 例如, H1: 4, < 4cm,或 4cm
9
假设检验中的两类错误
第六章
统计 推 断
第一节 统计推断及其特点
第二节 总体参数估计 第三节 假设检验
第三节
假设检验
一、 基本概念、原理及步骤
二、总体平均数的检验 三、总体比例的检验
四、总体方差的检验
一、基本概念、原理与步骤
1.基本概念 2.原理 3.步骤
3
引例:某企业生产一种零件,过去的大量资 料表明,零件的平均长度为4CM,标准差为 0.1CM.改革工艺后,抽查了100个零件,测得 样本平均长度为3.95CM。
20
右侧检验是指拒绝域在右侧的检验,如图3 所示。原假设用符号“ ”来表示。决策规 则为:统计量 > 临界值,拒绝H0 ;或者根据 检验统计量可以计算出相应的概率P,与显著 p 性水平大小迚行比较,若 ,则拒绝H0 。
抽样分布 置信水平 拒绝域
1-
图3
H0值 临界值 样本统计量
21
结论:
t
不能认为制造商的产品同他所 说的标准不相符
37
-1.7291 0
例如:某厂产品的合格率是99%,从一批 (100件)产品中随机抽取一件,恰好是次品的 概率为1%,随机抽取一件是次品,几乎是不可 能发生的。但是这种情况发生了,我们有利用怀 疑该厂的产品合格率为99%,这时我们犯错误的 概率是1%。这个1%就是小概率事件。
13
3 步骤
提出假设,即原假设和备择假设。
抽样分布 置信水平 拒绝域 拒绝域 /2 1- /2
图1
H0值 临界值
样本统计量
18
单侧检验又分为左侧检验和右侧检验。 左侧检验是指拒绝域在左侧的检验。如图2 所示。原假设用符号“ ”来表示。决策规 则为:若检验统计量 < –临界值,则拒绝H0 ; 或者根据检验统计量可以计算出相应的概率 P,与显著性水平大小迚行比较,若 p , 则拒绝H0 。
确定适当的检验统计量,并计算其
值。 确定显著性水平,并查出其相应 临界值。 作出统计决策。
14
例如前面例子中,认为工艺改革后该企 业生产的零件的平均长度也为4 CM,即 与工艺改革前没有变化, 则原假设: 4CM , 其对立假设即备择假设为: 4CM
15
什么是检验统计量?
27
2 未知大样本均值的检验
(例题分析) 【例】某电子元件批量生产的 质量标准为平均使用寿命1200 小时。某厂宣称他们采用一种 新工艺生产的元件质量大大超 过规定标准。为了迚行验证, 随机抽取了100件作为样本,测 得平均使用寿命1245小时,标 准差300小时。能否说该厂生产 的电子元件质量显著地高于规 定标准? (=0.05)