第四章 假设检验(1)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 假设检验
§4.1
关于总体未知分布或对已知分布总体中未知 参数的假设称为统计假设,简称假设;
对样本进行考察,从而决定假设是否成立的 方法称为假设检验,简称检验;
例1:罐装可乐的标准容量是250毫升
生产流水线上罐装可 乐不断地封装,然后装箱 外运. 怎么知道这批罐装 可乐的容量是否合格呢? 通常的办法是每隔一段时间进行抽样检查.
例2(医疗领域)为了检验某种新疗法是否比传统 疗法更有效,对40名患者进行实验。把病人分 成两组,每组20人,第一组采用新疗法,第二 组采用传统疗法。从治疗结果表中,我们能否 认为新疗法比传统疗法更有效?即第一组的康 复人数比第二组多的原因是因为新疗法效果更 好,还是由随机因素引起的?
疗法 新疗法 传统疗法 康复 12 9 未康复 8 11
假设检验中的两类错误 小概率事件不管多小都可能发生,再加上 样本的随机性,它们可能会影响检验结果。 实际情况
决定
拒绝H0 接受H0 以真为假(弃真) 以假为真(取伪)
H0为真 第一类错误 正确
H0不真 正确 第二类错误
P(拒绝H 0 | H 0为真) P(接受H 0 | H 0为假)
2 2 0 2 2 0
2.检验统计量
2
(n 1) S
2
2 0
~ (n 1)
2
2 3. P{12 / 2 (n 1) 2 / 2 ( n 1)} 1
得拒绝域是 (0,
2 1 / 2
(n 1)) ( / 2 (n 1), )
期望已知,关于方差的假设检验
双侧检验:
1.提出假设: H 0 : , H 1 :
2 2 0 2
2 0
2.检验统计量
2
1
2 0 i 1
(X
2
n
i
) ~ ( n)
2 2
3.
P{
2 1 / 2
(n) / 2 (n)} 1
n 16, X 20.8, S 1.617 , 0.05
X 0 20.8 19 T 4.4527 S / n 1.617 / 16
查表得 t0.025 (15) 2.1315 由于
T t0.025 (15), 应拒绝 H 0
即认为使用新工艺后维C的含量有显著变化. 另外考虑含量是否显著增大, 如何检验?
例6 从某单位一年的发票存根中,随机抽取了 25张,分别记录下它们的金额(单位:元), 计算出样本均值为81.5,样本标准差为4.2。假 定该单位一年内的发票金额服从正态分布,能 否认为这一年内发票平均金额大于80元?(取 显著性水平α=0.05 )
解: H 0 : 80 H1 : 80
n 25, X 80.5, S 4.2, 0.05
X 0 81.5 80 T 1.7857 S / n 4.2 / 25
查表得 t0.05 (24) 1.7109 由于 T t0.05 (24) , 应拒绝 H 0 即可以认为这一年内发票平均金额大于80元.
解:
H 0 : 5 H1 : 5
n 16,
X 4.8, S 0.4, 0.01
X 0 4.8 5 T 2.0 S / n 0.4 / 16
查表得 t0.01 (15) 2.6025 由于 T t0.01 (15) , 应接受 H 0 即不能认为该校男教师的平均胆固醇水平明 显低于5个单位.
2
得拒绝域是
(0,
2 1 / 2
(n)) ( / 2 (n), )
2
2 4.由样本值计算出 的值 2 5.若 落在拒绝域内,则拒绝H0;否则 接受H0。
左侧检验:
H 0 : , H1 :
2 2 0 2 2 0
拒绝域为 (0, 12 (n)) 右侧检验:
解:H 0 : 72 H1 : 72
X 0 68.6 72 U 2.656 / n 6.4 / 25
查表得
u0.05 1.64
由于 U u0.05 1.64 ,应拒绝 H 0
即可以认为该体院男生的平均脉搏次数明显低 于一般健康成年男子。
例3 长期统计资料表明,某市轻工产品月产值 占工业产品月总产值的百分比服从方差为1.21 的正态分布。以下是随机抽查9个月份的数据 (%): 30.3 30.1 30.5 29.6 31.6 30.0 31.8 31.0 28.8 能否认为过去该市轻工产品月产值占工业产品 月总产值的百分比平均大于30%?(取显著性 水平α=0.05 )
得拒绝域是
(, u / 2 ) (u / 2 , )
4.由样本值计算出U的值
5.若U落在拒绝域内,则拒绝H0;否则 接受H0。
例1 可乐容量总体 X ~ N (250, 32 ) (单位:毫升),现 在抽取了4罐,其容量分别为248,246,252,242, 问封装系统是否正常工作? (取显著性水平 α=0.05 ) 解: H 0 : 250;
左侧检验:
H 0 : 0 H1 : 0
拒绝域为 (, t (n 1)) 右侧检验:
H 0 : 0
H1 : 0
拒绝域为 (t (n 1), )
例5 为考察某大学男教师的胆固醇水平,随机 抽取了16名男教师,测定他们的胆固醇后,计 算出样本均值为4.8,样本标准差为0.4。假定该 校男教师的胆固醇水平服从正态分布,是否可 以认为该校男教师的平均胆固醇水平明显低于5 个单位?(取显著性水平α=0.01 )
方差未知,关于期望的假设检验
双侧检验:
H 0 : 0 1.提出假设: H1 : 0
~ t (n 1)
2.检验统计量 T 3.
X 0 S/ n
X 0 P{| | t / 2 (n 1)} S n
得拒绝域是 (, t / 2 (n 1)) (t / 2 (n 1), ) 4.由样本值计算出T的值 5.若T落在拒绝域内,则拒绝H0;否则 接受H0。
H1 : 250
X 0 247 250 U 2.00 / n 3/ 4 查表得 u0.025 1.96
由于 U u0.025 1.96 U落在拒绝域内,应拒绝H0;即认为系统不正常。
左侧检验:
H 0 : 0
H1 : 0
拒绝域为 (, u ) 右侧检验:
解:
H 0 : 2 0.048 2 , H 1 : 2 0.048 2
n 5, 1.405, 0.05
(X
i 1
2
n
i
) 0.0315
2
n 2
1 2 ( X i ) 0.0315 13.67 2 0 i 1 0.048
1
查表得
2 2 0 ( 5 ) 12 . 833 , .025 0.975 (5) 0.831
由于 13.67 12.833
2
所以拒绝 H 0 , 即认为这一天生产的维尼 纶纤度的方差不正常.
期望未知,关于方差的假设检验
双侧检验: 1.提出假设: H 0 : , H 1 :
H 0 : 0
H1 : 0
拒绝域为 (u , )
例2 据统计资料,我国健康成年男子每分钟脉 搏次数服从正态分布 N (72, 6.42 ) ,现从某体院 男生中随机抽取了25人,测定他们的每分钟脉 搏次数后,计算出样本均值为68.6,假定该体院 男生的脉搏次数服从正态分布,且标准差不变。 问能否认为该体院男生的平均脉搏次数明显低 于一般健康成年男子? (取显著性水平α=0.05 )
假设检验的类型
原假设是关于总体参数的,则称之为参数 假设;
检验参数假设的问题,称为参数检验; 原假设是关于总体分布类型的,则称之为 分布假设; 检验分布假设的问题,称之为分布检验, 或称为非参数检验.
假设检验的基本原理 “小概率事件”原理:概率很小的事件在一次 试验中几乎不可能发生。 基本思想:
例4 用传统工艺加工的某种水果罐头中,每瓶 的平均维生素C的含量为19(mg).现改变了加工 工艺,抽查了16瓶,测得维C含量的平均值为 20.8,样本标准差为1.617.假定水果罐头中维C 含量服从正态分布。问使用新工艺后维C的含 量是否有显著变化(显著水平α=0.05 )?
解: H 0 : 19 H1 : 19
解:H 0 : 30 H1 : 30
n 9, X 30.4, 1.1, 0.05
X 0 30.4 30 U 1.09 / n 1.1 / 9 查表得 u0.05 1.64
由于 U u0.05 ,应接受 H 0
即不能认为过去该市轻工产品月产值占工业 产品月总产值的百分比平均大于30% 。
H 0 : , H1 :
2 2 0 2 2 0
拒绝域为 ( (n), )
2
例7 设维尼纶纤度在正常生产条件下服从正态分 布N(1.405, 0.0482),某日抽取5根纤维,测得其纤 度为:1.32 1.36 1.55 1.44 1.40 问:某天生产的维尼纶纤度的方差是否正常? X ~ N ( , 2 ) ,关于总体参数 , 2
讨论4种假设检验: 1. 方差已知,关于期望的假设检验 2. 方差未知,关于期望的假设检验
3. 期望已知,关于方差的假设检验
4. 期望未知,关于方差的假设检验
方差已知,关于期望的假设检验
双侧检验:
1.提出假设:H 0 : 0 H 1 : 0 X 0 ~ N (0,1) 2.检验统计量 U / n X 0 3. P{| | u / 2 } n
同时减少犯两类错误的概率的唯一办 法是增大样本容量。
假设检验的一般步骤 (1) 根据实际问题需要,提出H0与H1 ; (2) 选择统计量W,要求在H0为真时, W的 分布已知; (3) 选取显著性水平α,查表确定对应α 的临界值,从而得到检验拒绝域w; (4) 利用样本观测值代入W,计算出W的值; (5) 若W落在拒绝域内,得出拒绝H0的结论; 若W落在拒绝域外,得出接受H0的结论。
例3 从某校2013年550名应届毕业生的高考成绩 中随机抽取了50个,问能否根据这50个成绩判 断该校在2013年高考成绩服从正态分布?
例4 从福州市和厦门市2013年售出的房屋中各 随机抽取200套,根据每套的单价(元/平方 米),能否判断这两个城市在2013年的房价持 平?
以上实际例子的解决都需要我们根据问 题本身提出假设,然后根据样本的信息对假 设进行检验,最后作出“是”与“否”的判 断。 定义: 检验是否为真的假设称为原假设/零假设, 用 H0表示 与H0对立的假设称为备择假设, 用 H1表示
提出 H0→ 在 H0 成立时构造统计量 W 和小概率事 件A→进行1次试验或抽样→若A发生→拒绝H0 ↓ 若A没发生→接受H0
为了描述一个小概率事件,需预先指定一个 很小的数α ,一般地, 取α=0.05或0.01,并 把α称为检验的显著性水平。
对于指定的显著性水平α ,在一定的统计思 想下,构造一个区域w (一般是一个区间或 两个区间的并集),使得如果由样本观测值 计算出统计量W的值落在w内,则意味着小 概率事件A发生了。称w为检验拒绝域。
2
2 4.由样本值计算出 的值 2 5.若 落在拒绝域内,则拒绝H0;否则 接受H0。
左侧检验:
2 2 H0 : 2 0 , H1 : 2 0
拒绝域为 (0, 12 (n 1)) 右侧检验:
2 2 H0 : 2 0 , H1 : 2 0
§4.1
关于总体未知分布或对已知分布总体中未知 参数的假设称为统计假设,简称假设;
对样本进行考察,从而决定假设是否成立的 方法称为假设检验,简称检验;
例1:罐装可乐的标准容量是250毫升
生产流水线上罐装可 乐不断地封装,然后装箱 外运. 怎么知道这批罐装 可乐的容量是否合格呢? 通常的办法是每隔一段时间进行抽样检查.
例2(医疗领域)为了检验某种新疗法是否比传统 疗法更有效,对40名患者进行实验。把病人分 成两组,每组20人,第一组采用新疗法,第二 组采用传统疗法。从治疗结果表中,我们能否 认为新疗法比传统疗法更有效?即第一组的康 复人数比第二组多的原因是因为新疗法效果更 好,还是由随机因素引起的?
疗法 新疗法 传统疗法 康复 12 9 未康复 8 11
假设检验中的两类错误 小概率事件不管多小都可能发生,再加上 样本的随机性,它们可能会影响检验结果。 实际情况
决定
拒绝H0 接受H0 以真为假(弃真) 以假为真(取伪)
H0为真 第一类错误 正确
H0不真 正确 第二类错误
P(拒绝H 0 | H 0为真) P(接受H 0 | H 0为假)
2 2 0 2 2 0
2.检验统计量
2
(n 1) S
2
2 0
~ (n 1)
2
2 3. P{12 / 2 (n 1) 2 / 2 ( n 1)} 1
得拒绝域是 (0,
2 1 / 2
(n 1)) ( / 2 (n 1), )
期望已知,关于方差的假设检验
双侧检验:
1.提出假设: H 0 : , H 1 :
2 2 0 2
2 0
2.检验统计量
2
1
2 0 i 1
(X
2
n
i
) ~ ( n)
2 2
3.
P{
2 1 / 2
(n) / 2 (n)} 1
n 16, X 20.8, S 1.617 , 0.05
X 0 20.8 19 T 4.4527 S / n 1.617 / 16
查表得 t0.025 (15) 2.1315 由于
T t0.025 (15), 应拒绝 H 0
即认为使用新工艺后维C的含量有显著变化. 另外考虑含量是否显著增大, 如何检验?
例6 从某单位一年的发票存根中,随机抽取了 25张,分别记录下它们的金额(单位:元), 计算出样本均值为81.5,样本标准差为4.2。假 定该单位一年内的发票金额服从正态分布,能 否认为这一年内发票平均金额大于80元?(取 显著性水平α=0.05 )
解: H 0 : 80 H1 : 80
n 25, X 80.5, S 4.2, 0.05
X 0 81.5 80 T 1.7857 S / n 4.2 / 25
查表得 t0.05 (24) 1.7109 由于 T t0.05 (24) , 应拒绝 H 0 即可以认为这一年内发票平均金额大于80元.
解:
H 0 : 5 H1 : 5
n 16,
X 4.8, S 0.4, 0.01
X 0 4.8 5 T 2.0 S / n 0.4 / 16
查表得 t0.01 (15) 2.6025 由于 T t0.01 (15) , 应接受 H 0 即不能认为该校男教师的平均胆固醇水平明 显低于5个单位.
2
得拒绝域是
(0,
2 1 / 2
(n)) ( / 2 (n), )
2
2 4.由样本值计算出 的值 2 5.若 落在拒绝域内,则拒绝H0;否则 接受H0。
左侧检验:
H 0 : , H1 :
2 2 0 2 2 0
拒绝域为 (0, 12 (n)) 右侧检验:
解:H 0 : 72 H1 : 72
X 0 68.6 72 U 2.656 / n 6.4 / 25
查表得
u0.05 1.64
由于 U u0.05 1.64 ,应拒绝 H 0
即可以认为该体院男生的平均脉搏次数明显低 于一般健康成年男子。
例3 长期统计资料表明,某市轻工产品月产值 占工业产品月总产值的百分比服从方差为1.21 的正态分布。以下是随机抽查9个月份的数据 (%): 30.3 30.1 30.5 29.6 31.6 30.0 31.8 31.0 28.8 能否认为过去该市轻工产品月产值占工业产品 月总产值的百分比平均大于30%?(取显著性 水平α=0.05 )
得拒绝域是
(, u / 2 ) (u / 2 , )
4.由样本值计算出U的值
5.若U落在拒绝域内,则拒绝H0;否则 接受H0。
例1 可乐容量总体 X ~ N (250, 32 ) (单位:毫升),现 在抽取了4罐,其容量分别为248,246,252,242, 问封装系统是否正常工作? (取显著性水平 α=0.05 ) 解: H 0 : 250;
左侧检验:
H 0 : 0 H1 : 0
拒绝域为 (, t (n 1)) 右侧检验:
H 0 : 0
H1 : 0
拒绝域为 (t (n 1), )
例5 为考察某大学男教师的胆固醇水平,随机 抽取了16名男教师,测定他们的胆固醇后,计 算出样本均值为4.8,样本标准差为0.4。假定该 校男教师的胆固醇水平服从正态分布,是否可 以认为该校男教师的平均胆固醇水平明显低于5 个单位?(取显著性水平α=0.01 )
方差未知,关于期望的假设检验
双侧检验:
H 0 : 0 1.提出假设: H1 : 0
~ t (n 1)
2.检验统计量 T 3.
X 0 S/ n
X 0 P{| | t / 2 (n 1)} S n
得拒绝域是 (, t / 2 (n 1)) (t / 2 (n 1), ) 4.由样本值计算出T的值 5.若T落在拒绝域内,则拒绝H0;否则 接受H0。
H1 : 250
X 0 247 250 U 2.00 / n 3/ 4 查表得 u0.025 1.96
由于 U u0.025 1.96 U落在拒绝域内,应拒绝H0;即认为系统不正常。
左侧检验:
H 0 : 0
H1 : 0
拒绝域为 (, u ) 右侧检验:
解:
H 0 : 2 0.048 2 , H 1 : 2 0.048 2
n 5, 1.405, 0.05
(X
i 1
2
n
i
) 0.0315
2
n 2
1 2 ( X i ) 0.0315 13.67 2 0 i 1 0.048
1
查表得
2 2 0 ( 5 ) 12 . 833 , .025 0.975 (5) 0.831
由于 13.67 12.833
2
所以拒绝 H 0 , 即认为这一天生产的维尼 纶纤度的方差不正常.
期望未知,关于方差的假设检验
双侧检验: 1.提出假设: H 0 : , H 1 :
H 0 : 0
H1 : 0
拒绝域为 (u , )
例2 据统计资料,我国健康成年男子每分钟脉 搏次数服从正态分布 N (72, 6.42 ) ,现从某体院 男生中随机抽取了25人,测定他们的每分钟脉 搏次数后,计算出样本均值为68.6,假定该体院 男生的脉搏次数服从正态分布,且标准差不变。 问能否认为该体院男生的平均脉搏次数明显低 于一般健康成年男子? (取显著性水平α=0.05 )
假设检验的类型
原假设是关于总体参数的,则称之为参数 假设;
检验参数假设的问题,称为参数检验; 原假设是关于总体分布类型的,则称之为 分布假设; 检验分布假设的问题,称之为分布检验, 或称为非参数检验.
假设检验的基本原理 “小概率事件”原理:概率很小的事件在一次 试验中几乎不可能发生。 基本思想:
例4 用传统工艺加工的某种水果罐头中,每瓶 的平均维生素C的含量为19(mg).现改变了加工 工艺,抽查了16瓶,测得维C含量的平均值为 20.8,样本标准差为1.617.假定水果罐头中维C 含量服从正态分布。问使用新工艺后维C的含 量是否有显著变化(显著水平α=0.05 )?
解: H 0 : 19 H1 : 19
解:H 0 : 30 H1 : 30
n 9, X 30.4, 1.1, 0.05
X 0 30.4 30 U 1.09 / n 1.1 / 9 查表得 u0.05 1.64
由于 U u0.05 ,应接受 H 0
即不能认为过去该市轻工产品月产值占工业 产品月总产值的百分比平均大于30% 。
H 0 : , H1 :
2 2 0 2 2 0
拒绝域为 ( (n), )
2
例7 设维尼纶纤度在正常生产条件下服从正态分 布N(1.405, 0.0482),某日抽取5根纤维,测得其纤 度为:1.32 1.36 1.55 1.44 1.40 问:某天生产的维尼纶纤度的方差是否正常? X ~ N ( , 2 ) ,关于总体参数 , 2
讨论4种假设检验: 1. 方差已知,关于期望的假设检验 2. 方差未知,关于期望的假设检验
3. 期望已知,关于方差的假设检验
4. 期望未知,关于方差的假设检验
方差已知,关于期望的假设检验
双侧检验:
1.提出假设:H 0 : 0 H 1 : 0 X 0 ~ N (0,1) 2.检验统计量 U / n X 0 3. P{| | u / 2 } n
同时减少犯两类错误的概率的唯一办 法是增大样本容量。
假设检验的一般步骤 (1) 根据实际问题需要,提出H0与H1 ; (2) 选择统计量W,要求在H0为真时, W的 分布已知; (3) 选取显著性水平α,查表确定对应α 的临界值,从而得到检验拒绝域w; (4) 利用样本观测值代入W,计算出W的值; (5) 若W落在拒绝域内,得出拒绝H0的结论; 若W落在拒绝域外,得出接受H0的结论。
例3 从某校2013年550名应届毕业生的高考成绩 中随机抽取了50个,问能否根据这50个成绩判 断该校在2013年高考成绩服从正态分布?
例4 从福州市和厦门市2013年售出的房屋中各 随机抽取200套,根据每套的单价(元/平方 米),能否判断这两个城市在2013年的房价持 平?
以上实际例子的解决都需要我们根据问 题本身提出假设,然后根据样本的信息对假 设进行检验,最后作出“是”与“否”的判 断。 定义: 检验是否为真的假设称为原假设/零假设, 用 H0表示 与H0对立的假设称为备择假设, 用 H1表示
提出 H0→ 在 H0 成立时构造统计量 W 和小概率事 件A→进行1次试验或抽样→若A发生→拒绝H0 ↓ 若A没发生→接受H0
为了描述一个小概率事件,需预先指定一个 很小的数α ,一般地, 取α=0.05或0.01,并 把α称为检验的显著性水平。
对于指定的显著性水平α ,在一定的统计思 想下,构造一个区域w (一般是一个区间或 两个区间的并集),使得如果由样本观测值 计算出统计量W的值落在w内,则意味着小 概率事件A发生了。称w为检验拒绝域。
2
2 4.由样本值计算出 的值 2 5.若 落在拒绝域内,则拒绝H0;否则 接受H0。
左侧检验:
2 2 H0 : 2 0 , H1 : 2 0
拒绝域为 (0, 12 (n 1)) 右侧检验:
2 2 H0 : 2 0 , H1 : 2 0