第八章 假设检验
教育与心理统计学第八章:假设检验
临界值
H0值
样本统计量
左侧检验示意图
(显著性水平与拒绝域 )
抽样分布
置信水平
拒绝域
1- 接受域
临界值
H0值
样本统计量
观察到的样本统计量
右侧检验示意图 (显著性水平与拒绝域 )
抽样分布
置信水平
1- 接受域
拒绝域
H0值 观察到的样本统计量
临界值
样本统计量
双侧检验原假设与备择假设的确定
▪ 双侧检验属于决策中的假设检验。即不论是拒绝H0还 是接受H0,都必需采取相应的行动措施。
1、原假设真实, 并接受原假设,判断正确; 2、原假设不真实,且拒绝原假设,判断正确; 3、原假设真实, 但拒绝原假设,判断错误; 4、原假设不真实,却接受原假设,判断错误。
假设检验是依据样本提供的信息进行判断,有犯错误 的可能。所犯错误有两种类型:
第一类错误是原假设H0为真时,检验结果把它当成不 真而拒绝了。犯这种错误的概率用α表示,也称作α错 误(αerror)或弃真错误。
型错误
β错误(取伪错误) 1-β(正确决策)
要使犯这两类错误的概率α 和β都尽可能小, α也不能定
的过低 。
在一般研究中,我们总是控制犯型错误
为什么???
假设检验中人们普遍执行同一准则:首先控制弃真错误(α错 误)。假设检验的基本法则以α为显著性水平就体现了这一原
则。
两个理由: 统计推断中大家都遵循统一的准则,讨论问题会比较方便。
0.076mm。试问新机床加工零件 的椭圆度均值与以前有无显著差
异?(=0.05)
属于决策中 的假设!
解:已知:X0=0.081mm, =.25,n=200,
x 0.076
第八章、假设检验
第八章、假设检验一、应用题:1.某工厂正常情况下生产的电子元件的使用寿命2~(1600,80)X N ,从该工厂生产的一批电子元件中抽取9个,测得它们使用寿命的平均值为1540(小时),如果使用寿命的标准差σ不变,能否认为该工厂生产的这批电子元件使用寿命的均值μ=1600(小时)? (附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(8) 1.86,(8) 2.31u u t t α===== )2..某工厂正常情况下生产的电子元件的使用寿命2~(1600,80)X N ,从该工厂生产的一批电子元件中抽取9个,测得它们使用寿命的平均值为1540(小时),如果使用寿命的标准差σ不变,能否认为该工厂生产的这批电子元件使用寿命显著降低?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(8) 1.86,(8) 2.31u u t t α===== )3.已知电子工厂生产的某种电子元件的平均寿命为3000(h ),采用新技术试制一批这种电子元件,抽样检查16个,测得这批电子元件的使用寿命的样本均值x =3100(h ),样本标准差 s =170(h ),设电子元件的使用寿命服从正态分布,问:试制的这批电子元件的使用寿命是否有显著提高?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(15) 1.753,(15) 2.13u u t t α===== )4.某车间用一台包装机包装葡萄糖,规定标准为每袋0.5kg ,设包装机实际生产的每袋重量服从正态分布,且长期经验知标准差σ=0.015不变,某天开工后,为了检查包装机是否正常,随机抽取了9袋,测得它们样本均值为x =0.509 kg ,能否认为这天的包装机的工作正常?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(8) 1.86,(8) 2.31u u t t α===== )5. 某车间用一台包装机包装葡萄糖,规定标准为每袋0.5kg ,包装机实际生产的每袋重量服从正态分布,某天开工后,为了检查包装机是否正常,随机抽取了9袋,测得它们样本均值为x =0.509 kg ,样本标准差s = 0.015 kg ,能否认为这天的包装机工作正常? (附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(8) 1.86,(8) 2.31u u t t α===== )6.某装置的平均工作温度据制冷厂商称不高于190℃,今从一个有16台装置构成的随机样本测得平均工作温度的平均值和标准差分别为195℃和8℃,根据这些数据能否说明装置的平均的工作温度比制造厂商所说的要高?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(15) 1.753,(15) 2.13u u t t α===== )7.已知某铁厂铁水含碳量服从正态分布N (4.55,0.1082),现测定了9炉铁水,其平均含碳量为4.484,如果方差没有变化,可否认为现在生产之铁水平均含碳量仍为4.55? (附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(8) 1.86,(8) 2.31u u t t α===== )8.有一批枪弹出厂时,其初速度200~(,)v N μσ,其中0μ=950米/秒,经较长储存,取9发进行测试,测得其样本均值x =928,据经验0σ=10可认为保持不变,问能否认为这批枪弹的初速度v 显著降低?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(8) 1.86,(8) 2.31u u t t α===== )9. 有一批枪弹出厂时,其初速度200~(,)v N μσ,其中0μ=950米/秒,0σ=10,经较长储存,取9发进行测试,测得其样本均值x =928,样本标准差s=10,问能否认为这批枪弹的初速度v 显著降低?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(8) 1.86,(8) 2.31u u t t α===== )10.设在一批木材中抽取100根,测其小头直径的样本均值x =11.2cm ,已知标准差0σ=2.6 cm ,问能否认为这批木材小头的平均直径在12 cm 以上?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(99) 1.66,(15) 1.99u u t t α===== )11. 设在一批木材中抽取100根,测其小头直径的样本均值x =11.2cm ,样本标准差s=2.6 cm ,问能否认为这批木材小头的平均直径在12 cm 以上?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(99) 1.66,(99) 1.99u u t t α===== )12.已知某厂生产的维尼纶纤度服从正态分布,标准差σ=0.048,某日抽取5跟纤维,测得纤度为1.32,1.55,1.36,1.40,1.44,问这天的维尼纶的均方差σ是否有显著变化? (附:检验水平0.050.0250.950.97522220.05,(4)9.49,(4)11.1,(4)0.711,(4)0.484α=χ=χ=χ=χ=)13.某厂生产的保险丝规定保险丝熔化时间的方差不能超过400,今从一批产品中抽取25个,测得其熔化的样本方差s 2=388.58,若该熔化时间服从正态分布,问这批产品是否合格?(附: 0.050.0250.950.97522220.05,(24)36.4,(24)39.4,(24)13.8,(24)12.4α=χ=χ=χ=χ= )14.为检测两架光测高温计所确定的温度读数之间有无显著差异,设计一个试验:用两架仪器同时对一组10只热炽灯丝做观测,测得它们的样本均值与样本方差分别为x =1169,y =1178,2x s =51975.21,2y s =50517.33,试确定两架温度计所测温度有无显著变化? (附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(18) 1.734,(18) 2.10u u t t α=====)15.甲、乙两台机床生产同一型号的滚珠,现从两台机床生产的产品中抽出8个和9个测得其样本均值和样本方差分别为 x =15.01,2x s =0.09554,y =14.99,2y s =0.0611,能否认为乙机床加工精度比甲机床高?(附:检验水平0.050.050.05,(7,8) 3.5,(8,9) 3.23F F α=== )16.某种物品在处理前与处理后分别抽取7个和8个样品,测得其样本均值和样本方差分别为x =0.24,2x s =0.0091,y =0.13,2y s =0.0039,能否认为处理后含脂量显著降低?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(13) 1.771,(13) 2.16u u t t α===== )17.已知学生的学习成绩服从正态分布,从某班的高等数学测试成绩表中抽取5人,数据如下: 60,65,70,75,80,能否认为该班的高等数学测试的平均成绩为75分。
第八章 假设检验
(一)问题的提出
例1.1 体重指数BMI是目前国际上常用的衡量人体胖 瘦程度以及是否健康的一个标准. 专家指出, 健康 成年人的BMI 取值应在 18.55- 24.99 之间.某种 减肥药广告宣称, 连续使用该种减肥药一个星期便 可达到减肥的效果.为了检验其说法是否可靠,随机 抽取9位试验者(要求BMI 指数超过25,年龄在20-25 岁女生),
x 0.522 0.465, 依然拒绝H0;
那么,拒绝H0的最小的值 是多少?最小的显 著水平又是多少?
(一)问题的提出
先让每位女生记录没有服用减肥药前的体重, 然后 让每位女生服用该减肥药, 服药期间, 要求每位女 生保持正常的饮食习惯, 连续服用该减肥药1周后, 再次记录各自的体重.测得服减肥药前后的体重差 值X(服药前体重-服药后体重) (单位: kg): 1.5,0.6,-0.3,1.1,-0.8,0,2.2,-1.0,1.4 设X~N(μ,0.36), μ未知,根据目前的样本资料能否 认为该减肥药广告中的宣称是可靠的?
n i1
Xi
~
N(,
1 ), n
H0 : 0, H1 : 1( 0 ), 拒绝域:X c.
P1 (X c)
P0 (X c)
0
c
1
犯两类错误的 概率相互制约
11
例1.1中,犯第I类错误的概率
(c) P{拒绝H0|H0是真的} P{X c| 0}
P{ X c | 0} / n / n
例1.2 一种饼干的包装盒上标注净重200g,假 设包装盒的重量为定值,且设饼干净重服从N (μ,σ2), μ, σ2均未知.现从货架上取来3盒,称 得毛重(单位:g)为 233,215,221,根据这 些数据是否可以认为这种包装饼干的标准差超 过6g?
概率论与数理统计第八章假设检验
为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
统计学-第八章 假设检验
假设 原假设
双侧检验
单侧检验
左侧检验 右侧检验
H0 : m =m0 H0 : m m0 H0 : m m0
备择假设 H1 : m ≠m0 H1 : m <m0 H1 : m >m0
三、假设检验的程序---
4.例题分析
[例8.1] 某品牌洗衣粉在它的产品说明书中声称:平 均净含量不少于1250克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品来验证该产品制造商 的说明是否属实。试写出用于检验的原假设与备择假设。
2.接受域:概率P>的区域,为大概率区域,称之 为原假设的接受区域。
3.拒绝域:概率P≤的区域,为小概率区域,称之 为原假设的拒绝区域。
三、假设检验的程序---
1.拒绝原假设H1 原则:临界值
2.接受原假设H0 原则:临界值
检验统计值的绝 对值大于临界值;
检验统计值的绝 对值小于临界值;
假设 H0为真实 H0为不真实
接受H0 判断正确
采伪错误()
拒绝H0 弃真错误()
判断正确
四、假设检验中的两类错误
第I类()错误和第II类()错误的关系
和的关系就像 翘翘板,小就 大, 大就小。
你要同时减少两类 错误的惟一办法是 增加样本容量!
关乎决策:三个与其
与其,人为地把显著性水平固定按某一水平上,不 如干脆选取检验统计量的P值;
第二节 一个正态总体的假设检验
二、均值m的假设检验
3.给出显著性水平(0.01、0.05或0.1)
4.确定接受域和拒绝域(以双侧检验为例)
2已知:当Z Z 2
,则拒绝原假设,反之则接受H0;
第八章假设检验
查表得 z0.05 1.645,
于是
| x
/
0
n
|
0.516
z0.05
1.645
故接受 H0 , 认为该机器工作正常.
例2 公司从生产商购买牛奶.公司怀疑生产商在 牛奶中掺水以谋利. 通过测定牛奶的冰点,可以检 验出牛奶是否掺水.天然牛奶的冰点温度近似服从
单个正态总体方差的假设检验
1. 为未知, 关于 2的检验( 2 检验)
设总体 X ~ N (, 2 ), , 2均为未知,
X1 , X 2 ,, X n 为来自总体 X 的样本, 要检验假设:
其中 0 为已知常数. 设显著性水平为 ,
因为 S 2 是 2 的无偏估计,
当H
例1 某切割机在正常工作时, 切割每段金属棒 的平均长度为10.5cm, 标准差是0.15cm, 今从一批 产品中随机的抽取15段进行测量, 其结果如下: 10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2 10.9 10.6 10.8 10.5 10.7 10.2 10.7 假定切割的长度 X 服从正态分布, 且标准差没
2ቤተ መጻሕፍቲ ባይዱ
2 1
/
2
(n
1)
H1 : 0 (即设牛奶已掺水)
这是右边检验问题,其拒绝域为
z
x
0
n
z0.05
1.645.
现在
z
0.535
(0.545) 2.7951
1.645,
0.008 5
z的值落在拒绝域中, 所以我们在显著性水平
第八章 假设检验
x z2
x z2 /
s n
上例,我们用求置信区间的方法,来判断 原假设是否合理。 大样本下满足中心极限定理,样本均值的 抽样分布服从正态分布,从而有置信区间:
x z2 s 24 =986 1.96 n 40
假设检验的步骤
1.确定原假设和备选假设 2.选择检验统计量 3.指定检验的显著性水平 4.建立拒绝原假设的规则 5.收集样本数据,计算检验统计量的值 6.将检验统计量的值域拒绝规则的临界值比较, 以决定是否拒绝原假设。或者,由检验统计量 的值计算p值,利用p值确定是否拒绝原假设。
x 2.92 3 z 2.67 / n 0.18 / 6
x z ~ N (0,1) / n
根据显著性水平α=0.01,对应的拒绝域面积为 0.01,临界值为-2.33 Z<-2.33,所以拒绝H0,即可认为没听咖啡的容量 不足3磅。 统计证据支持对HILLTOP咖啡重量不足采取投诉措 施。
(978.56,993.44)该区间不包含u0=1000, 因此我们拒绝原假设H0.检验表明,该包 装机未能正常工作。
总体均值的检验:小样本情形
小样本下,已知总体为正态分布,我们考 虑以下两种情况: 1.总体方差已知 2.总体方差未知 在总体方差已知的情况下,即使样本容量 较小,但样本平均数的抽样分布总是以平 均值 为均值,以 x 为标准差的正态分 布。因此其检验过程和检验统计量同大样 本情形。
拒绝域为α/2 拒绝域为α/2
z / 2
拒绝域
0
z / 2
第八章 假设检验 (《统计学》PPT课件)
第二节 一个正态总体的假设检验
一、正态总体
设总体X ~ N(m, 2),抽取容量为n的样本 x1, x2, xn
样本均值 X 与方差S2 计算公式分别为:
2
1 n 1
n i1
(xi
X)
我们将利用上述信息,来检验关于未知参数均值 和方差的假设。
总体参数
均值
方差
总体方差已知
z 检验
(单尾和双尾)
总体方差已知
t 检验
(单尾和双尾)
2 检验
(单尾和双尾)
第二节 一个正态总体的假设检验
二、均值m的假设检验
1.H0:m=m0
2.选择检验统计量:
2已知: Z X m0 ~ N(0,1)
/ n
2未知:
小样本: t X m0 ~ t(n 1)
这个值不像我 们应该得到的 样本均值 ...
...因此我们拒绝 原假设μ=50
... 如果这是总 体的假设均值
60
μ=80
H0
样本均值
第一节 假设检验概述
三、假设检验的程序
一个完整的假设检验过程,通常包括以下几个步骤:
首先,设立原假设H0与备选假设H1; 第二步,构造检验统计量,并根据样本观察数据
小样本:当 t t
2
,则拒绝原假设,反之则接受H0;
5.得出结论。
二、均值m的假设检验
6.例题分析
[例8.3] 某广告公司在广播电台做流行歌曲磁带广告 ,它的插播广告是针对平均年龄为21岁的年轻人的,标 准差为16。这家广告公司经理想了解其节目是否为目标 听众所接受。假定听众的年龄服从正态分布,现随机抽 取400多位听众进行调查,得出的样本结果为x 25 岁S2,18 。以0.05的显著水平判断广告公司的广告策划是否符合 实际?
管理定量分析课程第8章:假设检验
判决
无罪 有罪
陪审团审判
真实的情况
无罪
有罪
判决正确
判决错误
判决错误
判决正确
结论
未拒绝原假设 拒绝原假设
假设检验 总体参数的实际情况
原假设为真 备择假设为真 结论正确 第二类错误 第一类错误 结论正确
11
假设检验中犯Ⅰ型错误的概率,称为显著性水平(level of significance),即指当零假设实际上是正确时,检验统计量落
7
又如:教育部要检验2012年录取的大学新生平均身高是否 达到了170cm标准,这样需要提出原假设(H0):2012
年大学新生(总体)的平均身高(µ )是170cm。为了检
验这个假设是否正确,需要根据随机取样的原则,从2012 年的大学新生总体中选取样本并计算样本的平均高度,以 此来检验原假设的正确性。
8
假设检验一般分为参数假设检验和非参数假设检验两种类型。参 数假设检验对变量的要求较为严格,适合于等距变量和比率变量 ,非参数假设检验对变量的要求较为自由,既适合于等距变量和 比率变量,也适用于类别变量和顺序变量。
变量测量层次
分类(nominal)变 量
数学性(interval)变量
4
一、假设与假设检验
假设是科学研究中广泛应用的方法,它是根据已知理 论与事实对研究对象所作的假定性说明。统计学中的 假设一般专指用统计学术语对总体参数所做的假定性 说明。在进行任何一项研究时,都需要根据已有的理 论和经验事先对研究结果作出一种预想的假设。这种 假设叫科学假设,在统计学上称为研究假设。对这种 研究假设进行证实或证伪的过程叫假设检验。
非参数检验是一种与总体分布状况无关的检验方法,它不 依赖于总体分布的形式。
概率论与数理统计第八章假设检验
对于(a)小概率P{X 0 u }
u是所选取合适的统计量 U 的分位点
1
单侧检验
P{ X 0 u } x 0 u为拒绝区域
其含义是依这样本x所推断的
小
概率
事
件H
发生
0
了
,
拒
绝H
0
u
拒绝
1
u 拒绝
对于(b)小概率P{X 0 u } (密度函数为对称时)
由 经 验 知 0.015公 斤 , 为 了 检 验 某 天 机器 工 作 是 否 正 常 , 抽 取其 所
包 装 的9袋 称 得 重 量 分 别 为0:.497,0.506,0.518,0.524,0.488,0.511,0.510,0.515,0.519; 问这天机器正常否?
现在另一天任然抽取9袋得样本均值x 0.511公斤,推断这天机器是否工作正常?
小 概 率 事 件 是: 样 本 均 值X与 所 假 设 的 期 望0相 差 X 0
不 能 太 大, 若 相 差 太 大 则 拒 绝H0
小概率事件P{ X 0 u }
u
是
2
所
选
取
合
适
的
统
计
量U
2
的
2
分
位
点
1
P{ X 0 u } x 0 u 为拒绝区域 2
较大、较小是一个相对的概念,合理的界限在何 处?应由什么原则来确定?
问题是:如何给出这个量的界限? 这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验 中基本上不会发生(若发 生了则认为假设是错 )
在假设检验中,称这个小概率为显著性水平,用 表示.
第八章假设检验
若过分大,则有理由 怀疑H0的正确性
7/51
§8.1 假设检验
当观察值 x 满足 x 0
此即假定H0正确 时的小概率事件
/ n
k时, 拒绝假设 H0 ,
反之, 当观察值 x 满足
x 0
/ n
k时, 接受假设 H0 .
如何选取k呢,先看以下事实: 由于作出决策的依据是一个样本,当实际 上H0为真时,仍可能作出拒绝H0的决策,这种 可能性是无法消除的,这是一种错误。
24/51
第八章 假设检验
§8.1 假设检验 §8.2 正态总体均值的假设检验 §8.3 正态总体方差的假设检验
§8.6 分布拟合检验
25/51
§8.2 正态总体均值的假设检验
假设检验是针对弃真这一可能犯的错误人为设定一个界限, 如果在这个界限内,认为原假设成立,否则的话,由于显 著性水平取得很小,表明小概率事件发生,根据实际推断 原理,原假设不成立。 尽管也可能犯第II类取伪的错误,这时尽管总体的性质发 生了改变但没有发现,往往影响较小。 正态总体均值的检验分为三种情况
/ n
若|z|= X 0 k,则称 x 与μ0的差异是显著的,以至
于小概率事件发生了,这时拒绝H0, 否则则称 x与μ0的差异是不显著的,这时接受H0, 选定的数α称为显著性水平,在α下对显著性判断
X 0 统计量Z= 称为检验统计量 / n
13/51
/ n
§8.1 假设检验
假设检验的相关定义: 像上例中的假设检验问题可叙述成: “在显著性水平α下,检验假设H0:μ=μ0,H1:μ≠μ0” 或“在显著性水平α下,针对H1检验H0”
例如:提出总体期望服从泊松分布的假设,然后进行判断 提出正态总体期望为μ0的假设,然后进行判断
第8章 假设检验
例 孟德尔遗传理论断言,当两个品种的豆杂交时,圆的 和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的 频数将以比例9:3:3:1发生。在检验这个理论时,孟德 尔分别得到频数315、101、108、32、这些数据提供充分 证据拒绝该理论吗?
P PH0 | Z || z0 | 2PH0 Z | z0 | 2(1 (| z0 |))
(即z0代替了拒绝域式中的z 2 )
判断:当P小于显著水平时,拒绝原假设,
否则,接受: 0, H1 : 0 , 其中0是已知的常数
以X 作为的参考, 若H0为真,X比0大些,但
这个批次清漆的干燥时间构成的总体方差可设 2 0.36 而其均值是要求我们检验的!
经计算,现抽取的9个数据的平均值x 6.4小时,
现在的问题是,我们能否认为 "6.4 6.0 0" ?
即,接受以下哪个假设?
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
4
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
16
*另外方法:若给定显著性水平, 当原假设成立时
( 0),总体X ~ N (0, 2 ),因此,X ~ N (0, 2 n )
P0 ( X 0
k)
P 0
(
X
0
n
k
设
)
n
k
n z /2
k z/2 n
1
一般,H
的拒绝域写为:
数理统计 第八章 假设检验
量
渐近2 服从ik自1 (由fi度n为pni(pik)-21)的ik1 2nf分pi2i布. n
检验的拒绝域形为: W= 2 C
当显著性水平给定时,可得 C=2 (k 1).
12
如果根据所给的样本值 X1,X2, …,Xn算得
(2 n-1)
2 1
2 (n 1)
(n 1)S 2
2
t(n1 n2 2)
2 2 (n 1) (X Y ) (1 2 )
S 1 1 w n1 n2
t(n1 n2 2)
F1 2 (n1 1, n2 1)
F(n1 1,n2 1)
npi
近似服从 2(1)
按 0.05,查表得
2 0.05
(1)
3.841,拒绝域为
W= 2 3.841
这里,n=70+27=97, k=2,
实测频数为70,27.
理论频数为: np1=72.75, np2=24.25
由于统计量 2的实测值 2=0.4158<3.841,17
理论频数npˆi 217 149 51
12
3
22
战争次数x 实测频数 fi 概率估计 pˆi 理论频数npˆi
0
1
223 142
0.502 0.346
217 149
2 48 0.119 51
3 15 0.027
12
4
4
0.006
3
15
检验统计量的观察值为
2 k ( fi npi )2 k fi2 n
i 1
npi
i1 npˆi
第八章 假设检验
II型()错误
(一)I 型错误(Type I Error)
定义:Ho正确时,因检验值落入拒绝区而 未接受Ho所犯的错误。
Z
Ho: 1=2
错误
1 2
SEDX
Z
-1.96σ
0
1.96σ
(二)II 型错误(Type II Error)
定义:Ho不正确时,因检验值落入接受区
使用:结果或方向不确定时。
意义:只推断有无差异,不断言方向。
|Z|(CR)
<1.96 ≥1.96 ≥2.58
P值
>0.05 ≤0.05 ≤0.01
显著性
不显著 显著 极显著
符号
* **
(二)单尾(侧)检验
定义:拒绝性概率置于理论分布一尾。
使用:结果或方向确定时。 意义:既推断有无差异,又断言方向。 类型 右尾检验 左尾检验
解释
直观分析法 理论分析——小概率事件
直观分析
D=.95 接受Ho区域
.025 2
-1.96 σ -1σ
.025 2
1σ
1.96 σ
拒绝Ho区域
0.05
直观分析
接受Ho区域
.005 2
.005 2
-2.58 σ
第八章假设检验_0
第八章假设检验作为统计推断的重要组成部分,假设检验也称为显著性检验,就是对所估计的总体先提出一个假设,然后再根据样本信息来检验对总体所做的假设是否成立。
假设检验可分为参数检验和非参数检验,对总体分布中未知参数的假设检验称为参数检验,而对未知分布函数的类型或其某些特征提出的假设称为非参数检验。
第一节假设检验概述在实际生活中,许多事例都可以归结为假设检验问题。
为了便于理解,下面我们结合具体实例来说明假设检验的思想方法。
例8.1 某厂生产中药地黄丸,药丸的重量服从正态分布N( , 2),按规定每丸的标准重量为10克。
根据以往经验得知,生产药丸的标准差为 3.2克。
现从一批药丸中随机抽取100个,其平均重量为9.6克,试问这批药丸重量是否符合标准?从直观上来看,这批药丸重量不符合标准,两者差异显著。
但能否仅凭100个药丸的平均重量比标准重量小0.4克,而立即得出这批药丸不符合标准的结论呢?从统计学上来看,这样得出的结论是不可靠的。
这是因为,差异可能是这批药丸品质所造成的,也可能是由于抽样的随机性所造成的。
如果我们再随机抽取100个药丸进行检测重量,又可得到一个样本资料。
由于抽样误差的随机性,样本平均数(100个药丸的平均重量)就不一定是9.6克。
那么,我们对样本进行分析时,必须判断样本的差异是抽样误差造成的,还是因本质不同而引起的。
如何区分两类性质的差异?怎样通过样本来推断总体?这正是假设检验要解决的问题。
在假设检验中,先要根据问题的需要建立检验假设,假设有两种,一种是原假设或零假设,用H0表示,通常就是将要进行检验的假设;另一种是备择假设- 1 -或对立假设,用H1表示,是原假设H0相对立的假设。
例8.1中,如果将该批药丸的重量记作总体X,该问题就是检验总体X的均值 的变化情况。
那么,可以设原假设H0: 10( 0),即认为这批药丸重量是符合标准的;而备择假设,即认为这批药丸重量是符合标准的 10( 0),即认为这批药丸重量不H1:10( 0)符合标准的。
现代心理与教育统计学 第八章-假设检验(张厚粲)
第一节 假设检验的原理
在统计学中,通过样本统计量得出的差异做出一般性 结论,判断总体参数之间是否存在差异,这种推论过 程称作假设检验(hypothesis testing)
假设检验分为参数检验和非参数检验。前者指的是总 体分布已知,需要对总体的未知参数做假设检验。后 者指的是总体分布知之甚少,对总体的函数形式和特 征进行假设检验。
这里取=0.05,因为是Z检验,所以临界值是-1.96
4. 利用显著性水平,建立拒绝H0的规则
0.05时, Z 2 Z0.025 1.96,
接受假设的区域为 : Z 1.96, 拒绝区域为 : 或Z 1.96,或Z 1.96
拒绝H0
0.025
拒绝H0
正解:
1、提出零假设和备择假设 备择假设:用H1表示,即研究假设,希望证实的假设。 H1 : 1 0 (该班智力水平确实与常模有差异) 1100 零假设:用H0表示,即虚无假设、原假设、无差异假 设。 H0: 1=0 1 =100
2、确定适当的检验统计量
用于假设检验问题的统计量称为检验统计量。与参数 估计相同,需要考虑:
Ⅱ型错误
α错误 正确
β 错误
(二)两类错误的关系
1. + ≠ 1 原因:与是两个前提下的概率。 即是拒绝原假设H0时犯错误的概率,这时前提是
H0为真; 是接受原假设H0时犯错误的概率,这时前提是H0
为伪。
H0为真, 即 μ 0=μ 1 的分布
+ ≠ 1
H1为真, 即 μ 0≠μ 1 的分布
总体是否正态分布; 大样本还是小样本; 总体方差已知还是未知。
Z=
X-0 0
n
本例中总体正态,样本容量大于等于30,检验统计量 为Z分布。
第八章假设检验
需要考虑因素
1. 总体方差是否已知
2. 总体分布是否正态
3. 样本容量大小
4. 双侧检验还是单侧检验 5. 右侧还是左侧
二、平均数的显著性检验的种类
• (一)总体正态分布,总体方差已知(Z)
• (二)总体正态,总体方差未知(t) • (三)总体非正态分布,大样本(Z′)
(一)总体正态分布,总体方差已知
H:1 0 新的教学法与原来的教学法无显著差异 0 H:1 0 新的教学法比原来的教学法差 0 H:1 0 新的教学法比原来的教学法好 0
假设检验的原理
• 费舍:“可以说,每一实验的存在,仅仅 是为了给事实一个反驳虚无假设的机会。”
二、假设检验中的小概率事件
• 样本统计量的值(随机事件)在其抽样分 布上出现的概率小于或等于事先规定的水 平,这时,就认为小概率事件发生了。
差异原因——误差
• 偶然误差:由于随机抽样引起的差异。
• 系统误差 :的确存在差异。
如何检验
Z X 0
X
N (0,1)
11 X 2.008 n 30 Z X 0
0
X
84 79 2.49 2.008
2
0.05, Z 0.05 1.96 0.01, Z 0.01 2.58
SE X
0
n
X 0 Z SE X
例1
• 某小学采用一种实验教材,使用一年以后, 随机抽取10名学生进行测试,得到平均成 绩82分。而过去使用旧教材的全体学生的 平均成绩为77分,标准差为5分,问实验教 材与旧教材的效果有无显著性差异?
例2
• 某地区统考数学,假设该统考数学成绩服 从正态分布,已知其总平均分为50分,标 准差为12分。从该地区随机选择一个班作 为样本,该班有学生50人,经计算该班平 均成绩为53分,试问该班成绩与总成绩的 差异是否显著。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、假设检验的基本概念
解:以 表示 X 的均值,于是 X ~ N ( ,1.21) ,问题 是要检验:
H0 : 0 32.50, H1 : 0
辛钦大数定律:样本均值 X 取值稳定于总体均值 (n 充分大) 估 计 理 论: X 是 的无偏估计. 因此,当 H 0 (即 0 )成立时,差值| x 0 |应该较小, 或 x 0 x 0 | |较小;反之, 当 H1成立时, | |体现为较大. / n / n 因此 , 可适 当 选 取 一 个 正 数 k , 称为 临界 点 , 当 x 0 x 0 | | k 时, 拒绝假设 H 0 ;反之, 当| | k 时, 接 / n / n 受假设 H 0 .
对提出的假设检验
H 0 : 0 , H1 : 0
x 0 当 H 0 为真时, 差值 应该较小; 反之, 当 s/ n
H1成立时, 差值表现为较大. 由于
X 0 t ~ t (n 1) S/ n
因此, 可选取t 分布的上分位点t /2 (n 1) ,
x 0 当| | t /2 (n 1) 时, 拒绝假设 H 0 ; s/ n 反之, 接受假设 H 0 .
第八章 假设检验
• 假设检验的基本概念 • 正态总体参数的假设检验
在总体的分布函数完全未知或只知其形式、 但不知其参数的情况下, 为了推断总体的某些性质, 提出某些关于总体的假设.
例如, 对于正态总体提出数学 期望等于0 的假设等 .
假设检验就是根据样本对所提出的假设作出判 断: 是接受, 还是拒绝.
(5)判断:故拒绝假设 H 0 , 即认为这批砖的 平均抗断强度不是 32.50 kg / cm2 .
2. t 检验法(适用于 2 未知)
设 总 体 X ~ N ( , 2 ) , 其 中 方 差 2 未 知 , X1 , X 2 , , X n 是来自 X 的一个样本,现对均值 提出假设. t 检验法的原理和检验步骤与 Z 检验法大体 相同, 不同之处在于此时正态总体的方差 2 未知, 因而要用 2 的无偏估计 S 2 代替,从而 检验统计量服从的分布与 Z 检验统计量服从 的分布不同 , 而且拒绝域的临界点也不一 样.
由于 S 2 是 2 的无偏估计,因此当 H 0 为真时, 2 S 2 与 0 的比值应在 1 周围波动. 由于
2
(n 1) S 2
02
~ 2 (n 1)
因 此 , 可 选 取 2 分 布 的 两 个 上 分 位 点
2 1 /2
当 (n 1) 与 /2 (n 1) ,
2
(n ) 1 s
2
或
(n 1) s 2
02
12 (n ) 1 2 /
02
2 /2 ( n 1) 时 , 拒绝原假设 H 0 , 反
称为显著性水平
取伪错误:H 0 不真时, 根据样本检验后做出 了接受 H 0 的判断, 其概率记为
P{接受 H 0 | H 0 不真} PH1 {接受 H 0 }
当样本容量 n 一定时, 若减少犯第一类错误 的概率, 则犯第二类错非增 加样本容量.
解: (1) H 0 : 0 8.32, H1 : 0 (2)检验统计量
X 0 T s n
(3)拒绝域为
W t
t t n 1
查表得t (n 1) t0.05 (3) 2.3534 (4)经计算
x 0 t 1.33 W s n
(1) 提出如下假设之一
H 0 : 0 , H1 : 0 H 0 : 0 , H1 : 0 H0 : 0 , H 1 : 0
(2) 选取 Z 检验统计量
(3) 对给定的 , 查表求临界点 对双边检验 , 查表求标准正态分布的上 分位点 z /2 ;对右边检验, 查表求标准正 态分布的上分位点 z ;对左边检验, 查表 求 z .
X 0 Z / n
(4) 根据样本观察值计算Z 的值
x 0 z / n
(5) 做出判断 对双边检验, 当| z | z /2 时, 拒绝 H 0 ,反之接受 H 0 ;对右边检验, 当 z z 时, 拒绝 H 0 ,反之接受 H 0 ;对 左边检验, 当 z z 时, 拒绝 H 0 , 反之接受 H 0 .
例 1 根据长期的经验和资料分析,某 砖瓦厂生产的砖的“抗断强度” X 服从正态 分布,方差 2 1.21,今从该厂生产的一批砖 中,随机抽取 6 块,测得抗断强度(kg / cm2 ) 为:32.56, 29.66, 31.64, 30.00, 31.87, 31.03, 问可否认为这批砖的平均抗断强度为 32.50 2 kg / cm ?
解:(1) H 0 : 0 32.50, H1 : 0 (2)检验统计量 (3)拒绝域
z /2 1.96
W z
Z
X 0 n
z z 2
,取 0.05 , 则临界点
(4)经计算
Z
x 31.13 32.5 3.05 W 1 .1 6 n
(5)判断:故接受 H 0 . 即认为溶液含铜量 没有显著性低于 8.32%.
二. 正态总体方差的假设检验
设 总 体 X ~ N ( , 2 ) , 其 中 , 2 未 知 , X1 , X 2 , , X n 是来自 X 的样本 , 现对 2 提出假 设检验。
对双边检验
2 2 H0 : 2 0 , H1 : 2 0
解: (1) H 0 : 0 0.618, H1 : 0 (2)检验统计量 (3)拒绝域为
T X 0 s n
x 0 W t t t n 1 s 2 n
查表得 t /2 t0.05/2 (20 1) 2.0930 (4)经计算
一个小概率事件 , 在一次试验中是几乎不能
x 0 发生的 . 当样本观察值 x 满足 z /2 时 , / n
小概率事件发生, 故拒绝假设 H 0 ;反之, 接受
H 0.
通常,称假设 H 0 为原假设或零假设, H1为备择假设。 备择假设是指在原假设被拒绝后可供选择的假设 , 假设检验中所用的统计量称为检验统计量. 例 1 的检验法使用了正态统计量及其符号
检验的类型 研究的问题 假设 双边检验 H0 H1 = 0 ≠ 0 左边检验 0 < 0 右边检验 0 > 0
§2正态总体参数的检验
一. 正态总体 N ( , ) 均值的检验
2
2 1. Z 检验法(适用于 已知)
设总体 X ~ N ( , 2 ), 其中方差 2 已知, X1, X 2 , , X n 是来自 X 的一个 样本,现对均值 提出假设. Z 检验 法的检验步骤如下:
例 根据长期的经验和资料分析,某 砖瓦厂生产的砖的“抗断强度” X 服从正态 分布,方差 2 1.21,今从该厂生产的一批砖 中,随机抽取 6 块,测得抗断强度( kg / cm2 ) 为:32.56, 29.66, 31.64, 30.00, 31.87, 31.03, 问可否认为这批砖的平均抗断强度为 32.50 kg / cm2 ?
(4) 根据样本观察值计算t 的值
x 0 t s/ n
(5) 做出判断 对双边检验, 当| t | t /2 (n 1)时, 拒绝 H 0 , 反之接受 H 0 ; 对右边检验, 当t t (n 1) 时, 拒绝 H 0 , 反 之接受 H 0 ; 对左边检验, 当t t (n 1)时, 拒绝 H 0 , 反之接受 H 0 .
H0 为真 H0 为假
正确
弃真错误又称第I类错误 取伪错误又称第II类错误
弃真错误: H 0 为真时, 根据样本检验后却做 出了拒绝 H 0 的判断. 将 H 0 为真时拒绝 H 0 这一事件记为{拒绝 H 0 | H 0 为真}, 则
P{拒绝 H 0 | H 0 为真} PH 0 {拒绝 H 0 }
例 1
如果一个矩形的宽度w与长度l 的比
w / l ( 5 1) / 2 0.618,这样的矩形称为黄金矩形.这种尺
寸的矩形使人们看上去有良好的感觉.现代的建筑构 件、工艺品、商业信用卡等常常采用黄金矩形,现从 某工艺品厂生产的某种矩形形状的工艺品中随机抽取 20件 , 测得矩形的宽度与长度的比值为: 0.963 0.749 0.654 0.670 0.662 0.672 0.615 0.606 0.690 0.628 0.668 0.611 0.606 0.609 0.601 0.553 0.570 0.844 0.576 0.993. 设该厂生产的 这种工艺品的宽度与长度的比值服从正态分布,均值 为 ,试检验该批工艺品的宽度与长度的比值是否符合
X 0 Z / n
故称为 Z 检验法
当检验统计量的取值落在某个区域W时,根 据检验方法,应该拒绝原假设, 称区域W为拒绝 域. 显然, 例1中的拒绝域为
x 0 z /2 / n
抽样分布
拒绝域
置信水平
拒绝域
/2
1-
接受 域
临界值 H0真 临界值
/2
样本统计量
抽样分布
假设检验问题是统计推断的另一类重要问题. 如何利用样本值对一个具体的假设进行检验? 通常借助于直观分析和理 论分析相结合的做法,其基本原 理就是人们在实际问题中经常 采用的所谓实际推断原理:“一 个小概率事件在一次试验中几 乎是不可能发生的”. 下面结合实例来说明假设检验的基本思想.
§1 假设检验的基本概念
t 检验法的检验步骤如下:
(1) 提出如下假设之一
H 0 : 0 , H1 : 0 H 0 : 0 , H1 : 0 H0 : 0 , H 1 : 0