统计学 第4章 假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【解】研究者想收集证据予以支持的假设是该 城市中家庭拥有汽车的比率超过30%。 因此,建立的原假设和备择假设为 H0 :μ≤30% H1 :μ>30%
结论与建议
◆原假设和备择假设是一个完备事件组, 而且相互对立。在一项假设检验中,原假设和 备择假设必有一个成立,而且只有一个成立; ◆先确定备择假设,再确定原假设。因为 备择假设大多是人们关心并想予以支持和证实 的,一般比较清楚和容易确定; ◆等号“=”总是放在原假设上; ◆因研究目的不同,对同一问题可能提出 不同的假设,也可能得出不同的结论。 ◆假设检验主要是搜集证据来推翻和拒绝 原假设。
◆理想地,只有增加样本容量,能同时减小 犯两类错误的概率,但增加样本容量又受到很多 因素的限制; ◆通常,只能在两类错误的发生概率之间进 行平衡,发生哪一类错误的后果更为严重,就首 要控制哪类错误发生的概率; ◆在假设检验中,一般先控制第Ⅰ类错误的 发生概率。因为犯第Ⅰ类错误的概率是可以由研 究者控制的。
假设检验的过程
提出假设 作出决策
拒绝假设 别无选择!
总体
我认为人口的平 均年龄是50岁
抽取随机样本
均值 x = 20
二、原假设与备择假设
什么是假设?
对总体参数的具体数
值所作的陈述
我认为这种新药的疗效 比原有的药物更有效!
总体参数包括总体均值、 总体比率、总体方差等 分析之前必须陈述
备择假设。
500g
【解】研究者抽检的意图是倾向于证实这种洗 涤剂的平均净含量并不符合说明书中的陈述。 因此,建立的原假设和备择假设为 H0:μ≥500 H1:μ< 500
提出假设例3
一家研究机构估计,某城市中家庭拥有 汽车的比率超过 30% 。为验证这一估计是否 正确,该研究机构随机抽取了一个样本进行 检验。试陈述用于检验的原假设与备择假设
4.2
一个正态总体的检验
一个正态总体参数的检验
一个总体
均值
比例
方差
z 检验
t 检验Biblioteka z 检验2检验一、总体均值的检验
总体均值的检验(作出判断)
已 知
总体方差是否已知
未 知 大
无论样本 容量大小
样本容量 大小
小
z 检验 z 检验
z
x 0
z
x 0 s n
t 检验
t
x 0 s n
三、双侧检验与单侧检验
概念
双侧检验——是指备择假设没有特定的 方向性,并含有符号的假设检验,又称为双 尾检验。
单侧检验——是指备择假设具有特定的方 向性,并含有符号>或<的假设检验,又称为 单尾检验。 ◆备择假设的方向为<,称为左侧检验 ◆备择假设的方向为>,称为右侧检验
假设的形式
假设 双侧检验 单侧检验 左侧检验
关于p值
p值——又称为观察到的显著性水平,在 原假设为真的条件下,所得到的样本结果会像 实际观测结果那么极端或更极端的概率。 ◆α是指原假设正确时被拒绝的概率,或拒 绝原假设犯错误的最大允许值; ◆p值与原假设的对或错的概率无关,它是 关于数据的概率。如果原假设正确,p值表示这 样的观测数据会有多么的不可能得到。或是犯 错误的实际概率。
【解】此题为正态总体均值的假设检验
H0: µ = 570 H1:µ≠570
由于铜丝折断力X为大样本且总体方差已 知,故可以采用Z检验法。依题意,样本均值 为:
x 577 578 ... 567 587 x 538.4 n 30
检验统计量
Z x
538.4 570 31.6 21.64 1.46 n 8 30
◆不论是单侧检验还是双侧检验,用p值进 行决策的规则: 若p值<,拒绝 H0 若p值>,不拒绝 H0 ◆p值反映实际观测到的数据与原假设H0之 间不一致的程度的一个概率值。 p值越小,说明实际观测到的数据与原假设 H0之间不一致的程度就越大,检验的结果也就越 显著。
双侧检验
/2 /2
【解】研究者想收集证据予以证明的假设应该 是生产过程不正常。 因此,建立的原假设和备择假设为 H0:μ=15mm H1:μ≠15mm
提出假设例2
某品牌洗涤剂在它的产品说明书中声称:
平均净含量不少于500克。从消费者的利 益出发,有关研究人员要通过抽检其中 的一批产品来验证该产品制造商的说明 是否属实。试陈述用于检验的原假设与
【例1】某牙膏厂用自动包装机装牙膏,正常情 况下,每支牙膏内装入的牙膏量(单位:g) X~N(50,1.22),某日从生产中随机地抽取16支 牙膏,测得平均每支牙膏的净重为50.72g,问 这天包装机是否正常? 【分析】如果包装机工作正常,那么牙膏量 X~N(50,1.22) ,现在问包装机工作是否正常, 在假定方差不变的情况下,实际上就是要通过 样本均值来检验总体均值50是否正确。这就是 一个假设检验问题。
概念
第Ⅰ类错误(弃真错误) 原假设为真时拒绝原假设。 第Ⅰ类错误的概率记为α,又被称为显著 性水平。 第Ⅱ类错误(取伪错误) 原假设为假时未拒绝原假设。 第Ⅱ类错误的概率记为β。
和 的关系
和 的关系就像 翘翘板,小 就 大, 大 就小
你不能同时减 少两类错误!
◆当 n 减少时增大。
五、检验统计量与拒绝域
检验统计量
检验统计量——是指根据样本观测结果计 算得到的,并据以对原假设和备择假设作出决 策的某个样本统计量。 检验统计量实际上是总体参数的点估计量, 只有将其标准化后,才能用于度量它与原假设 的参数之间的差异程度。 标准化的检验统计量可表示为: 点估计量 假设值 标准化检验统计量 点估计量的抽样标准差
【例2】某种装袋食品,按规定每袋重量不得少于 250g。从一批产品中随机抽取50袋,发现有6袋 重量低于250g。若规定不符合标准的比例达到5%, 食品就不得出厂,问该批食品能否出厂?
【分析】对于该批食品的不合格率我们事先并不 知道,要根据样本的不合格率估计该批食品的不 合格率,然后与规定的不合格率标准5%进行比较, 作出该批食品能否出厂的决策。也就是说,我们 先假设该批食品的合格率不超过5%,然后用样本 不合格率来检验假设是否正确?这也是一个假设 检验问题。
假设检验在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
假设检验
参数估计与假设检验的关系
参数估计和假设检验是推断统计方法的两个 重要组成部分。
◆共同点:都是利用样本信息对总体数量特 征进行推断。 ◆不同点:推断的角度不同。
参数估计——是用样本统计量估计总体参 数,总体参数在估计前是未知的。 假设检验——是先对总体参数的值提出一 个原假设,然后利用样本信息来检验和判断这 个原假设是否成立(即判断样本信息与原假设 之间是否存在显著差异)。若成立,我们就接 受原假设;不成立,就拒绝原假设。
n
1、总体方差已知的检验
根据抽样分布的知识,对于正态总体,当 总体方差已知的情况,无论样本是大样本, 还是小样本时,都使用z检验统计量。
z
x 0
n
~ N (0,1)
【例1】某厂生产铜丝,其主要质量指标为折断力 X,根据历史资料统计,可假定X∼N(570,82)。 今新换材料生产,抽取30个样本值为: 577、578、579、569、565、577、568、587、 578、572、570、568、572、581、582、569、 570、570、572、596、584,598、588、563、 577、587、567、587 欲检验新材料生产的铜丝的折断力X有无明 显变化。假定方差σ2 = 8 2保持不变,α =0.05
第Ⅰ类错误
◆又称为显著性水平,常被用于检验结论 的可靠性度量;
◆既是一个概率值;又是抽样分布拒绝域 面积的大小(表示犯第Ⅰ类错误概率的最大允 许值);
◆常用的 值有0.01,0.05,0.10;
◆由研究者事先确定。
第Ⅱ类错误
确定了显著性水平就等于控制了第Ⅰ类 错误的概率,但犯第Ⅱ类错误概率的具体数 值却很难确定,其受影响因素包括: ◆随假设总体参数的减少而增大; ◆当 减少时增大; ◆当 增大时增大;
例如,H1 :10cm
H1 :<10cm
H1 : 10cm
提出假设例1
一种零件的生产标准是直径应为 15mm , 为对生产过程进行控制,质量监测人员定期 对一台加工机床检查,确定这台机床生产的 零件是否符合标准要求。如果零件的平均直 径大于或小于 15mm ,则表明生产过程不正常, 必须进行调整。试陈述用来检验生产过程是 否正常的原假设和备择假设
六、利用p值进行决策
显著性水平α是在检验之前确定的,这也就 意味着事先确定了拒绝域。这样,不论检验统计 量的值是大是小,只要它落入拒绝域就拒绝原假 设,否则就不拒绝原假设。 这种固定的显著性水平对检验结果可靠性的 度量有两个不足之处: ◆它只是一个大致的范围; ◆对不同的检验,当α相同时,所有结论的 可靠性都一样。 要想得出观测数据与原假设之间不一致程度 的精确度量,就需要计算p值。
临界值
0
临界值
左侧检验图示
置信水平 拒绝域
1-
临界值
0
右侧检验图示
置信水平 拒绝域 1- a a
0
临界值
决策步骤
①给定显著性水平,查表得出相应的临界值z 或z/2, t或t/2 ②将计算出的检验统计量的值与临界值比较 ③作出决策 双侧检验:|统计量| > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
原假设
原假设——又称零假设,是指研究者想收 集证据予以反对的假设,表示为 H0。 总是有符号 、 或,
例如,H0 : 10cm H0 : 10cm H0 : 10cm
备择假设
备择假设 ——也称研究假设 ,是指研究者 想收集证据予以支持的假设,表示为 H1。
总是有符号 、 或
4.1 假设检验的基本问题
一、假设检验的概念
什么是假设检验?
假设检验 —— 是指先对总体的参数或分布 形式提出某种假设,然后利用样本信息判断假 设是否成立的过程; ◆包括参数检验和非参数检验;
◆逻辑上运用的是概率反证法;
◆统计依据为小概率原理。
小概率原理
小概率事件——若事件A发生的概率P(A)很 小很小或接近于0。一般在假设检验中,通常要 求P(A)≤0.05。 严格说来,小概率事件并非不可能事件,但 是小概率事件在一次试验中几乎是不可能发生的, 实践中可以将其看作是不可能事件。 小概率原理是假设检验的灵魂。任何假设检 验都是根据这一基本原理、基本思想为基础的。
1/2 p 值
1/2 p 值
临界值
计算出的统计量
0
临界值
计算出的统计量
Z
左侧检验
置信水平
1-
p值
临界值 计算出的统计量
0
右侧检验
置信水平
1-
p值
0
临界值 计算出的统计量
假设检验步骤
1、提出原假设和备择假设; 2、确定一个适当的检验统计量,并利用样本数据 算出其具体数值; 3、根据显著性水平,计算出其临界值,指定拒绝 域; 4、将统计量的值与临界值进行比较,作出决策。 统计量的值落在拒绝域,拒绝 H0 ,否则不 拒绝H0 也可以直接利用p值作出决策
0
α=0.05,查表得Zα/2=1.96
检验统计量|Z|=21.64>Zα/2=1.96
所以应拒绝H0,表明新材料生产的铜丝的折断 力X有明显的变化。
拒绝域与临界值
拒绝域——是指能够拒绝原假设的统计量的 所有可能取值构成的集合。 ◆大小等于显著性水平。 ◆位置取决于检验是单侧还是双侧。双侧拒 绝域在分布两侧;单侧拒绝域在左侧或右侧。 临界值——根据给定的显著性水平确定的拒 绝域的边界值。
双侧检验图示
置信水平 拒绝域 拒绝域 1-
/2
/2
原假设
右侧检验
H0 : = 0
H0 : 0
H0 : 0
备择假设
H1 : ≠0
H1 : < 0
H1 : > 0
四、两类错误与显著性水平
假设检验的目的是要根据样本信息作出最终 决策。研究者总想作出正确的决策,但由于决策 是建立在样本信息的基础之上的,而样本又是随 机的,因而就有可能犯错误。经常犯的错误有以 下两种: ◆当原假设正确时,拒绝它; ◆当原假设错误时,没有拒绝它。