第六章假设检验1
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
26
【例6.1】某药物按规定每片有效成分含量为0.5mg,现 随机抽取某厂该药品12片,测得片平均有效成分 0.4938mg,设有效成分含量服从标准差为0.01mg的正态 分布,问该厂药品是否符合要求?
解 显然 x 0.4938, n 12, X ~ N( , 0.012 ), 0 0.5
ˆ Z / 2 p
p (1 p) n
2
利用从总体抽样得到的样本 来估计总体的某些参数。
描述性分析
计量资料分析 推断性分析 参数估计
统计分析
推断性分析 计数资料分析 描述性分析
根据样本的信息检验关于总体的 某个假设是否正确。抽样调查时必须的
3
假设检验
多元统计分析
统计资料的几种类型:
变量类型 定量变量
…99个
99个红球 一个白球 99个白球 一个红球
…99个
一盒中的白球和红球数
另一盒中的白球和红球数
现从两盒中随机取出一个盒子,验证这个盒子里 是白球99个还是红球99个?
13
不妨假设H0:这个盒子里 有99个白球.
现从中随机摸出一个球,发现是红球,如何判断该 假设是否成立?
因为有99个白球的盒子中,摸出红球的概率只有 1/100,这是小概率事件.
15
三、假设检验(Hypothesis Testing)
拒绝(否定)域( Critical region ) 根据实际需要选取一临界概率 (0<<1,很小)及一个 适于检验原假设H0的统计量 S=f(X1,X2,„Xn),使得 P(S∈V0)= , 则集合V0就称为原假设H0的拒绝域.
(拒绝域一般取闭区间)
5
第六章 假设检验
第一节
假设检验基本思想Leabharlann Baidu
第二节
参数假设检验常用方法 临界值法 P值法
置信区间法
6
目标要求
1、熟悉统计假设、小概率原理、拒绝域及 两类错误等概念 2、掌握三种常见参数假设检验的方法
7
实例: 设罐装可乐容量按标准应在350毫升和360毫升 之间,某厂在生产罐装可乐的流水线上不断地封装,然 后装箱外运,怎么知道这批罐装可乐容量是否合格呢?
接受域
实数轴上拒绝域之外的部分,称为H0的接受域V1.
思考:置信区间与接受域的区别与联系? 显著性水平(Significance level):临界概率 称为显著 性水平,通常 取0.05、0.01,0.1。在许多研究领域, =0.05
常被认为是可接受错误的边界水平。
16
【注意】 (1) “拒绝”、“不拒绝”的含义 如 对原假设H0 :=0 有两种结果: 在 水平上拒绝H0,接受H1,说明有1-的把握 H0不 真,可以说与0差异有统计学意义,但并不能作出H0不 成立的肯定结论。 在 水平上不拒绝H0 (注:对H0不说接受,此时不提备择 假设;但若拒绝H0,对H1应说接受)其含义是无足够理由拒绝, 并不意味着有充分理由接受,只说明与0差异无统计学 意义. (2) P值(指当H0为真时,统计量值落在拒绝域内的概率)的大小 关系到拒绝原假设的把握程度 P值越小, 拒绝的把握性越大。通常当0.05≥p>0.01 时拒绝H0,称与0差异具有统计学意义,而当P≤0.01时拒 绝H0,称与0 差异具有高度统计学意义. 17
10
统计假设: 关于总体(参数,分布,特征等)的各种假设. 参数假设—总体分布函数形式已知,对其所包含的参数所作 的假设,如(1) 非参数假设--总体分布函数形式未知,对分布函数形式或特 征所作的假设,如(2)(3)
原(零)假设(null hypothesis) H0 :在假设检验中,根据 需要所作的基本假设,是整个检验推理的出发点。如(1)中H0 备择(对立)假设 (alternative hypothesis) H1:指原假设 H0 的对立假设。如(1)中H1。 一般把希望出现的结论作为备择假设,所以备择假设 也被称为研究假设,原假设也被称为无效假设。
上章回顾
一、点估计、三个评价标准及三个常用估计量 (无偏性、有效性及一致性)
1 n ˆ X Xi n i 1
1 n ˆ S ( X i X )2 n 1 i 1
2 2
k ~ ˆ p p n
二、点估计方法:矩估计法和似然估计法
1 n l 总体l阶原点矩 l E ( X ) 样本l阶原点矩为 Al X i n i 1 令μl=Al (l=1,2….k),解方程得到参数估计量。
这就是假设检验 的基本思路
9
第一节 假设检验基本思想
一、统计假设 在实际中,经常遇到根据样本信息,判断总体是否具 有某种指定的特征,为此,需要作各种假设: 例如 (1)随机变量X分布参数假设 如
已知X服从两点分布,H0 :p = p0 ,H1 :p ≠p0 已知X服从正态分布, H0 :=0, H1 : >0 (2) 随机变量X分布假设 如 H0:X服从正态分布 H0:X服从泊松分布 (3)多个随机变量关系假设 如 H0:它们有相同分布 H0:它们相互独立
但小概率事件在一次试验中竟然发生了,这不能不 使人怀疑所作的假设H0,从而拒绝该假设。 上面所使用的推理方法,是一种带概率性质的反证 法,不妨称为概率反证法.
14
概率反证法与传统反证法的区别: 传统反证法原理:在原假设成立的条件下导出的结论应是绝 对正确的,如果结论与之矛盾,则完全否定原假设. 概率反证法原理(小概率原理) :如果小概率事件在一次试 验中居然发生,则以很大的把握否定原假设.
29
【例6.1】 x 0.4938, n 12, X ~ N( , 0.012 ), 0 0.5
19
而按拒绝域的不同:
假设检验
单侧假设检验
双侧假设检验
拒绝域位于数轴一端, 即V0 =(-∞,a]或[b,+ ∞) 假设形如: H0: ≥0 H1: <0 (完备的) H0: =0 H1: <0 (不完备)
拒绝域位于数轴两端, 即V0 =(-∞,a]∪[b,+ ∞) 假设形如: H0: =0 H1: 0
拒绝域的端点a,b 是临界值,也即分位数
20
四、两类错误的概率
由于“样本值落入拒绝域”和“样本值落入接受域”都是随 机事件,如按小概率原理拒绝或不拒绝原假设,则可能犯两种错误:
第一类错误(type 1 error)(“弃真”错误): 原假设 H0 为真,而被拒绝了. 第一类错误由控制,若大,发生第一类错误的 可能性就大,需较多的样本作出判断。 在实际中,通常将显著性水平作为犯第一类错误 的概率. 1- 大小用于描述检验的可靠性。 第二类错误(type 2 error) (“取伪”错误):原假设H0 不真,而不被拒绝. 犯第二类错误的概率记为. 一 般不易计算。 1-用于描述检验的效能,一般不能小于75%。
22
第1类错误的概率
第2类错误的概率
23
(2) 在实际中,一般希望得到拒绝H0的结论 因为这时可以明确知道可能犯第一类错误的概率 (已知)。如果得到不拒绝H0的结论,则可能犯第二类 错误的概率难以确定。 但在用统计软件处理时,H0都是为了计算统计量的 方便是事先确定好的,没法人为改变的。
24
11
二、小概率原理 小概率事件(概率很小的事件)在一次试验中 几乎不会发生。
假设检验的原理:若在原假设H0成立条件下,某事件 为小概率事件,但它在一次试验中竟然发生了,若推 理过程无差错,便有理由认为原假设H0不真,从而拒 绝之。(拒绝的含义指以很大的把握否定原假设) .
12
实例:有两个盒子,各装有100个球.
第二节 参数假设检验常用方法
对于总体分布已知的数学期望和方差等参数 的假设检验,通常有三种不同的做法: 置信区间法 临界值法 P值法
本质上这三种方法是一致的。
25
一、置信区间法
置信区间法基本步骤 1、建立统计假设:设立原假设H0和备择假设H1 2、利用区间估计法,求得参数在置信水平1-α 的置 信区间。 3、判断原假设H0为真的参数值是否在置信区间之 外,是则拒绝原假设H0 ,否则不拒绝原假设H0。 4、作出统计学结论和专业结论。 根据是否拒绝H0作出差别是否有统计学意义的 结论; 结合研究的实际问题以及统计学结论,作出专业 结论。常表达为“可认为…”“有很大把握…”等。
(3) 0.5在99 %的置信区间内,而不在95% 的置信区间 内。 故当α =0.05,拒绝原假设H0,与0.5差异有统计 学意义,而当α =0.01,不拒绝原假设H0,与0.5差异 没有统计学意义。
可认为该厂药品在0.05水平上不符合要求.
28
二、临界值法
先查表得到水平临界值,由临界值找出拒绝域, 从而判定原假设H0真伪 。 临界值法基本步骤: 1、建立统计假设:设立原假设H0和备择假设H1 2、假定H0为真,选择统计量(分布已知),并求得样本统计量 的值. 3、对给定查表(H0真),得统计量的临界值,从而得到使 P{S∈V0}= 的拒绝域V0 。 4、若统计量值V0, 则拒绝H0,否则不拒绝H0 5、作出统计学结论和专业结论。 根据是否拒绝H0作出差别是否有统计学意义的结论 结合研究的实际问题以及统计学结论,作出专业结论。 常表达为“可认为„”“有很大把握„”等。
21
实
判 断 H0 为真 正确概率 1-
际
情
况
H0 为不真
不拒绝H0
第二类错误概率
拒绝 H0
第一类错误概率
正确概率1-
【注意】(1) 两类错误概率的关系 两类错误是互相关联的,当样本容量n 固定时, 一类错误概率的减少将导致另一类错误概率的增加。 一般采取的原则:在控制犯第一类错误的概率的 条件下, 尽量使犯第二类错误 小。 要同时降低两类错误的概率、(或者要在不变 的条件下降低),需要增加样本容量n 。
通常的办法是进行抽样检查。 如每隔1小时,抽查5罐,得5个容量的值X1,„,X5, 根据这些值的均数来判断生产是否正常。 发现不正常 发现正常
就应停产,找出原因, 排除故障,然后再生产 ?!
就继续按规定时间再抽样, 以此监督生产,保证质量?!
8
造成样本均数不正常( 即≠355 )的原因: ① 完全由抽样误差造成; ② 生产因素造成(本质上的差别)。 假设检验本质上就是推断样本均数差别是由①造成的概 率大小。 若由①造成的概率较大(如P>0.05),则认为差别无统 计意义,可认为生产正常。 若由①造成的概率很小(如P≤0.05),则认为样本均数 差别不是由①,而是由②造成,则认为差别有统计意义, 可以认为生产不正常。
二分类 多分类
变量值表现
定量(具体数值)
实例
身高(cm)
资料类型
计量资料
(定比和定距)
定 性 变 量
无 序
对立的两类属性 不相容的多类属性 有程度差异的多类属 性
疗效(有效、无效) 定类资料 血型(A,B,O,AB) 文化程度(初中、 高中、大学...) 定序(等 级)资料
有 序
多分类
4
大样本的一般含义: 计量资料--通过测定得到的指标。如身高、 体重等,一般要求样本容量不小于30; 计数资料--通过具有某种属性特征得到的指 标。如阳性、有效等,一般要求样本容量不 小于50 。
l
L L( x1 , x2 ,... xn ;1 ,..., m ) p( xi ;1 ,..., m )
i 1
1
n
三、区间估计、置信度、置信区间 四、常见类型总体均数及总体比率的区间估计
X Z / 2
n
X Z / 2
S n
S x t / 2 ( n 1) n
P值的直观含义:
计算统计量t或U等
●
18
按统计假设的不同:
假设检验
参数假设检验 非参数假设检验
总体分布形式已知, 对其未知参数的 假设作假设检验
对未知总体分布 形式的总体假设 作假设检验
根据统计量所服从分布的不同,如标准正态分 布,卡方分布,t分布,F分布等,相应假设检验又称 为u-检验,卡方检验,t-检验,F-检验等.
(1) H0:=0.5,H1:≠0.5进行检验 正态总体且方差已知下 在置信水平1-α 的置信区间为
(2) 求置信区间(四个步骤 )
x u
2
n
27
则当α =0.05,即 在置信水平95% 的置信区间为 (0.4881, 0.4995)。 而当α =0.01,即 在置信水平99 %的置信区间为 (0.4864, 0.5012)。
【例6.1】某药物按规定每片有效成分含量为0.5mg,现 随机抽取某厂该药品12片,测得片平均有效成分 0.4938mg,设有效成分含量服从标准差为0.01mg的正态 分布,问该厂药品是否符合要求?
解 显然 x 0.4938, n 12, X ~ N( , 0.012 ), 0 0.5
ˆ Z / 2 p
p (1 p) n
2
利用从总体抽样得到的样本 来估计总体的某些参数。
描述性分析
计量资料分析 推断性分析 参数估计
统计分析
推断性分析 计数资料分析 描述性分析
根据样本的信息检验关于总体的 某个假设是否正确。抽样调查时必须的
3
假设检验
多元统计分析
统计资料的几种类型:
变量类型 定量变量
…99个
99个红球 一个白球 99个白球 一个红球
…99个
一盒中的白球和红球数
另一盒中的白球和红球数
现从两盒中随机取出一个盒子,验证这个盒子里 是白球99个还是红球99个?
13
不妨假设H0:这个盒子里 有99个白球.
现从中随机摸出一个球,发现是红球,如何判断该 假设是否成立?
因为有99个白球的盒子中,摸出红球的概率只有 1/100,这是小概率事件.
15
三、假设检验(Hypothesis Testing)
拒绝(否定)域( Critical region ) 根据实际需要选取一临界概率 (0<<1,很小)及一个 适于检验原假设H0的统计量 S=f(X1,X2,„Xn),使得 P(S∈V0)= , 则集合V0就称为原假设H0的拒绝域.
(拒绝域一般取闭区间)
5
第六章 假设检验
第一节
假设检验基本思想Leabharlann Baidu
第二节
参数假设检验常用方法 临界值法 P值法
置信区间法
6
目标要求
1、熟悉统计假设、小概率原理、拒绝域及 两类错误等概念 2、掌握三种常见参数假设检验的方法
7
实例: 设罐装可乐容量按标准应在350毫升和360毫升 之间,某厂在生产罐装可乐的流水线上不断地封装,然 后装箱外运,怎么知道这批罐装可乐容量是否合格呢?
接受域
实数轴上拒绝域之外的部分,称为H0的接受域V1.
思考:置信区间与接受域的区别与联系? 显著性水平(Significance level):临界概率 称为显著 性水平,通常 取0.05、0.01,0.1。在许多研究领域, =0.05
常被认为是可接受错误的边界水平。
16
【注意】 (1) “拒绝”、“不拒绝”的含义 如 对原假设H0 :=0 有两种结果: 在 水平上拒绝H0,接受H1,说明有1-的把握 H0不 真,可以说与0差异有统计学意义,但并不能作出H0不 成立的肯定结论。 在 水平上不拒绝H0 (注:对H0不说接受,此时不提备择 假设;但若拒绝H0,对H1应说接受)其含义是无足够理由拒绝, 并不意味着有充分理由接受,只说明与0差异无统计学 意义. (2) P值(指当H0为真时,统计量值落在拒绝域内的概率)的大小 关系到拒绝原假设的把握程度 P值越小, 拒绝的把握性越大。通常当0.05≥p>0.01 时拒绝H0,称与0差异具有统计学意义,而当P≤0.01时拒 绝H0,称与0 差异具有高度统计学意义. 17
10
统计假设: 关于总体(参数,分布,特征等)的各种假设. 参数假设—总体分布函数形式已知,对其所包含的参数所作 的假设,如(1) 非参数假设--总体分布函数形式未知,对分布函数形式或特 征所作的假设,如(2)(3)
原(零)假设(null hypothesis) H0 :在假设检验中,根据 需要所作的基本假设,是整个检验推理的出发点。如(1)中H0 备择(对立)假设 (alternative hypothesis) H1:指原假设 H0 的对立假设。如(1)中H1。 一般把希望出现的结论作为备择假设,所以备择假设 也被称为研究假设,原假设也被称为无效假设。
上章回顾
一、点估计、三个评价标准及三个常用估计量 (无偏性、有效性及一致性)
1 n ˆ X Xi n i 1
1 n ˆ S ( X i X )2 n 1 i 1
2 2
k ~ ˆ p p n
二、点估计方法:矩估计法和似然估计法
1 n l 总体l阶原点矩 l E ( X ) 样本l阶原点矩为 Al X i n i 1 令μl=Al (l=1,2….k),解方程得到参数估计量。
这就是假设检验 的基本思路
9
第一节 假设检验基本思想
一、统计假设 在实际中,经常遇到根据样本信息,判断总体是否具 有某种指定的特征,为此,需要作各种假设: 例如 (1)随机变量X分布参数假设 如
已知X服从两点分布,H0 :p = p0 ,H1 :p ≠p0 已知X服从正态分布, H0 :=0, H1 : >0 (2) 随机变量X分布假设 如 H0:X服从正态分布 H0:X服从泊松分布 (3)多个随机变量关系假设 如 H0:它们有相同分布 H0:它们相互独立
但小概率事件在一次试验中竟然发生了,这不能不 使人怀疑所作的假设H0,从而拒绝该假设。 上面所使用的推理方法,是一种带概率性质的反证 法,不妨称为概率反证法.
14
概率反证法与传统反证法的区别: 传统反证法原理:在原假设成立的条件下导出的结论应是绝 对正确的,如果结论与之矛盾,则完全否定原假设. 概率反证法原理(小概率原理) :如果小概率事件在一次试 验中居然发生,则以很大的把握否定原假设.
29
【例6.1】 x 0.4938, n 12, X ~ N( , 0.012 ), 0 0.5
19
而按拒绝域的不同:
假设检验
单侧假设检验
双侧假设检验
拒绝域位于数轴一端, 即V0 =(-∞,a]或[b,+ ∞) 假设形如: H0: ≥0 H1: <0 (完备的) H0: =0 H1: <0 (不完备)
拒绝域位于数轴两端, 即V0 =(-∞,a]∪[b,+ ∞) 假设形如: H0: =0 H1: 0
拒绝域的端点a,b 是临界值,也即分位数
20
四、两类错误的概率
由于“样本值落入拒绝域”和“样本值落入接受域”都是随 机事件,如按小概率原理拒绝或不拒绝原假设,则可能犯两种错误:
第一类错误(type 1 error)(“弃真”错误): 原假设 H0 为真,而被拒绝了. 第一类错误由控制,若大,发生第一类错误的 可能性就大,需较多的样本作出判断。 在实际中,通常将显著性水平作为犯第一类错误 的概率. 1- 大小用于描述检验的可靠性。 第二类错误(type 2 error) (“取伪”错误):原假设H0 不真,而不被拒绝. 犯第二类错误的概率记为. 一 般不易计算。 1-用于描述检验的效能,一般不能小于75%。
22
第1类错误的概率
第2类错误的概率
23
(2) 在实际中,一般希望得到拒绝H0的结论 因为这时可以明确知道可能犯第一类错误的概率 (已知)。如果得到不拒绝H0的结论,则可能犯第二类 错误的概率难以确定。 但在用统计软件处理时,H0都是为了计算统计量的 方便是事先确定好的,没法人为改变的。
24
11
二、小概率原理 小概率事件(概率很小的事件)在一次试验中 几乎不会发生。
假设检验的原理:若在原假设H0成立条件下,某事件 为小概率事件,但它在一次试验中竟然发生了,若推 理过程无差错,便有理由认为原假设H0不真,从而拒 绝之。(拒绝的含义指以很大的把握否定原假设) .
12
实例:有两个盒子,各装有100个球.
第二节 参数假设检验常用方法
对于总体分布已知的数学期望和方差等参数 的假设检验,通常有三种不同的做法: 置信区间法 临界值法 P值法
本质上这三种方法是一致的。
25
一、置信区间法
置信区间法基本步骤 1、建立统计假设:设立原假设H0和备择假设H1 2、利用区间估计法,求得参数在置信水平1-α 的置 信区间。 3、判断原假设H0为真的参数值是否在置信区间之 外,是则拒绝原假设H0 ,否则不拒绝原假设H0。 4、作出统计学结论和专业结论。 根据是否拒绝H0作出差别是否有统计学意义的 结论; 结合研究的实际问题以及统计学结论,作出专业 结论。常表达为“可认为…”“有很大把握…”等。
(3) 0.5在99 %的置信区间内,而不在95% 的置信区间 内。 故当α =0.05,拒绝原假设H0,与0.5差异有统计 学意义,而当α =0.01,不拒绝原假设H0,与0.5差异 没有统计学意义。
可认为该厂药品在0.05水平上不符合要求.
28
二、临界值法
先查表得到水平临界值,由临界值找出拒绝域, 从而判定原假设H0真伪 。 临界值法基本步骤: 1、建立统计假设:设立原假设H0和备择假设H1 2、假定H0为真,选择统计量(分布已知),并求得样本统计量 的值. 3、对给定查表(H0真),得统计量的临界值,从而得到使 P{S∈V0}= 的拒绝域V0 。 4、若统计量值V0, 则拒绝H0,否则不拒绝H0 5、作出统计学结论和专业结论。 根据是否拒绝H0作出差别是否有统计学意义的结论 结合研究的实际问题以及统计学结论,作出专业结论。 常表达为“可认为„”“有很大把握„”等。
21
实
判 断 H0 为真 正确概率 1-
际
情
况
H0 为不真
不拒绝H0
第二类错误概率
拒绝 H0
第一类错误概率
正确概率1-
【注意】(1) 两类错误概率的关系 两类错误是互相关联的,当样本容量n 固定时, 一类错误概率的减少将导致另一类错误概率的增加。 一般采取的原则:在控制犯第一类错误的概率的 条件下, 尽量使犯第二类错误 小。 要同时降低两类错误的概率、(或者要在不变 的条件下降低),需要增加样本容量n 。
通常的办法是进行抽样检查。 如每隔1小时,抽查5罐,得5个容量的值X1,„,X5, 根据这些值的均数来判断生产是否正常。 发现不正常 发现正常
就应停产,找出原因, 排除故障,然后再生产 ?!
就继续按规定时间再抽样, 以此监督生产,保证质量?!
8
造成样本均数不正常( 即≠355 )的原因: ① 完全由抽样误差造成; ② 生产因素造成(本质上的差别)。 假设检验本质上就是推断样本均数差别是由①造成的概 率大小。 若由①造成的概率较大(如P>0.05),则认为差别无统 计意义,可认为生产正常。 若由①造成的概率很小(如P≤0.05),则认为样本均数 差别不是由①,而是由②造成,则认为差别有统计意义, 可以认为生产不正常。
二分类 多分类
变量值表现
定量(具体数值)
实例
身高(cm)
资料类型
计量资料
(定比和定距)
定 性 变 量
无 序
对立的两类属性 不相容的多类属性 有程度差异的多类属 性
疗效(有效、无效) 定类资料 血型(A,B,O,AB) 文化程度(初中、 高中、大学...) 定序(等 级)资料
有 序
多分类
4
大样本的一般含义: 计量资料--通过测定得到的指标。如身高、 体重等,一般要求样本容量不小于30; 计数资料--通过具有某种属性特征得到的指 标。如阳性、有效等,一般要求样本容量不 小于50 。
l
L L( x1 , x2 ,... xn ;1 ,..., m ) p( xi ;1 ,..., m )
i 1
1
n
三、区间估计、置信度、置信区间 四、常见类型总体均数及总体比率的区间估计
X Z / 2
n
X Z / 2
S n
S x t / 2 ( n 1) n
P值的直观含义:
计算统计量t或U等
●
18
按统计假设的不同:
假设检验
参数假设检验 非参数假设检验
总体分布形式已知, 对其未知参数的 假设作假设检验
对未知总体分布 形式的总体假设 作假设检验
根据统计量所服从分布的不同,如标准正态分 布,卡方分布,t分布,F分布等,相应假设检验又称 为u-检验,卡方检验,t-检验,F-检验等.
(1) H0:=0.5,H1:≠0.5进行检验 正态总体且方差已知下 在置信水平1-α 的置信区间为
(2) 求置信区间(四个步骤 )
x u
2
n
27
则当α =0.05,即 在置信水平95% 的置信区间为 (0.4881, 0.4995)。 而当α =0.01,即 在置信水平99 %的置信区间为 (0.4864, 0.5012)。