第六章假设检验1
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
20
四、两类错误的概率
由于“样本值落入拒绝域”和“样本值落入接受域”都是随 机事件,如按小概率原理拒绝或不拒绝原假设,则可能犯两种错误:
第一类错误(type 1 error)(“弃真”错误): 原假设 H0 为真,而被拒绝了.
第一类错误由控制,若大,发生第一类错误的 可能性就大,需较多的样本作出判断。
根据是否拒绝H0作出差别是否有统计学意义的结论 结合研究的实际问题以及统计学结论,作出专业结论。 常表达为“可认为…”“有很大把握…”等。
29
【例6.1】 x 0.4938, n 12, X ~ N(, 0.012 ), 0 0.5
取=0.05,对H0:=0.5,H1:≠0.5进行假设检验。 解:(1)原假设 H0:=0.5,H1:≠0.5
因为有99个白球的盒子中,摸出红球的概率只有 1/100,这是小概率事件.
但小概率事件在一次试验中竟然发生了,这不能不 使人怀疑所作的假设H0,从而拒绝该假设。
上面所使用的推理方法,是一种带概率性质的反证 法,不妨称为概率反证法.
14
概率反证法与传统反证法的区别: 传统反证法原理:在原假设成立的条件下导出的结论应是绝
意义.
(2) P值(指当H0为真时,统计量值落在拒绝域内的概率)的大小 关系到拒绝原假设的把握程度
P值越小, 拒绝的把握性越大。通常当0.05≥p>0.01
时拒绝H0,称与0差异具有统计学意义,而当P≤0.01时拒 17 绝H0,称与0 差异具有高度统计学意义.
P值的直观含义:
计算统计量t或U等
●
24
第二节 参数假设检验常用方法
对于总体分布已知的数学期望和方差等参数 的假设检验,通常有三种不同的做法:
置信区间法 临界值法 P值法 本质上这三种方法是一致的。
25
一、置信区间法
置信区间法基本步骤
1、建立统计假设:设立原假设H0和备择假设H1 2、利用区间估计法,求得参数在置信水平1-α的置 信区间。 3、判断原假设H0为真的参数值是否在置信区间之 外,是则拒绝原假设H0 ,否则不拒绝原假设H0。 4、作出统计学结论和专业结论。
上章回顾
一、点估计、三个评价标准及三个常用估计量 (无偏性、有效性及一致性)
ˆ
X
1 n
n i 1
Xi
ˆ 2
S2
1 n1
n
(Xi
i 1
X )2
pˆ ~p k n
二、点估计方法:矩估计法和似然估计法
总体l阶原点矩 l E( X l )
样本l阶原点矩为
Al
1 n
n i 1
X
l i
令μl=Al (l=1,2….k),解方程得到参数估计量。
假设检验
单侧假设检验
双侧假设检验
拒绝域位于数轴一端, 即V0 =(-∞,a]或[b,+ ∞) 假设形如:
H0: ≥0 H1: <0 (完备的) H0: =0 H1: <0 (不完备)
拒绝域位于数轴两端, 即V0 =(-∞,a]∪[b,+ ∞) 假设形如:
H0: =0 H1: 0
拒绝域的端点a,b 是临界值,也即分位数
在实际中,通常将显著性水平作为犯第一类错误 的概率. 1- 大小用于描述检验的可靠性。
第二类错误(type 2 error) (“取伪”错误):原假设H0 不真,而不被拒绝. 犯第二类错误的概率记为. 一 般不易计算。 1-用于描述检验的效能,一般不能小于75%。
21
判断 不拒绝H0
实际情况
H0 为真
假设检验本质上就是推断样本均数差别是由①造成的概 率大小。
若由①造成的概率较大(如P>0.05),则认为差别无统 计意义,可认为生产正常。
若由①造成的概率很小(如P≤0.05),则认为样本均数 差别不是由①,而是由②造成,则认为差别有统计意义, 可以认为生产不正常。
这就是假设检验 的基本思路
9
第一节 假设检验基本思想
28
二、临界值法
先查表得到水平临界值,由临界值找出拒绝域, 从而判定原假设H0真伪 。 临界值法基本步骤:
1、建立统计假设:设立原假设H0和备择假设H1 2、假定H0为真,选择统计量(分布已知),并求得样本统计量 的值. 3、对给定查表(H0真),得统计量的临界值,从而得到使 P{S∈V0}= 的拒绝域V0 。 4、若统计量值V0, 则拒绝H0,否则不拒绝H0 5、作出统计学结论和专业结论。
H0 为不真
正确概率 1-
第二类错误概率
拒绝 H0 第一类错误概率
正确概率1-
【注意】(1) 两类错误概率的关系 两类错误是互相关联的,当样本容量n 固定时,
一类错误概率的减少将导致另一类错误概率的增加。 一般采取的原则:在控制犯第一类错误的概率的
条件下, 尽量使犯第二类错误 小。 要同时降低两类错误的概率、(或者要在不变
描述性分析
计量资料分析
统计分析
推断性分析
参数估计
计数资料分析
推断性分析
假设检验
根据样本的信息检验关于总体的 某个假设是否正确。抽样调查时必须的
3
描述性分析
多元统计分析
统计资料的几种类型:
变量类型
变量值表现
实例
资料类型
定量变量
定量(具体数值)
身高(cm)
计量资料
(定比和定距)
定无
性序
变
有
量
序
二分类 多分类 多分类
12
实例:有两个盒子,各装有100个球.
…99个
…99个
99个红球 一个白球
一盒中的白球和红球数
99个白球 一个红球
另一盒中的白球和红球数
现从两盒中随机取出一个盒子,验证这个盒子里 是白球99个还是红球99个?
13
不妨假设H0:这个盒子里 有99个白球.
现从中随机摸出一个球,发现是红球,如何判断该 假设是否成立?
5
第六章 假设检验
第一节 假设检验基本思想 第二节 参数假设检验常用方法
置信区间法 临界值法 P值法
6
目标要求
1、熟悉统计假设、小概率原理、拒绝域及 两类错误等概念
2、掌握三种常见参数假设检验的方法
7
实例: 设罐装可乐容量按标准应在350毫升和360毫升 之间,某厂在生产罐装可乐的流水线上不断地封装,然 后装箱外运,怎么知道这批罐装可乐容量是否合格呢?
(拒绝域一般取闭区间)
接受域 实数轴上拒绝域之外的部分,称为H0的接受域V1.
思考:置信区间与接受域的区别与联系?
显著性水平(Significance level):临界概率 称为显著 性水平,通常 取0.05、0.01,0.1。在许多研究领域, =0.05
常被认为是可接受错误的边界水平。
16
【注意】 (1) “拒绝”、“不拒绝”的含义
对立的两类属性 不相容的多类属性
疗效(有效、无效) 定类资料
血型(A,B,O,AB)
有程度差异的多类属 文化程度(初中、 定序(等
性
高中、大学...) 级)资料
4
大样本的一般含义: 计量资料--通过测定得到的指标。如身高、 体重等,一般要求样本容量不小于30; 计数资料--通过具有某种属性特征得到的指 标。如阳性、有效等,一般要求样本容量不 小于50 。
18
按统计假设的不同:
假设检验
参数假设检验
非参数假设检验
总体分布形式已知, 对其未知参数的 假设作假设检验
对未知总体分布 形式的总体假设 作假设检验
根据统计量所服从分布的不同,如标准正态分布, 卡方分布,t分布,F分布等,相应假设检验又称为u检验,卡方检验,t-检验,F-检验等.
19
而按拒绝域的不同:
的条件下降低),需要增加样本容量来自百度文库 。
22
第1类错误的概率 第2类错误的概率
23
(2) 在实际中,一般希望得到拒绝H0的结论 因为这时可以明确知道可能犯第一类错误的概率
(已知)。如果得到不拒绝H0的结论,则可能犯第二类 错误的概率难以确定。
但在用统计软件处理时,H0都是为了计算统计量的 方便是事先确定好的,没法人为改变的。
而当α=0.01,即 在置信水平99 %的置信区间为
(0.4864, 0.5012)。
(3) 0.5在99 %的置信区间内,而不在95% 的置信区间 内。
故当α=0.05,拒绝原假设H0,与0.5差异有统计 学意义,而当α=0.01,不拒绝原假设H0,与0.5差异
没有统计学意义。
可认为该厂药品在0.05水平上不符合要求.
n
L L( x1, x2 ,...xn;1,...,m ) p( xi;1,...,m ) i 1
1
三、区间估计、置信度、置信区间
四、常见类型总体均数及总体比率的区间估计
X Z / 2 n
S X Z /2 n
x t / 2(n 1)
S n
pˆ Z / 2
p (1 p) n
2
利用从总体抽样得到的样本 来估计总体的某些参数。
对正确的,如果结论与之矛盾,则完全否定原假设. 概率反证法原理(小概率原理) :如果小概率事件在一次试 验中居然发生,则以很大的把握否定原假设.
15
三、假设检验(Hypothesis Testing) 拒绝(否定)域( Critical region )
根据实际需要选取一临界概率 (0<<1,很小)及一个 适于检验原假设H0的统计量 S=f(X1,X2,…Xn),使得 P(S∈V0)= , 则集合V0就称为原假设H0的拒绝域.
如 对原假设H0 :=0 有两种结果:
在 水平上拒绝H0,接受H1,说明有1-的把握 H0不 真,可以说与0差异有统计学意义,但并不能作出H0不
成立的肯定结论。
在 水平上不拒绝H0 (注:对H0不说接受,此时不提备择
假设;但若拒绝H0,对H1应说接受)其含义是无足够理由拒绝,
并不意味着有充分理由接受,只说明与0差异无统计学
通常的办法是进行抽样检查。
如每隔1小时,抽查5罐,得5个容量的值X1,…,X5,
根据这些值的均数来判断生产是否正常。
发现不正常
就应停产,找出原因, 排除故障,然后再生产 ?!
发现正常
就继续按规定时间再抽样, 以此监督生产,保证质量?!
8
造成样本均数不正常( 即≠355 )的原因:
① 完全由抽样误差造成; ② 生产因素造成(本质上的差别)。
解 显然 x 0.4938, n 12, X ~ N(, 0.012 ), 0 0.5
(1) H0:=0.5,H1:≠0.5进行检验
(2) 求置信区间(四个步骤)
正态总体且方差已知下 在置信水平1-α 的
置信区间为
x u
2
n
27
则当α=0.05,即 在置信水平95% 的置信区间为
(0.4881, 0.4995)。
根据是否拒绝H0作出差别是否有统计学意义的 结论;
结合研究的实际问题以及统计学结论,作出专业 结论。常表达为“可认为…”“有很大把握…”等。
26
【例6.1】某药物按规定每片有效成分含量为0.5mg, 现随机抽取某厂该药品12片,测得片平均有效成分 0.4938mg,设有效成分含量服从标准差为0.01mg的 正态分布,问该厂药品是否符合要求?
一、统计假设 在实际中,经常遇到根据样本信息,判断总体是否具
有某种指定的特征,为此,需要作各种假设:
例如 (1)随机变量X分布参数假设 如
已知X服从两点分布,H0 :p = p0 ,H1 :p ≠p0 已知X服从正态分布, H0 :=0, H1 : >0
(2) 随机变量X分布假设 如 H0:X服从正态分布 H0:X服从泊松分布
(2) 选统计量 U X 0.5 ~N(0,1) 0.01 12
u 0.4938 0.5 2.1477 0.01 12
30
(3)由P(| U | u0.05 ) 0.05查表4得
2
u0.05 1.96
2
拒绝域为(-∞,-1.96]∪[1.96,+ ∞)
(4)显然,u=-2.1477属于拒绝域。
一般把希望出现的结论作为备择假设,所以备择假设 也被称为研究假设,原假设也被称为无效假设。
11
二、小概率原理 小概率事件(概率很小的事件)在一次试验中
几乎不会发生。
假设检验的原理:若在原假设H0成立条件下,某事件 为小概率事件,但它在一次试验中竟然发生了,若推 理过程无差错,便有理由认为原假设H0不真,从而拒 绝之。(拒绝的含义指以很大的把握否定原假设) .
(3)多个随机变量关系假设 如 H0:它们有相同分布 H0:它们相互独立
10
统计假设: 关于总体(参数,分布,特征等)的各种假设.
参数假设—总体分布函数形式已知,对其所包含的参数所作 的假设,如(1) 非参数假设--总体分布函数形式未知,对分布函数形式或特 征所作的假设,如(2)(3)
原(零)假设(null hypothesis) H0 :在假设检验中,根据 需要所作的基本假设,是整个检验推理的出发点。如(1)中H0 备择(对立)假设 (alternative hypothesis) H1:指原假设 H0 的对立假设。如(1)中H1。