第六章假设检验1

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

26
【例6.1】某药物按规定每片有效成分含量为0.5mg,现随机抽取某厂该药品12片,测得片平均有效成分 0.4938mg,设有效成分含量服从标准差为0.01mg的正态分布,问该厂药品是否符合要求?
解显然 x 0.4938, n 12, X ~ N( , 0.012 ), 0 0.5
ˆ Z / 2 p
p (1 p) n
2
利用从总体抽样得到的样本来估计总体的某些参数。
描述性分析
计量资料分析推断性分析参数估计
统计分析
推断性分析计数资料分析描述性分析
根据样本的信息检验关于总体的某个假设是否正确。抽样调查时必须的
3
假设检验
多元统计分析
统计资料的几种类型：
变量类型定量变量
…99个
99个红球一个白球 99个白球一个红球
…99个
一盒中的白球和红球数
另一盒中的白球和红球数
现从两盒中随机取出一个盒子，验证这个盒子里是白球99个还是红球99个？
13
不妨假设H0:这个盒子里有99个白球.
现从中随机摸出一个球，发现是红球，如何判断该假设是否成立？
因为有99个白球的盒子中，摸出红球的概率只有 1/100，这是小概率事件.
15
三、假设检验（Hypothesis Testing）
拒绝(否定)域( Critical region ) 根据实际需要选取一临界概率 (0<<1,很小)及一个适于检验原假设H0的统计量 S=f(X1,X2,„Xn),使得 P(S∈V0)= , 则集合V0就称为原假设H0的拒绝域.
(拒绝域一般取闭区间)
5
第六章假设检验
第一节
假设检验基本思想Leabharlann Baidu
第二节
参数假设检验常用方法临界值法 P值法
置信区间法
6
目标要求
1、熟悉统计假设、小概率原理、拒绝域及两类错误等概念 2、掌握三种常见参数假设检验的方法
7
实例: 设罐装可乐容量按标准应在350毫升和360毫升之间，某厂在生产罐装可乐的流水线上不断地封装，然后装箱外运，怎么知道这批罐装可乐容量是否合格呢？
接受域
实数轴上拒绝域之外的部分,称为H0的接受域V1.
思考：置信区间与接受域的区别与联系？显著性水平(Significance level)：临界概率称为显著性水平,通常取0.05、0.01,0.1。在许多研究领域， =0.05
常被认为是可接受错误的边界水平。
16
【注意】 (1) “拒绝”、“不拒绝”的含义如对原假设H0 :=0 有两种结果: 在水平上拒绝H0,接受H1,说明有1-的把握 H0不真，可以说与0差异有统计学意义,但并不能作出H0不成立的肯定结论。在水平上不拒绝H0 (注：对H0不说接受，此时不提备择假设；但若拒绝H0，对H1应说接受)其含义是无足够理由拒绝，并不意味着有充分理由接受,只说明与0差异无统计学意义. (2) P值(指当H0为真时，统计量值落在拒绝域内的概率)的大小关系到拒绝原假设的把握程度 P值越小, 拒绝的把握性越大。通常当0.05≥p>0.01 时拒绝H0,称与0差异具有统计学意义,而当P≤0.01时拒绝H0,称与0 差异具有高度统计学意义. 17
10
统计假设: 关于总体(参数,分布,特征等)的各种假设. 参数假设—总体分布函数形式已知,对其所包含的参数所作的假设,如(1) 非参数假设--总体分布函数形式未知,对分布函数形式或特征所作的假设,如(2)(3)
原(零)假设(null hypothesis) H0 ：在假设检验中，根据需要所作的基本假设,是整个检验推理的出发点。如(1)中H0 备择(对立)假设 (alternative hypothesis) H1：指原假设 H0 的对立假设。如(1)中H1。一般把希望出现的结论作为备择假设，所以备择假设也被称为研究假设，原假设也被称为无效假设。
上章回顾
一、点估计、三个评价标准及三个常用估计量（无偏性、有效性及一致性）
1 n ˆ X Xi n i 1
1 n ˆ S ( X i X )2 n 1 i 1
2 2
k ~ ˆ p p n
二、点估计方法：矩估计法和似然估计法
1 n l 总体l阶原点矩 l E ( X ) 样本l阶原点矩为 Al X i n i 1 令μl=Al (l=1,2….k)，解方程得到参数估计量。
这就是假设检验的基本思路
9
第一节假设检验基本思想
一、统计假设在实际中，经常遇到根据样本信息，判断总体是否具有某种指定的特征，为此，需要作各种假设: 例如 (1)随机变量X分布参数假设如
已知X服从两点分布，H0 :p = p0 ，H1 :p ≠p0 已知X服从正态分布, H0 :=0， H1 : >0 (2) 随机变量X分布假设如 H0:X服从正态分布 H0:X服从泊松分布 (3)多个随机变量关系假设如 H0:它们有相同分布 H0:它们相互独立
但小概率事件在一次试验中竟然发生了，这不能不使人怀疑所作的假设H0，从而拒绝该假设。上面所使用的推理方法，是一种带概率性质的反证法，不妨称为概率反证法.
14
概率反证法与传统反证法的区别: 传统反证法原理:在原假设成立的条件下导出的结论应是绝对正确的，如果结论与之矛盾，则完全否定原假设. 概率反证法原理(小概率原理) ：如果小概率事件在一次试验中居然发生，则以很大的把握否定原假设.
29
【例6.1】 x 0.4938, n 12, X ~ N( , 0.012 ), 0 0.5
19
而按拒绝域的不同:
假设检验

单侧假设检验
双侧假设检验
拒绝域位于数轴一端, 即V0 =(-∞,a]或[b,+ ∞) 假设形如: H0: ≥0 H1: <0 (完备的) H0: =0 H1: <0 (不完备)
拒绝域位于数轴两端, 即V0 =(-∞,a]∪[b,+ ∞) 假设形如: H0: =0 H1: 0
拒绝域的端点a,b 是临界值，也即分位数
20
四、两类错误的概率
由于“样本值落入拒绝域”和“样本值落入接受域”都是随机事件,如按小概率原理拒绝或不拒绝原假设,则可能犯两种错误:
第一类错误(type 1 error)(“弃真”错误): 原假设 H0 为真，而被拒绝了. 第一类错误由控制，若大，发生第一类错误的可能性就大，需较多的样本作出判断。在实际中,通常将显著性水平作为犯第一类错误的概率. 1- 大小用于描述检验的可靠性。第二类错误(type 2 error) (“取伪”错误):原假设H0 不真，而不被拒绝. 犯第二类错误的概率记为. 一般不易计算。 1-用于描述检验的效能，一般不能小于75%。
22
第1类错误的概率
第2类错误的概率
23
(2) 在实际中，一般希望得到拒绝H0的结论因为这时可以明确知道可能犯第一类错误的概率（已知）。如果得到不拒绝H0的结论，则可能犯第二类错误的概率难以确定。但在用统计软件处理时，H0都是为了计算统计量的方便是事先确定好的，没法人为改变的。
24
11
二、小概率原理小概率事件(概率很小的事件)在一次试验中几乎不会发生。
假设检验的原理：若在原假设H0成立条件下，某事件为小概率事件，但它在一次试验中竟然发生了，若推理过程无差错，便有理由认为原假设H0不真，从而拒绝之。(拒绝的含义指以很大的把握否定原假设) .
12
实例：有两个盒子，各装有100个球.
第二节参数假设检验常用方法
对于总体分布已知的数学期望和方差等参数的假设检验，通常有三种不同的做法：置信区间法临界值法 P值法
本质上这三种方法是一致的。
25
一、置信区间法
置信区间法基本步骤 1、建立统计假设：设立原假设H0和备择假设H1 2、利用区间估计法,求得参数在置信水平1-α 的置信区间。 3、判断原假设H0为真的参数值是否在置信区间之外，是则拒绝原假设H0 ,否则不拒绝原假设H0。 4、作出统计学结论和专业结论。根据是否拒绝H0作出差别是否有统计学意义的结论; 结合研究的实际问题以及统计学结论，作出专业结论。常表达为“可认为…”“有很大把握…”等。
(3) 0.5在99 %的置信区间内，而不在95% 的置信区间内。故当α =0.05，拒绝原假设H0，与0.5差异有统计学意义，而当α =0.01，不拒绝原假设H0，与0.5差异没有统计学意义。
可认为该厂药品在0.05水平上不符合要求.
28
二、临界值法
先查表得到水平临界值，由临界值找出拒绝域，从而判定原假设H0真伪。临界值法基本步骤： 1、建立统计假设：设立原假设H0和备择假设H1 2、假定H0为真，选择统计量(分布已知),并求得样本统计量的值. 3、对给定查表（H0真）,得统计量的临界值，从而得到使 P{S∈V0}= 的拒绝域V0 。 4、若统计量值V0, 则拒绝H0,否则不拒绝H0 5、作出统计学结论和专业结论。根据是否拒绝H0作出差别是否有统计学意义的结论结合研究的实际问题以及统计学结论，作出专业结论。常表达为“可认为„”“有很大把握„”等。
21
实
判断 H0 为真正确概率 1-
际
情
况
H0 为不真
不拒绝H0
第二类错误概率
拒绝 H0
第一类错误概率
正确概率1-
【注意】(1) 两类错误概率的关系两类错误是互相关联的，当样本容量n 固定时，一类错误概率的减少将导致另一类错误概率的增加。一般采取的原则：在控制犯第一类错误的概率的条件下，尽量使犯第二类错误小。要同时降低两类错误的概率、(或者要在不变的条件下降低)，需要增加样本容量n 。
通常的办法是进行抽样检查。如每隔1小时，抽查5罐，得5个容量的值X1,„,X5，根据这些值的均数来判断生产是否正常。发现不正常发现正常
就应停产，找出原因，排除故障，然后再生产？！
就继续按规定时间再抽样，以此监督生产，保证质量？！
8
造成样本均数不正常（即≠355 ）的原因： ① 完全由抽样误差造成； ② 生产因素造成（本质上的差别）。假设检验本质上就是推断样本均数差别是由①造成的概率大小。若由①造成的概率较大（如P>0.05)，则认为差别无统计意义，可认为生产正常。若由①造成的概率很小（如P≤0.05），则认为样本均数差别不是由①，而是由②造成，则认为差别有统计意义，可以认为生产不正常。
二分类多分类
变量值表现
定量（具体数值）
实例
身高（cm）
资料类型
计量资料
(定比和定距)
定性变量
无序
对立的两类属性不相容的多类属性有程度差异的多类属性
疗效(有效、无效) 定类资料血型（A,B,O,AB）文化程度（初中、高中、大学...）定序（等级）资料
有序
多分类
4
大样本的一般含义: 计量资料--通过测定得到的指标。如身高、体重等，一般要求样本容量不小于30；计数资料--通过具有某种属性特征得到的指标。如阳性、有效等，一般要求样本容量不小于50 。
l
L L( x1 , x2 ,... xn ;1 ,..., m ) p( xi ;1 ,..., m )
i 1
1
n
三、区间估计、置信度、置信区间四、常见类型总体均数及总体比率的区间估计
X Z / 2

n
X Z / 2
S n
S x t / 2 ( n 1) n
P值的直观含义：
计算统计量t或U等

●
18
按统计假设的不同:
假设检验

参数假设检验非参数假设检验
总体分布形式已知，对其未知参数的假设作假设检验
对未知总体分布形式的总体假设作假设检验
根据统计量所服从分布的不同,如标准正态分布,卡方分布,t分布,F分布等,相应假设检验又称为u-检验,卡方检验,t-检验,F-检验等.
(1) H0:=0.5，H1:≠0.5进行检验正态总体且方差已知下在置信水平1-α 的置信区间为
(2) 求置信区间（四个步骤）
x u
2
n
27
则当α =0.05，即在置信水平95% 的置信区间为 (0.4881, 0.4995)。而当α =0.01，即在置信水平99 %的置信区间为 (0.4864, 0.5012)。