第五章 假设检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章假设检验
本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2.熟练掌握总体均值与总体成数指标的各种检验方法;包括:z检验、t检验和p-值检验;4.掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验;5.能利用Excel进行假设检验。
第一节假设检验概述
一、假设检验的基本概念
假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。本章分别讨论这两类检验方法。
进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理”,对假设的正确性做出判断。这种思维方法与数学里的“反证法”很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。其实,我们在日常生活中,不仅不肯接受概率为0的事件,而且对小概率事件,也持否定态度。比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。
所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。这种事件称为“实际不可能事件”。
小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平α(0<α<1)作为小概率的界限,α的取值与实际问题的性质有关。所以,统计检验又称显著性检验。
下面通过一个具体例子说明假设检验是怎样进行的。
【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?
上述例子中,消费者协会实际要进行的是一项统计检验工作,检验总体平均容量是否等于包装上注明的250毫升。即,检验总体平均μ=250是否成立。这就是一个原假设(null H表示,即:
hypothesis),通常用0
H:μ=250
H,备选假设是在原假设被否定时与原假设对立的是备选假设(alternative hypothesis)1
另一种可能成立的结论。备选假设比原假设还重要,这要由实际问题来确定,一般把期望出
现的结论作为备选假设。上例中可能的备选假设有三种:
第一种:如果消费者协会希望知道的是,该品牌饮料的平均容量是否为标明的250毫升,
H:μ≠250
则1
第二种:如果消费协会希望知道该品牌饮料的平均容量是否少于标明的250毫升,则
H:μ<250
1
第三种:如果消费者协会希望知道该品牌饮料的平均容量是否大于标明的250毫升,则
H:μ>250
1
由于备选假设不同,可将假设检验分为双侧(边、尾)检验(two tailed test),和单侧(边、尾)检验(one tailed test)。对此,我们在后面将进一步说明。
原假设与备选假设确定之后,我们要构造一个统计量来决定是“接受原假设,拒绝备选假设”,还是“拒绝原假设,接受备选假设”。对不同的问题,要选择不同的检验统计量。检验统计量确定后,就要利用该统计的分布以及由实际问题中所确定的显著性水平,来进一步确定检验统计量拒绝原假设的取值范围,即拒绝域。在给定的显著性水平α下,检验统计量的可能取值范围被分成两部分:小概率区域与大概率区域。小概率区域就是概率不超过显著性水平α的区域,是原假设的拒绝区域;大概率区域是概率为1-α的区域,是原假设的接受区域。如果样本统计量落入拒绝域,我们就拒绝原假设,接受备选假设,认为样本数据支持备选假设的结论;如果样本统计量落入接受区域,我们就接受原假设,认为没有充分证据证明备选假设结论为真。请注意,我们这里使用的判断语气比较委婉,原因是:拒绝域是小概率区域,按小概率原理应该拒绝原假设,但是,小概率事件不是完全不可能事件,还是有可能发生的;接受区域是大概率区域,大概率事件也不是必然事件。无论是接受原假设还是拒绝原假设,都有产生判断失误的可能。因此,不宜将统计检验的结论过于绝对化。
二、两种类型的错误
统计假设检验是通过比较检验统计量的样本数值,作出决策。统计量是随机变量,据之所作的判断不可能保证百分之百的正确。一般来说,决策结果存在以下四种情形:原假设是真实的,判断结论是接受原假设,这是一种正确的判断;
原假设是不真实的,判断结论是拒绝原假设,这也是种正确的判断;
原假设是真实的,判断结论是拒绝原假设,这是一种产生“弃真错误”的判断;
原假设是不真实的,判断结论是接受原假设,这又是一种产生“取伪错误”的判断。
以上四种判断可归纳为下列表格形式:
以上的弃真错误也称作假设检验的“第一类错误”;取伪错误也称作假设检验的“第二类错误”。无论是第一类错误还是第二类错误,都是检验结论失真的表现,都是应尽可能地加以避免的情形,如果不能完全避免,也应该对其发生的概率加以控制。
第一类错误产生的原因是:在原假设为真的情况下,检验统计量不巧刚好落入小概率的拒绝区域。因此,犯第一类错误的概率大小就等于显著性水平的大小,即等于α。我们可以通过控制显著性水平大小的方式,来控制犯第一类错误的可能性大小。α定的越小,犯第一类错误的可能性就越小,例如α=0.05,表示犯第一类错误的可能性为5%,100次判断中,产生弃真性错误的次数是5次;进一步降低显著性水平,取α=0.01,这时犯第一类错误的