第七章 假设检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章假设检验
第一节检验原理
一.提出原假设(Null Hypothesis)和备择假设(Alternative Hypothesis);
所谓假设,是指需要进行验证的统计结论。
原假设是作为统计分析前提的假设,备择假设是在原假设不成立的情况下所接受的假设。
二.确定适当的检验统计量T;
检验统计量T是用于检验原假设是否成立的标准,在原假设成立的前提下,统计量T 满足某种特征,
三.规定显著性水平a(犯弃真错误的概率);
显著性水平是设定一个弃真错误的概率,理论上说,没有一个检验是百分之百正确的,必然有一定的概率犯错误。
检验的错误分为两种类型,一是弃真错误,二是取伪错误。
所谓弃真错误,是指原假设为真,但检验的结果拒绝了原假设;
取伪错误,是指原假设为假,但检验的结果接受了原假设。
当在原假设条件下,T值出现的概率小于a时,拒绝原假设。
一个小概率事件出现,因此拒绝原假设。
a值越大,表明犯弃真错误的概率越大,越容易拒绝原假设,此时称检验越严格。
如果减小拒绝域,就意味着扩大接受域,从而扩大了犯取伪错误的概率。弃真和取伪是一对矛盾体,只有通过改进检验方法,例如扩大样本量,或者使用更好的统计量,才可以使二者同时缩小。
a值需要由检验目的来确定,当取伪造成的损失大于弃真造成的损失时,应扩大a值。
四.计算检验统计量T的值;
根据检验中获得的数据,计算统计量T的值。
五.作出统计决策。
根据T的取值特征,计算取该值的概率,如果此概率小于a,则拒绝原假设。
例子:
某裁判观察到球员A有类似于上肢触球的表现,现需决定是否判其为手球。
1.确定原假设:球员A没有上肢触球
2.确定统计量T:球在接触球员A的身体后反弹的角度
3.确定显著性水平:a=0.05
4.计算T值:根据裁判的观察确定球的反弹角度为X
5.统计判断:当一名球员使用上肢之外的身体部分触球时,球的反弹角度为X的概率为0.03。由于0.03<0.05,拒绝原假设,即认为球员A存在上肢触球。
在本例中,有3%的可能性发生弃真错误,即球员A没有上肢触球,但裁判作出了错误判断。
第二节利用正态分布的假设检验案例
利用正态分布的特征进行假设检验是比较常用的方法,有许多统计量符合正态分布,因此可以利用正态分布进行分析。
例题:
某厂产品使用寿命符合正态分布,其中m0=1020,s=100,从最近生产的产品中抽选16件,测得m1=1080,试在a=0.05的水平下,检验产品质量是否有显著提高。
本例使用正态分布的前提条件,H0:m1=m0=1020
计算统计量z
因此,拒绝原假设。
统计软件中提供的P-level 为统计量处于T值范围之外的概率,当此概率小于a值时,拒绝原假设。
在本例中,P(Z>2.4)=0.0082<0.05
因此拒绝原假设。
在统计软件中,对于左侧、右侧和双侧检验需进行区分。
第三节非参数统计
非参数统计方法不涉及描述总体分布的有关参数,例如正态分布的方差、期望等内容,因此称为与分布无关的(Distribution Free)。
在推断过程中,仍需利用样本的其他分布信息,尤其是关于秩(rank)的信息。
将数据从小到大进行排列,每一个具体数据项所处的位置或次序,称为该数据的秩。
一.卡方检验(Chi-Square Goodness-of-Fit Test)
卡方检验一直有极其广大的应用领域,所有这些应用有一个共同点,即拥有足够大的样本使得在零假设下通过多元的正态中心极限定理来保证检验统计量有渐近的Chi-Square 分布
一个重要的Chi-Square 检验类型为Pearson拟合优度统计量
在r个不重叠的类中,所观察到的计数O与在零假设下的期望值E之间的差距。在零假设成立时,Q满足(r-1)个自由度的分布。
例题:
已知某型生态群落中A、B、C、D四类植物的比重分别为80%,12%,7%和1%。现观察某地共500株植物,发现四类植物的数量分别为380、69、43和8株。
试在5%的显著性水平下,判断该地生态群落是否为某型。
植物O E O-E (O-E)^2 (O-E)^2/E
A 380 400 -20 400 1.00
B 69 60 9 81 1.35
C 43 35 8 64 1.83
D 8 5 3 9 1.80
合计500 500 --5.98
查表得(4-1)=3个自由度,a=0.05的分布值为7.82,所以不能拒绝原假设。
二.列联表分析
列联表是调查数据处理中最常见的形式。列联表分析的目的在于研究两个变量之间是否存在相互影响的关系。可以认为是一种定类尺度的相关分析。
例题:
下例为三种不同类型电风扇在三个不同地带销售的数量情况。欲了解电风扇类型与地带之间是否存在相关关系。
热带温带寒带合计
台式14 30 4 48
落地式67 105 60 232
台地式30 13 14 57
合计111 148 78 337
假定销售地区与销售产品类型之间没有相关关系,则同为台式电风扇,在热带、温带、寒带的销售数量比例应当等同于这三个地带购买电风扇数量的比例。
即:台式-热带=48111/337
同样可求出其余各单元格的期望数值
利用观察值与期望值之间的差异,可进行检验。
热带温带寒带合计
台式14/15.81 30/21.08 4/13.19 48
落地式67/76.42 105/101.88 60/3.70 232
台地式30/18.77 13/25.04 14/11.11 57
合计111 148 78 337
Q值满足自由度为(R-1)(C-1)的分布
查表得4个自由度,a=0.05的值为9.49,拒绝原假设。
三.符号检验
对于一个只存在+、-两种符号的序列,考察两种符号的出现是否具有倾向性。
建立原假设H0:P+=P-
计算两种符号的数量S+和S-,利用二项分布计算S+或S-出现的概率是否处于接受域。
在n>20的情况下,二项分布可以用正态分布进行近似
四.游程检验
游程检验又称连贯检验或串检验,用于考察一个序列中两种符号的出现次序是否随机。
一种符号连续出现的段称为一个游程。序列AABBAB共有四个游程,即AA、BB、A、B。
在符号随机出现的情况下,游程数应当适中。符号出现非随机的情况包括:
游程数过少:序列有成群的倾向
游程数过多:序列有混合的倾向
例题:
观察一个系列,分析30个脸谱的出现是否有规律AAAABBBBBBBBBBBBBBBBAAABBBBBBB。
H0:脸谱的出现是随机的