统计检验原理与正态性检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Sig .200* .012
44
本例中,我们可以做以下结论: 变量NORM在10%的水平下,检验不显 著,不能否定该变量服从正态分布。 变量UNI在5%的水平下,检验是显著的, 应认为该变量不服从正态分布。
45
夏皮罗-威尔克检验
该检验与柯尔莫戈洛夫-斯米诺夫
检验用法大体相同。 当样本容量较大时,系统只给 出柯尔莫戈洛夫-斯米诺夫检验结果。 输出结果举例∶
37
P-值为0.16,只是说明,如果我们做出 “拒绝H0,接受H1” 这种推断,其错误的 概率不超过16%,但是并没说我们做出 “接受H0,拒绝H1” 这种推断错误的概率 不超过16%! 有时在这种情况下,我们也说,可以认 为H0成立,但切记,此推论是苍白无力 的!
38
最有说服力的情形是:P-值非常接近0, 例如,sig=0.001,我们可以作出接受H1 的结论,此结论错误的概率不足0.1%! 由此也可以看出,原假设与对立假设的 地位是不对等的。
在研究“资本结构的影响因素”时,可 提出以下研究假设: 假设1:资本结构与企业绩效显著相关 假设2:资本结构与企业规模显著相关 假设3:资本结构与企业成长性显著相关
14
例2:
研究硕士毕业生在企业工作绩效方面与 本科毕业生是否有显著差异,可提出如 下研究假设: 假设1:硕士毕业生与本科毕业生在工作 绩效方面存在显著差异
25
本例中,样本为: 87,82,80,80,74,82,74,75,86, 88,81,86,92,84,88,77,79,79, 83,85 样本平均值X为82.1,标准差S为4.98 代入前述公式,可计算出t值: t=-1.705
26
这说明,我们做的一次抽样观察中,出 现了t小于-1.33这种情况。与前面的分析 相矛盾,因此前面假定H0成立出现了问 题,因而应拒绝H0,接受H1。
33
如何运用计算机软件进行检验?
所有类型的检验,计算机软件会输出P值。我们完全依靠P-值进行检验。 通常当P-值较接近0时(通常以10%为界 限),我们应拒绝H0,接受H1。否则我 们不能拒绝H0。
34
p-值 在SPSS输出结果通常以“sig.”表 示。 利用SPSS的“sig.”输出结果我们可以 方便地进行各种类型的检验,而不需要 掌握统计量的定义和拒绝域的形式,而 且不需要通过查表确定临界值。统计检 验变得异常简单!
43
柯尔莫戈洛夫-斯米诺夫检验
H0∶总体服从正态分布,H1∶总体不服从正态分布 •输出结果中最为重要的是p-值大小。 p-值越低(例 如小于0.05),表明总体越显著偏离正态分布 显著水平越高(例如大于0.2),表明总体越符合正态 分布输
出结果∶
NORM UNI
Kolmogorov-Svirnov Statistic df .106 48 .146 48
35
例如:某检验,SPSS输出的P-值为0.03, 则我们应拒绝H0,接受H1。 尽管此推断可能出错,但错误的概率不 超过3%。
36
例如:某检验,SPSS输出的P-值为0.16, 则我们不应拒绝H0 注意:有些统计学家主张,这种情况下, 不要说“接受H0”,原因是如果说“接受 H0”,会使人们误以为推断H0成立的错误 概率很低,但实际上此概率有多大不详, 而且通常比人们想象的要大得多! 因为此时面临的是第二类错误。
Shrpiro-Wilk Statistic df .963 48 .899 48 Sig .132 .001
46
NORM UNI
正态Q-Q图法
(通常称为概率纸检验法)
该方法是一种粗略的正态性检验法 如果图中散点大体处于一条直线上 则可判定该组数据服从正态分布 否则可判定不服从正态分布
47
例∶正态分布的正态Q-Q图
Observed Value
48
例∶均匀分布的正态Q-Q图
该图是服从均匀分布 变量值的“正态Q-Q 图”。 图中散点构成一条曲 线,表明上述变量不 服从正态分布。 变量UNI是利用函数 uniform( )由软件自 动生成均匀分布随机 数。
Expected Normal
Normal Q-Q Plot of UNI
(8) 假设检验: 假设是否被验 证? 研究问题是否 得到解答?
是 (9) 撰写报告 (10) 提交报告 (11) 作出管理 决策
12
会计研究中的假设举例
此处所说的“研究”不限于学术研究或 理论研究,也适用于解决会计实务界出 现的问题。 注意: 研究假设与统计假设不是一回事!
13
例1
如果H0成立,t值不应该太低。
H1成立时 H0成立时
t
22
上面的分析可得下面结论: 如果我们假定H0成立,在这种情况下, t值不应太低
23
进一步,我们可知,如果原假设成立,t小于 -1.33的概率仅为10%。 当原假设成立时t统计量分布
0.10
-1.33
0
t
24
如果我们将发生的可能性只有10%的事 件视为“小概率”事件——在一次观察 中不会遇到,那么我们在一次抽样观察 中,不会遇到t小于-1.33这种情况。
一个称为零假设或原假设(The Null Hypothesis), 记为H0 另一个称为对立假设、备择假设(The Alternative Hypothesis),记为H1
2.从总体中抽取少数个体(一组样本) 3.根据样本判断接受H0还是接受H1(此说法有 些不严格,后面进一步解释!)
6
所提出的一对假设,何者为零假设?
41
如果我们希望作出接受原假设的结论, 则显著 水平α越低效果越差。因为此结论如果是错误 结论,则属于第二类错误,其错误概率为β (我们不知道它有多大!),而β与α的关系是 此消彼长的。
42
4.分布正态性检验
柯尔莫戈洛夫-斯米诺夫检验 源自文库皮罗-威尔克检验 正态Q-Q图法 直方图 偏度与峰度
出于数学上的需要,原假设总是包含等号 “=” ,例如:
H0: 3
H1: < 3
H0: < 3
H1: 3
又如:
H0:总体服从正态分布 H1:总体不服从正态分布 H0:总体不服从正态分布 H1:总体服从正态分布
7
假设检验的两类错误
1. 第一类错误
否真错误(针对原假设)——本来原假设是正 确的,却被拒绝。 出现第一类错误的概率记为
20
考虑以下指标(统计量):
X 84 t S / 20
其中:X 为样本均值 S为样本标准差 思考:该指标有何特点? H0成立与H1成立时,一般t值有何不同?
21
X 84 t S / 20
该指标的特点:
当H0成立时,一般t值为正,且较大; 当H1成立时,一般t值为负,且绝对值较大;
39
检验结论的表述方法
如果sig=0.063,下面的说法都是恰当的: 在10%的水平下,检验是显著的。 在5%的水平下,检验是不显著的。 在1%的水平下,检验是不显著的。
40
几点应牢记的重要结论
必须弄清原假设与对立假设的内容 检验结果为“显著”是指原假设显著不成立。 结论的说服力强弱主要取决于显著水平高低 当作出拒绝零假设 (即接受对立假设)结论时, 显著水平α越低效果越好,因为它表明该结论 为错误结论的概率不超过α。
28
我们作出了“拒绝H0,接受H1”的结论。 尽管此推断不能保证100%正确,但其出 错的可能不超过10%。 前面所说的10%就是所谓的“显著水 平”。
29
思考:
如果有人说,发生的可能性为10%的事 件不能视为“小概率”事件,只有此概 率低于5%时,才能视为小概率事件。 本例的结论会不会发生变化?
50
打开Explore:Plots对话框
Boxplots----箱图输出方式 选中 Normality plots with tests即可得到 正态概率图及进行分布正态性检验
51
偏度与峰度主要用于作出否定正态分布 结论 当其中一个或两个指标的绝对值明显偏 离零,例如绝对值大于1时,通常预示着 变量偏离正态。
杨忠海
1
统计检验原理 与 分布正态性检验
2
第一节 假设检验概述
3
一、假设检验的基本原理
4
1.什么是统计学中的假设?
假设是对总体的某种推断
例:
上市公司2005年平均利润率≥10%
上市公司2005年资产负债率服从正态分布
5
什么是假设检验?
假设检验——利用样本推断总体 1.提出一对假设,
9
两类此错误( 与 ) 的逆向关系
不能同时降低两类错误!
10
假设检验在科学研究方法中的 关键作用
11
(1) 观察:确认宽泛 的研究范围
(3) 问题界定: 描述研究
(4) 理论框架: 对变量进行清 楚的辨识与归类
(5) 提出假设
(6) 研究设计
(7) 资料的收集、 分析与解释
(2) 初步资料搜集: 访谈、文献查阅 否
17
3.统计检验概述
统计检验的基本原理
18
还记得中学学过的“反证法” 吗?
我们不知到“命题A”是否正确,我们先 假定它正确,如果由此产生矛盾,那么 我们就认为“当初假定命题A正确”是不 对的,因而应判定命题A是不成立的。
19
例:假设检验原理与p-值
为研究某高校“英语统考成绩”,随机抽取20名 同学,其考试成绩如下: 87,82,80,80,74,82,74,75,86,88, 81,86,92,84,88,77,79,79,83,85 已知英语统考成绩服从正态分布,我们关心 该校英语统考成绩是否达到84分的优秀标准。 提出如下假设: H0: μ≥84 该校平均成绩不低于84分 H1: μ<84 该校平均成绩低于84分
该图是服从正态分布 变量值的“正态Q-Q 图”。 图中散点基本处于一 条直线上,表明上述 变量服从正态分布。 变量NORM是利用函 数normal( )由软件 自动生成的正态分布 随机数。
Expected Normal
Normal Q-Q Plot of NORM
3
2
1
0
-1
-2
-3 140 150 160 170 180 190 200
30
如果按照上面的思路,我们必须从头重 新做一遍分析。 如果我们得到下一张幻灯片的信息,那 么我们就可以直接作出回答。
31
当原假设成立时t统计量分布
p-值
0.052
-1.705
样本统计量的t值
0
t
32
p-值 提供了更详细的信息 本例中, p-值为0.052,表明:如果显著 水平取0.10检验结果为显著,如果显著 水平取0.05则检验结果为不显著。当然, 如果显著水平取1%,检验更不显著。
3
2
1
0
-1
-2
-3 -10 0 10 20
Observed Value
49
(三) 基本操作方法
单击Analyze菜单 选择Summarize 中的Explore项 对Explore对话框进行设置
选择待分析变量,进入Dependent 框中 如果需要将数据按“性别”或“地区”等进行分类 后进行分析,则需要将分类变量选入 Factor 框中
等于显著性水平 Level of Significance
2. 第二类错误
存伪错误(针对原假设)——本来原假设是错 误的,却被接受。 出现第二类错误的概率为 8
统计推断结果的四种情形
实际情况如何,我们实 际是不知道的!
实际情况 决策 不拒绝 H0 拒绝 H0 H0 为真 H0为假 正确 第一类 错误 () 第二类 错误 () 正确
此类研究通常需要通过问卷方式测量“绩效”
15
例3:
在研究股权激励对绩效的影响时,提出 以下研究假设: 假设1:高管持股越多,工作绩效越高。 假设2:………… 假设3:…………
16
例4:
研究现金股利偏好的影响因素时,提出 以下研究假设: 假设1:股权集中度越高,公司越倾向发 放现金股利。 假设2:获利能力越强,公司越倾向发放 现金股利。 假设3:…………
27
简要总结:
我们先假定原假设H0成立,在这种情况 下,t值低于 -1.33的可能性只有10%。 如果我们认为发生的可能性只有10%的 事件在一次观察中是不会遇到的,那么 H0成立时,是不会遇到t值低于 -1.33的情 况。而本例恰恰遇到的这种情况,因此 应否定H0,接受H1。(这种情况称为检验 的结果是“显著”的——原假设显著不 成立。)