SPSS数据正态性检验解析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
注意:
事实上,Shapiro-Wilk检验及Kolmogorov-Smirnov检验从实用性的角度,远不如图形工具 进行直观判断好用。在使用这两种检验方法的时候要注意: 当样本量较少的时候,检验结果不够敏感,即使数据分布有一定的偏离也不一定能检验出来; 当样本量较大的时候,检验结果又会太过敏感,只要数据稍微有一点偏离,P值就会<0.05,检 验结果倾向于拒绝原假设,认为数据不服从正态分布。 如果样本量足够多,即使检验结果P<0.05,数据来自的总体也可能是服从正态分布的。
Fra Baidu bibliotek-P图
Q-Q图
解读: P-P图反映了变量的实际累积概率与理论 累积概率的符合程度,Q-Q图反映了变量 的实际分布与理论分布的符合程度,两者 意义相似,都可以用来考察数据资料是否 服从某种分布类型。若数据服从正态分布, 则数据点应与理论直线(即对角线)基本 重合。 本例数据很多不在参考线上,不符合正态 分布,与前W检验结果一致。
因此,在实际的应用中,往往会出现这样的情况,明明直方图显示分布很对称,但正态性检验 的结果P值却<0.05,拒绝原假设认为不服从正态分布。此时建议不要太刻意追求正态性检验的 P值,一定要参考直方图、P-P图等图形工具来帮助判断。很多统计学方法,如T检验、方差分 析 等,与其说要求数据严格服从正态分布,不如说“数据分布不要过于偏态”更为合适。
SAS规定:n≤2000,以ShapiroWilk(W检验)为准;n>2000,以 Kolmogorow-Smirnov(D检验)为 准
如果整个图逆时针转90度,就变成变相的直 方图,也是反映分布形态的,但信息含量远 大于直方图(分布及数值大小)。 以倒数第二行为例,最左边的17是指右边的 小数点后面有17个数字。17是茎, 0001114是17个树叶,最后一行主干宽度 是10,意味上面数字得放大10倍,意思是 有3个180,3个181。 &为零碎叶子的标志。因叶子太小或太大无 法在图中显示,用 &表示。
虽然箱式图一般用于判定数据是否存在异常值,但如果细心, 上方很多离群值,数据像大的方向拖尾,结果与直方图判读 一致。
部分案例参考精鼎数据分析联盟、医咖会,详细文章请参考相关微信公众号
经验法: 一般正态分布的标准差不会大于均值的1/3,这是目测判断法,最终还是要经过检验,但如果标 准差都大于均数,一般不太可能正态分布。
发现异常值!
P75 P50 P2 5
按照SPSS默认选项,如果所有数据都在四分位点 1.5倍盒子长度内,则线的端点为最大值和最小值, 否则线长度就是1.5倍盒子长度(盒子长度等于四分 位间距),在其外的值单独点出(1.5倍用圈圈表示 可疑值,3倍用*表示异常值)
SPSS数据正态性检验解析
例:请对某大学学生的身高资料进行分析,是否符合正态分布
1. 3.
2.
结果部分:
解析: 偏度>0,尾部向右延伸 偏度<0,尾部向左延伸 峰度=0 与正态分布的陡缓程度相同 峰度>0 比正态分布的高峰更加陡峭——尖顶 峰(瘦) 峰度<0 比正态分布的高峰来得平台——平顶 峰(胖)