第四章SPSS基本统计分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
箱式图
150
140
130
120
HIGHT
110
N= 15 15
1
2
SEX
五、列联相关
• (一)列联分析的基本原理
• 自变量发生变化,因变量取值是否 也发生变化。 • 比较边缘百分比和条件百分比的差 别。
• 卡方测量用来考察两变量是否独立(无关)。 其原理是根据这一概率定理:若两变量无 关,则两变量中联合事件发生的概率应等 于各自独立发生的概率乘积
观测量摘要表
Cas e Proc essin g Summ ary Valid N Percent 15 100.0% 15 100.0% Cases Missing N Percent 0 .0% 0 .0% Total N Percent 15 100.0% 15 100.0%
SEX HIGHT 1 2
少儿身高的分组描述统计量
Des cripti ves HIGHT SEX 1 Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 132.9867 130.1391 135.8342 133.1907 132.6000 26.440 5.1420 121.40 140.90 19.50 6.8000 -.466 .434 134.0000 130.4765 137.5235 134.3167 136.7000 40.483 6.3626 120.90 141.40 20.50 8.7000 -.894 -.275 Std. Error 1.3276
2272 3503 4218 3418 3921 2669 3707 2310 2573 3881
提示:可以利用DATA中的TRANSPOSE进行转置取得SPSS数 据文件。
来自百度文库
操作步骤:
打开数据文件“婴儿体重.sav”。打开 Descriptives主对话框,选定变量t进入 Variable栏中。 选中Save standardized values as variables复选框,要求计算变量的z值,并 保存结果到当前数据集中。 单击Options按钮,选中Mean、 Std.Deviation、Minimum、Maximum 、 Variance 项。
Explore 主对话框
Statistics对话框
Explore 栏中Plots对话框
Explore 栏中Options对话框
确定缺失值的处置: •因变量或分组变量中带有 缺失值的观测量都将在分析 过程中被剔除。 •在分析过程中根据分组变 量产生的组中带缺失值的观 测量都将被剔除。
•分组变量的缺失值被单独 分为一组,输出频数时将标 出缺失组。
频数输出的顺序
输出统计量对话框
Chart 对话框
按变量值的升序输出
统计表中变量的各 项分析结果在一张 表并列显示 按各个变量组织输 出,输出结果将按 照每个变量一张表 的形式显示
按频数的升序输出
控制频数表输出范围 类型的最大数目为
Format 对话框
某频次分析结果演示
统计量
统计量 兄弟姐妹的个数 N 有效 缺失 均值 中值 标准差 偏度 偏度的标准误 峰度 峰度的标准误 极小值 极大值 1505 12 3.93 3.00 3.047 1.468 .063 3.507 .126 0 26
Lower Bound Upper Bound
2
.580 1.121 1.6428
Lower Bound Upper Bound
.580 1.121
少儿身高的极端值
Ext reme HIGHT SEX 1 Highest 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 Value s Case Number 14 5 2 4 10 7 3 12 8 15 22 27 18 23 20 24 26 19 28 16 Value 140.90 140.40 137.40 136.00 135.80 121.40 128.20 129.00 129.20 129.30 141.40 140.30 139.70 138.80 138.60 120.90 124.00 125.40 130.10 132.70
婴儿体重的描述统计量
Des cripti ve St atist ics N 婴儿体重 Valid N (listwise) 20 20 Minimum 2272.00 Maximum Mean 4654.00 3233.4500 Std. Deviation 653.2335
这时打开原数据集,可看到多了一列zt,这是t 的z 分数,如下图所示:
M估计量表
M-E stimat ors Huber's Tukey's Hampel's a b d SEX M-Estimator Biweight M-Estimatorc Andrews' Wave HIGHT 1 133.0168 133.1928 133.1157 133.1930 2 135.4183 136.2104 135.1852 136.2327 a. The weighting constant is 1.339. b. The weighting constant is 4.685. c. The weighting constants are 1.700, 3.400, and 8.500 d. The weighting constant is 1.340*pi.
(三)例题:下表为30名10岁少儿的身高(cm)数据, 试对其进行探索分析。
编 号 1 2 3 4 5 身高 男 女
131.5 132.7 137.4 133.0 128.2 139.7 136.0 125.4 140.4 138.6
编 号
6 7 8 9 10
身高 男
135.5 121.4 129.2 135.4 135.8
Descriptive 对话框
如选中此框,将对 Variables框中选择 的变量进行标准化 产生相应的Z分值, 并作为新变量保存 到数据窗口,其变 量名在原变量名前 加z。
选一个或 多个变量 移入
Options 对话框
(三)例题分析
已知20个初生婴儿的体重数据如下表,
对其进行描述统计。
2770 2915 2795 2995 2860 2970 3087 3126 3125 4654
描述性统计分析
(Descriptive Statistics) • • • • • 1. Frequencies 2. Descriptive 3. Explore 4. Crosstabs 5. Ratio 频数分析 描述性统计分析 探索分析(自学) 列联表分析 比率分析(自学)
二、频数分析
Lowest
2
Highest
Lowest
方差一致性检验
Tes t of H omoge neity of Var iance Levene Statistic .815 .402 .402 .753 df1 1 1 1 1 df2 28 28 23.898 28 Sig. .374 .531 .532 .393
5.00
2.00 Stem width: Each leaf:
13 .
14 .
55567
00
10.00 1 case(s)
方形是箱式图的主体, 上下边为四分位数,中 心粗线为中位数,变量 的50%的观测值落在这 一区域中。 方形上下两条纵向直线 是触须线,触须线外的 两端线为本体的最大值 和最小值。本体指除奇 异值外的变量值。 奇异值用“O”标出,本 例中无奇异值。
HIGHT Stem-and-Leaf Plot for SEX= 1
Frequency 1.00 4.00 3.00 Stem & 12 . 12 . 13 . Leaf 1 8999 122
茎叶图
从左到右分为三部分:频 数、茎和叶。 茎是整数部分,叶是小数 部分,Stem width表示茎 宽。每行的茎和叶组成的 数字再乘以茎宽,即得到 实际数据的近似值,实际 数据中与该近似值靠近的 值的个数即为频数表示的 个数。
女
137.5 141.4 138.8 120.9 137.5
编 号
11 12 13 14 15
身高 男
132.2 129.0 132.6 140.9 129.3
女
124.0 140.3 130.1 133.4 136.7
步骤:
打开 Explore主对话框,打开数据文件“Explore分 析.sav”选变量height进入Dependent List栏中,选sex 变量进入Factor List栏中; 在Display栏中选择 Both项;
打开Statistics对话框,选中Descriptives 、Mestimation、 Outliers复选项,单击Continue返回; 打开Plot对话框,选择Boxplots栏中的Factor levels together项,选择Descriptives栏内的 Stem-and-leaf 复选项,选择Spread vs level with levene Test栏中的 Power estimation项,单击 Continue 返回。单击OK
HIGHT
Based on Mean Based on Median Based on Median and with adjusted df Based on trimmed mean
零假设是分组后的方差相等。 表中四行是依据不同的统计量得到的检验,分别 是基于均值、基于中位数与调整后的自由度和基 于调整后的均值。 由于其显著值均大于0.05,不能否定零假设,即 可以认为男生和女生的身高的方差是无差异的。
保存了z 分数的数据集
四、探索分析过程
(一)主要功能
转交叉列联 表分析
调用此过程可检查数据是否有错误、考察样 本分布特征及对样本分布规律作初步考察。剔除 奇异值和错误数据。探索分析过程将提供在分组 和不分组的情况下常用的统计量与图形。
(二)探索分析
按Analyze Descriptive Statistics Explore 顺序单击,打开 Explore 主对话框。
条形图
饼图(圆饼图)
直方图
三、计算基本描述统计量
(一)功能: 对变量进行描述性统计分析,计算均值、 标准差、全距和均值标准误差等,并可将 原始数据转换成Z分数。 (二)调用命令: 按Analyze/Descriptive Statistics/ Descriptives顺序单击,打开主对话框。
• (一)频数的定义 频数就是一个变量在各个变量值上 取值的个案数。 可编制频数分布表和绘制统计图, 把握数据分布的基本特征。 • (二)命令 Analyze/Descriptive statistics/Frequencies
Frequences主对话框
选择一个或多个 变量右移入 Variable(s)框。 显示频数 分布表 统计图 统计量
Pij Pi. P. j
当检验的相伴概率P小于a,拒绝原假设,说明行列变量 存在关联。注意:原假设为行列变量无关。
第四章 基本统计分析
一、基本统计分析功能
基本统计分析功能包括: 1.报告分析(Report)(有兴趣的自学) 2.描述性统计分析(Descriptive Statistics)
报告分析简介:
• 报告分析包括:1.OLAP在线分析处理过程 2.报表 • 根据报表制作的侧重点不同,可以分为3种: (1)个案简明统计报表( Cases Summary) (2)行形式报表(Report Summaries in Rows) (3)列形式报表(Report Summaries in columns)