第四章SPSS基本统计分析

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

婴儿体重的描述统计量
Des cripti ve St atist ics N 婴儿体重 Valid N (listwise) 20 20 Minimum 2272.00 Maximum Mean 4654.00 3233.4500 Std. Deviation 653.2335
这时打开原数据集，可看到多了一列zt，这是t 的z 分数，如下图所示：
Explore 主对话框
Statistics对话框
Explore 栏中Plots对话框
Explore 栏中Options对话框
确定缺失值的处置： •因变量或分组变量中带有缺失值的观测量都将在分析过程中被剔除。 •在分析过程中根据分组变量产生的组中带缺失值的观测量都将被剔除。
•分组变量的缺失值被单独分为一组，输出频数时将标出缺失Huber's Tukey's Hampel's a b d SEX M-Estimator Biweight M-Estimatorc Andrews' Wave HIGHT 1 133.0168 133.1928 133.1157 133.1930 2 135.4183 136.2104 135.1852 136.2327 a. The weighting constant is 1.339. b. The weighting constant is 4.685. c. The weighting constants are 1.700, 3.400, and 8.500 d. The weighting constant is 1.340*pi.
打开Statistics对话框，选中Descriptives 、Mestimation、 Outliers复选项，单击Continue返回；打开Plot对话框，选择Boxplots栏中的Factor levels together项，选择Descriptives栏内的 Stem-and-leaf 复选项，选择Spread vs level with levene Test栏中的 Power estimation项，单击 Continue 返回。单击OK
5.00
2.00 Stem width: Each leaf:
13 .
14 .
55567
00
10.00 1 case(s)
方形是箱式图的主体，上下边为四分位数，中心粗线为中位数，变量的50%的观测值落在这一区域中。方形上下两条纵向直线是触须线，触须线外的两端线为本体的最大值和最小值。本体指除奇异值外的变量值。奇异值用“O”标出，本例中无奇异值。
观测量摘要表
Cas e Proc essin g Summ ary Valid N Percent 15 100.0% 15 100.0% Cases Missing N Percent 0 .0% 0 .0% Total N Percent 15 100.0% 15 100.0%
SEX HIGHT 1 2
频数输出的顺序
输出统计量对话框
Chart 对话框
按变量值的升序输出
统计表中变量的各项分析结果在一张表并列显示按各个变量组织输出，输出结果将按照每个变量一张表的形式显示
按频数的升序输出
控制频数表输出范围类型的最大数目为
Format 对话框
某频次分析结果演示
统计量
统计量兄弟姐妹的个数 N 有效缺失均值中值标准差偏度偏度的标准误峰度峰度的标准误极小值极大值 1505 12 3.93 3.00 3.047 1.468 .063 3.507 .126 0 26
2272 3503 4218 3418 3921 2669 3707 2310 2573 3881
提示：可以利用DATA中的TRANSPOSE进行转置取得SPSS数据文件。
操作步骤：
打开数据文件“婴儿体重.sav”。打开 Descriptives主对话框，选定变量t进入 Variable栏中。选中Save standardized values as variables复选框，要求计算变量的z值，并保存结果到当前数据集中。单击Options按钮，选中Mean、 Std.Deviation、Minimum、Maximum 、 Variance 项。
Descriptive 对话框
如选中此框，将对 Variables框中选择的变量进行标准化产生相应的Z分值，并作为新变量保存到数据窗口，其变量名在原变量名前加z。
选一个或多个变量移入
Options 对话框
(三)例题分析
已知20个初生婴儿的体重数据如下表，
对其进行描述统计。
2770 2915 2795 2995 2860 2970 3087 3126 3125 4654
HIGHT Stem-and-Leaf Plot for SEX= 1
Frequency 1.00 4.00 3.00 Stem & 12 . 12 . 13 . Leaf 1 8999 122
茎叶图
从左到右分为三部分：频数、茎和叶。茎是整数部分，叶是小数部分，Stem width表示茎宽。每行的茎和叶组成的数字再乘以茎宽，即得到实际数据的近似值，实际数据中与该近似值靠近的值的个数即为频数表示的个数。
箱式图
150
140
130
120
HIGHT
110
N= 15 15
1
2
SEX
五、列联相关
• （一）列联分析的基本原理
• 自变量发生变化，因变量取值是否也发生变化。 • 比较边缘百分比和条件百分比的差别。
• 卡方测量用来考察两变量是否独立(无关)。其原理是根据这一概率定理：若两变量无关，则两变量中联合事件发生的概率应等于各自独立发生的概率乘积
HIGHT
Based on Mean Based on Median Based on Median and with adjusted df Based on trimmed mean
零假设是分组后的方差相等。表中四行是依据不同的统计量得到的检验，分别是基于均值、基于中位数与调整后的自由度和基于调整后的均值。由于其显著值均大于0.05，不能否定零假设，即可以认为男生和女生的身高的方差是无差异的。
保存了z 分数的数据集
四、探索分析过程
（一）主要功能
转交叉列联表分析
调用此过程可检查数据是否有错误、考察样本分布特征及对样本分布规律作初步考察。剔除奇异值和错误数据。探索分析过程将提供在分组和不分组的情况下常用的统计量与图形。
（二）探索分析
按Analyze Descriptive Statistics Explore 顺序单击，打开 Explore 主对话框。
(三)例题：下表为30名10岁少儿的身高（cm）数据，试对其进行探索分析。
编号 1 2 3 4 5 身高男女
131.5 132.7 137.4 133.0 128.2 139.7 136.0 125.4 140.4 138.6
编号
6 7 8 9 10
身高男
135.5 121.4 129.2 135.4 135.8
Lower Bound Upper Bound
2
.580 1.121 1.6428
Lower Bound Upper Bound
.580 1.121
少儿身高的极端值
Ext reme HIGHT SEX 1 Highest 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 Value s Case Number 14 5 2 4 10 7 3 12 8 15 22 27 18 23 20 24 26 19 28 16 Value 140.90 140.40 137.40 136.00 135.80 121.40 128.20 129.00 129.20 129.30 141.40 140.30 139.70 138.80 138.60 120.90 124.00 125.40 130.10 132.70
Lowest
2
Highest
Lowest
方差一致性检验
Tes t of H omoge neity of Var iance Levene Statistic .815 .402 .402 .753 df1 1 1 1 1 df2 28 28 23.898 28 Sig. .374 .531 .532 .393
• （一）频数的定义频数就是一个变量在各个变量值上取值的个案数。可编制频数分布表和绘制统计图，把握数据分布的基本特征。 • （二）命令 Analyze/Descriptive statistics/Frequencies
Frequences主对话框
选择一个或多个变量右移入 Variable（s）框。显示频数分布表统计图统计量
女
137.5 141.4 138.8 120.9 137.5
编号
11 12 13 14 15
身高男
132.2 129.0 132.6 140.9 129.3
女
124.0 140.3 130.1 133.4 136.7
步骤：
打开 Explore主对话框，打开数据文件“Explore分析.sav”选变量height进入Dependent List栏中，选sex 变量进入Factor List栏中；在Display栏中选择 Both项；
条形图
饼图(圆饼图)
直方图
三、计算基本描述统计量
（一）功能：对变量进行描述性统计分析，计算均值、标准差、全距和均值标准误差等，并可将原始数据转换成Z分数。（二）调用命令：按Analyze/Descriptive Statistics/ Descriptives顺序单击，打开主对话框。
描述性统计分析
（Descriptive Statistics） • • • • • 1. Frequencies 2. Descriptive 3. Explore 4. Crosstabs 5. Ratio 频数分析描述性统计分析探索分析（自学）列联表分析比率分析（自学）
二、频数分析
Pij Pi. P. j
当检验的相伴概率P小于a，拒绝原假设，说明行列变量存在关联。注意：原假设为行列变量无关。
少儿身高的分组描述统计量
Des cripti ves HIGHT SEX 1 Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 132.9867 130.1391 135.8342 133.1907 132.6000 26.440 5.1420 121.40 140.90 19.50 6.8000 -.466 .434 134.0000 130.4765 137.5235 134.3167 136.7000 40.483 6.3626 120.90 141.40 20.50 8.7000 -.894 -.275 Std. Error 1.3276
第四章基本统计分析
一、基本统计分析功能
基本统计分析功能包括： 1.报告分析（Report）（有兴趣的自学） 2.描述性统计分析（Descriptive Statistics）
报告分析简介：
• 报告分析包括：1.OLAP在线分析处理过程 2.报表 • 根据报表制作的侧重点不同，可以分为3种：（1）个案简明统计报表（ Cases Summary）（2）行形式报表（Report Summaries in Rows）（3）列形式报表（Report Summaries in columns）