第4章 SPSS基本统计分析

合集下载

SPSS第四章基本统计分析

SPSS第四章基本统计分析

中 0 500 0
高 0 0 600
一致
1 - 29
青 中 老
低 0 0 400
中 0 600 0
高 500 0 0
应用举例
受教育程度越高通信支出越高吗? 受教育程度越高通信支出比例越高吗?
1 - 30
多选项分析
什么是多选项问题?
(1)即:在回答某些问题时,答案在两个以上 例如:请问您平时主要的休闲娱乐方式是: a.看电视、听广播 b.玩游戏 c.体育运动 d.逛街购物e.经常去港澳游玩 f.看书学习 g.喝酒聊天 h.工作太忙,没时间休闲娱乐 又如:您经常浏览的网站?在下列品牌中您信任哪些 品牌? (2)多选项问题不能直接处理。因为SPSS中的一个变 量对每一个答案只能取一个值。
2 2
2
C
2
1 - 27
分析列联表中变量间的关系
Ordinal(定序变量)



反映定序变量一致性指标 行变量等级越高,列变量等级也越高或越低 ——一致性高 行变量等级越高,列变量等级不定——不一 致 指标绝对值越大越相关,越接近0越无关
1 - 28
定序变量一致性检验
年龄与工资收入交叉列联表 低 青 400 一致 中 0 老 0
n 3
3
计算描述统计量
描述陡峭程度的统计量

峰度(kurtosis):描述某变量所有变量值 分布形态陡缓程度的统计量。
峭度为0表示与正态分布峭度相同。 大于0表示比正态分布陡,尖峰。 小于0表示比正态分布缓;平峰。
Kurtosis
1 - 12
1 n -1
i 1 ( xi x) / SD 3
n 4 4
计算描述统计量

第4章-SPSS基本统计分析

第4章-SPSS基本统计分析

2016/12/25
21
基本描述统计量
描述离散程度的统计量
离散程度:指一组数据远离“中心值”的程度。 即考查所有数据相对于“中心值”分布的疏密程度。 如果数据都紧密地集中在“中心值”的周围,数 据的离散程度较小,则说明“中心值”对数据的 代表性就好; 如果数据比较松散地分布在“中心值”的周围, 数据的离散程度较大,则 “中心值”说明数据特 征是不具有代表性的。
案例

利用“大学生职业生涯规划数据”进行 以下分析:
1. 计算专业和职业认知得分的基本描述统计
量,并比较男女生的得分差异; 2. 分析是否存在专业和职业认知得分的异常 值。

应用举例
基本描述统计
以“居民储蓄调查数据”为例,对一次存(取)款金 额。有两个分析目标: 目标一:计算存(取)款金额的基本描述统计量,并对 城镇储户和农村储户进行比较 (数据拆分)
SK 0
左(负)偏态
x
M M
152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 e 169o170 171 172 173 174 175
基本描述统计量

描述陡峭程度的统计量
– 峰度(kurtosis): 描述某变量取值分布形态陡缓程

合 计
频数分析表

频数分析的任务: 编制频数分布表
用宽度相同的条形的高度或长短来表示频数分布变化的图 如果有缺省值,那 – 各组的名称 形。使用于定序和定类变量的分析 么有效百分比能更 – 频数(Frequency) 加准确地反映取值 用圆形及圆内扇形的面积来表示频数百分比变化的图形。 – 百分比(Percent) 分布状况

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

WORD 格式整理《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第 4 章 SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。

分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。

Statistics户口所在职业年龄地Valid282282282NMissing000户口所在地Frequency Percent Valid CumulativePercent Percent中心城市20070.970.970.9 Valid 边远郊区8229.129.1100.0Total282100.0100.0职业Frequency Percent Valid CumulativePercent Percent 国家机关248.58.58.5商业服务业5419.119.127.7文教卫生18 6.4 6.434.0公交建筑业15 5.3 5.339.4Valid 经营性公司18 6.4 6.445.7学校15 5.3 5.351.1一般农户3512.412.463.5种粮棉专业4 1.4 1.464.9户WORD 格式整理种果菜专业10 3.5 3.568.4户工商运专业3412.112.180.5户退役人员17 6.0 6.086.5金融机构3512.412.498.9现役军人3 1.1 1.1100.0Total282100.0100.0年龄Frequency Percent Valid CumulativePercent Percent20 岁以下4 1.4 1.4 1.420~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.550 岁以上4114.514.5100.0Total282100.0100.0分析:本次调查的有效样本为282 份。

spss第四章描述统计简介PPT课件

spss第四章描述统计简介PPT课件
定义:设,对样本数据集合中的所有数据的排序结果为X1≤X2≤…≤Xn,n为样本容 量,则上述排序的序列中,处于“正中间位置”上的数据,称为样本中位数。
当n 为奇数时:正中间位置号码=(n+1)/2 样本中位数=X(n+1)/2
当n为偶数时:正中间位置号码=(n+1)/2是小数,处于n/2与(n/2)+1之间。 样本中位数=(Xn/2+X(n/2)+1)/2 如5位同学的学习成绩:3,3,3,4,5。中间位置是第三位,中位数:3。 如果六位同学: 3,3,4,5,5,5。中间位置是3与4位中间的位置,中位数为: (4+5)/2=4.5
第四章 描述统计量简介
2024/10/23
第三章 样本数据特征的初步分析
1
调查杭州市居民收入情况,得到
调查顾客对产品的满意第度情四况章, 获得100个样本数据,能分
样本100统个计样本量数描据,述根据这些数据,
析出哪些信息?
你最想得到哪些信息?
调查大学生群体中对手机品牌的偏 好程度,你如何描述调查结果?
• 选择Percentile Values 栏中的 选项,输出所选变量的百分值
• Dispersion(离差)栏,用于
指定输出反映变量离散程度的 统计量
• Central Tendency (集中趋势)
栏,用于指定输出反映变量集 中趋势的统计量
• Distribution (分布特征)栏,
用于指定输出描述分布形状和
如果样本容量为n,那么,某个样本值出现 的频率=该样本值出现的频次/n
2024/10/23
第三章 样本数据特征的初步分析
9
分类数据或顺序数据描述频次与 频率的图形方法

统计分析与SPSS的应用(第五版)课后练习答案(第4章)

统计分析与SPSS的应用(第五版)课后练习答案(第4章)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第4章SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。

分析一一描述统计一一频率,选择“常住地” ,“职业”和“年龄”到变量中,然后,图表一一条形图一一图表值(频率)一一继续,勾选显示频率表格,点击确定。

种果菜专业户工商运专业户退役人员金融机构现役军人Total103417353282年龄|Freque ncy Perce nt ValidPerce ntCumulativePerce nt 20岁以下420~35 岁146Valid 35~50 岁9150岁以上41Total282■■-■I T d ItlSi祷分析:本次调查的有效样本为282份。

常住地的分布状况是:在中心城市的人最多,有200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50岁的人最多。

由于变量中无缺失数据,因此频数分布表中的百分比相同。

2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。

进一步,对不同常住地储户存款金额的基本特征进行对比分析。

分析一一描述统计一一描述,选择存款金额到变量中。

点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续一一确定。

分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是,标准差为,峰度系数为,偏度系数为。

与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

分析:由表中可以看出,中心城市有200人,边远郊区为82人。

两部分样本存取款金额均呈右偏尖峰分布,且边远郊区更明显。

第4章 SPSS基本统计分析(课后练习参考)

第4章 SPSS基本统计分析(课后练习参考)

第4章 SPSS基本统计分析(课后练习参考)1、利用习题二第6题数据,采用SPSS数据筛选功能将数据分成两份文件。

其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。

第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。

第二份文件:选取数据数据——选择个案——随机个案样本——输入70。

2、利用习题二第6题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。

排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。

3、利用习题二第4题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。

计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。

4、利用习题二第4题的完整数据,计算每个学生课程的平均分以及标准差。

同时,计算男生和女生各科成绩的平均分。

方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。

分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。

先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。

方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。

数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定5、利用习题二第6题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。

根据存款金额排序,观察其最大值与最小值,算出组数和组距。

spss4-2(基本统计分析)

spss4-2(基本统计分析)

频数分析表
Central tendency: 用于定义描述 集中趋势的一组指标: 均数(Mean)、中位数(Median)、 众数(Mode)、总和(Sum)。
频数分析表
Dispersion:定义描述 离散趋势的一组指标: Std.deviation:标准差 Variance:方差 Range :全距 Minimum:最小值 Maximum:最大值 S.E.mean:标准误
众数
(不唯一性)
无众数 原始数据: 8 10 5 9 12 6
一个众数 原始数据:
6
5
9
8
5
5
多于一个众数 原始数据: 25 28 28 36 42 42
中位数
(median)
1. 排序后处于中间位置上的值
50%
2. 不受极端值的影响
Me
50%
3. 主要用于顺序数据,也可用数值型数据,但不能 用于分类数据 4. 各变量值与中位数的离差绝对值之和最小,即
8
9
1
2
3
4
5
6
7
n 1 9 1 位置 5 2 2 中位数 1080
数值型数据的中位数
(10个数据的算例)
【例】:10个家庭的人均月收入数据
排 序: 660 750 780 850 1630 2000 位 置: 960 1080 1250 1500
9
10
n 1 10 1 位置 5.5 2 2
2 众数(Mode):出现频率最高的数 3 中位数(Median):将数据排序后位于正中间 的数值。适合于所有分布类型的数据 4 总和(Sum)
众数
(mode) 1. 出现次数最多的变量值

SPSS统计分析第四章均值比较与T检验

SPSS统计分析第四章均值比较与T检验

N 258 216
Mean $41441.8 $26031.9
Std. Dev iation $19,499.214 $7,558.021
Std. Error Mean $1213.97
$514.258
左第一栏为分析变量标签和分类变量标签 N观测量数目 Mean均值 Std. Deviation标准差 Std. Error Mean标准误
三、配对样本T检验
配对样本T检验(Paired Sample T test)用 于检验两个相关的样本是否来自具有相同均 值的总体。这种相关的或配对的样本常常来 自这样的实验结果,在实验中被观测对象在 实验前后均被观测。两个变量可以是before after,配对分析的测度也不是必须来自同一 个观测对象。一对可以两者组合而成。
练习题
已知某水样中含CaCO3的真值为20.7mg/L, 现用某方法重复测定该水样11次CaCO3的含 量(mg/L)为:20.99,20.41,20.10, 20.00,20.91,22.60,20.99,20.41, 20.00,23.00,22.00。问该方法测得的均值 是否偏高?
2、Independent Sample T test(独立样本T检验)
例题一
现有银行雇员工资为例,检验男女雇员现工 资是否有显著差异。一个是要比较salary变量 的均值,另一个是gender变量作为分水平变 量。 (data09--03) 。
分析变量的简单描述性统计量
Gender Current Salary Male
F emale
Group Statistics
如果你试图比较的变量明显不是正态分布的,则应该 考虑使用一种非参数检验过程(Nonparametric test)。 如果想比较的变量是分类变量,应该使用Crosstabs 功能。

第4章 SPSS基本统计分析

第4章 SPSS基本统计分析
• 分析不同居住类型的被访者未来的购房预 期是否一致
练习3
• 完成上例
提纲
1
频数分析
2
计算基本描述统计量
复合分组下的频数分析 多选项分析
3
4
5
比率分析
多选项分析
实现思路 1)按多选项二分法或多选项分类法将多选项问题 分解成若干的问题,并设置若干个SPSS变量 2)采用多选项频数分析或多选项交叉分组下的频
• 选择若干个频数分析的变量
• 选择绘制统计图形
4、频数分析的扩展功能
计算分位数 • 分位数:是变量在不同百分位点上的取值。分位 点在0~100之间。 • 分位数差是一种描述数据离散程度的方式。分位 数差越大,表示数据在相应分位上的离散程度越 大
4、频数分析的扩展功能
频数分布表格式的定义 • 调整频数分布表中数据的输出顺序
– 按变量值的升序或降序输出 – 按频数值的升序或降序输出
• 压缩频数分布表
– SPSS默认如果变量取值的个数或取值区间的个数大于10,则 不输出相应的频数分布表
5、频数分析应用举例
分析月住房开销的分布,并对不同居住类型进行比较 • 1)“月住房开销”为定距型变量→先分组,再编 制频数分布表
• 2)计算月住房开销的四分位数→按照“居住类型” 将数据拆分,并重新计算四分位数→进行比较
• 累计百分比:即各百分比逐级累加起来的结果,
最终取值为100%。
2、频数分析中常用统计图
• 条形图:适用于定序和定类变量的分析。条形图
的纵坐标可以是频数,也可以是百分比。
• 饼图:饼图中圆内的扇形面积可以表示频数,也可
以表示百分比。
• 直方图:适用于定距型变量的分析。
3、频数分析的基本操作

《SPSS统计分析方法及应用》第四章--基本统计分析课件

《SPSS统计分析方法及应用》第四章--基本统计分析课件
(3)众数(Mode):即一组数据中出现次数最多的 数据值。如生产鞋的厂商在制定各种型号鞋的生产 计划时应该运用众数。
学习交流PPT
17
(4)均值标准误差(Standard Error of Mean):描述 样本均值与总体均值之间的平均差异程度的统计量。 其计算公式为:
S.E.of .Mean ( x X )2 n
按Variables框中的排列顺 序输出
按各变量的字母顺序输出 按均值的升序排列 按均值的降序排列
Options 对话框
学习交流PPT
28
在上面窗口中,用户可以指定分析多变量时结 果输出的次序(Display Order)。其中,Variable list表示按变量在数据窗口中从左到右的次序输出; Alphabetic表示按字母顺序输出;Ascending Means 表示按均值升序输出;Descending Means表示按均 值降序输出。
至此,SPSS便自动计算所选变量的基本描述统 计量并显示到输出窗口中。
学习交流PPT
29
• 5.2.3 计算基本描述统计量的应用举例
1. 利用商品房购买意向的调查数据,对月住 房开销变量计算基本描述统计量。
有以下分析目标:计算月住房开销的基本描述 统计量,并分别对不同居住类型进行比较分析: 首先按居住类型对数据进行拆分(Split file), 然后计算月住房开销的基本描述统计量。
学习交流PPT
19
常见的刻画离散程度的描述统计量如下:
(1)全距(Range):也称极差,是数据的最大值 (Maximum)与最小值(Minimum)之间的绝对离差。
(2)方差(Variance):也是表示变量取值距均值的离 散程度的统计量,是各变量值与算数平均数离差平方 的算术平均数。其计算公式为:

完整word版统计分析与SPSS的应用第五版课后练习答案第4章

完整word版统计分析与SPSS的应用第五版课后练习答案第4章

...《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第4章SPSS基本统计分析1、利用第2 章第7 题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。

分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。

Statistics户口所在职业年龄地282 282 282 Valid NMissing户口所在地FrequencyPercentValid CumulativePercentPercent70.9 200 70.9 70.9 中心城市100.082 29.1 29.1 Valid边远郊区100.0Total100.0282职业FrequencyPercentValid CumulativePercentPercent8.5 8.5 国家机关8.5 2427.7 19.1 商业服务业54 19.134.0 18 6.4 6.4 文教卫生39.4 公交建筑业15 5.3 5.3 45.7 6.4 经营性公司Valid18 6.451.1 15 5.3 5.3 学校63.5 12.4 35 12.4 一般农户棉种粮专业64.9 1.44 1.4 户......种果菜专业10 3.5 3.5 68.4 户工商运专业80.5 12.1 34 12.1 户退役人员86.5 17 6.0 6.0金融机构98.9 35 12.4 12.4现役军人3 1.1 1.1 100.0Total282100.0100.0年龄FrequencyPercentValid CumulativePercentPercent1.4 4 1.4 20 岁以下1.453.2 51.8 20~35 岁146 51.885.5 32.3 91 35~50 Valid岁32.3100.014.5 41 岁以上50 14.5100.0Total 282 100.0......分析:本次调查的有效样本为282份。

第 章 SPSS 基本统计量的描述

第 章 SPSS 基本统计量的描述

存 (取 )款 金 额
直方图
二、计算基本描述统计量
目的:精确把握变量的总体分布状况。 基本操作: ✓ 描述统计-频率过程:统计 ✓ 描述统计- 描述过程 ✓ 描述统计- 探索过程 ✓ 均值比较-均值 过程(分组显示) 用途:计算变量的集中趋势、离散趋势、偏度、
峰度等指标,绘制统计图。
几个过程的基本描述统计量比较
农村户口
户口
城镇户口
饼图
Frequency
100
0 0.0
Std. Dev = 10945.57 Mean = 4738.1 10000.0 20000.0 30000.0 40000.0 50000.0 60000.0 70000.0 80000.0 90000.0N10=000208.02.00
McNemar:配对计数资料的卡方检验。零假设
为两变量的阳性率无差别源自2(bc 1)2
bc
Kappa一致性检验:系数取值-1~1。测量同 一观测对象在两变量(两变量服从二项分布) 上取值的一致性程度。其绝对值越接近1,说明 一致性程度越高。一般来说:
✓ 系数>=0.7,一致性程度较高;
✓ 0.4~0.7,一致性程度一般;
卡方检验操作:统计量选项
【单元格】:用于定义列联表单元格中需 要计算的指标:
计数:是否输出实际观察数和理论数;
百分比:是否输出行百分数、列百分数以及合 计百分数;
残差:选择残差的显示方式;
【格式】:用于选择行变量是升序还是降 序排列。
结果:城乡储户的收入水平没有明显差异。
Pearson卡方值的影响因素
C
2 2 n
A11A22A12A21
R1R2C1C2
2

薛薇-《SPSS统计分析方法及应用》第4章--基本统计分析

薛薇-《SPSS统计分析方法及应用》第4章--基本统计分析
13
4.1 频数分析 (2)【多个变量】单选框组:
如果选择了两个以上变量作频数表,则compare variables可以将所有变量的结果在同一个频数表过程 输出结果中显示,便于互相比较;organize output by variables则将结果在不同的频数表过程输出结果中显 示,每一个变量一张表。
SPSS统计分析方法及应用 第四章
2020/2/16
本章重点
➢编制交叉列联表 ➢行列变量之间的关系
2020/2/16
描述性统计分析

的第一步,做好这
第一步是下面进行正确统计推断的先决条件。
SPSS的许多模块均可完成描述性分析,但专门
为该目的而设计的几个模块则集中在【
】菜单中,包括:
2020/2/16
6
4.1 频数分析
注:变量的计量尺度: a 、定类 (Category Scale):只能计次 b、 定序 (Ordinal Scale):计次、排序 c 、定距(Interval Scale):计次、排序、加减 d、 定比 (Ratio Scale):计次、排序、加减、乘除
7
4.1 频数分析
(1)选择菜单【分析】—【描述分析】—【频率】。 (2)将若干频数分析变量选择到【变量】框中。 (3)单击【图表】按钮选择绘制统计图形,在【图表
5
4.1 频数分析
(2)频数分析的第二个任务是绘制统计图 条形图(Bar Chart):用宽度相同的条形的高度 或长短来表示频数分布变化的图形,适用于定序和 定类变量的分析。
饼图(Pie Chart):用圆形及圆内扇形的面积来 表示频数百分比变化的图形,以利于研究事物内在 结构组成等问题。
直方图(Histograms):用矩形的面积来表示频 数分布变化的图形,适用于定距型变量的分析。

spss统计分析及应用教程-第4章 参数检验

spss统计分析及应用教程-第4章 参数检验
文件—打开”命令将数据调入SPSSl7.0的工作文件窗 口。
(2)依次选择“分析—比较均值—单样本T检验”命令 ,打开t检验对话框 ,如图所示
(3)在图所示的单样本T检验对话框中,相关内容介绍如下: 检验变量列表:用于选择所需检验的变量。 检验值:用于输入检验值。
本例在图对话框左端的变量列表将要检验的变量“旅游投资” 添加到右边的检验变量列表中,检验值后面的文本框中输入 1480。
SPSS会根据单因素分析的方法计算出F值和伴随概率p值,以及根据样 本信息自动计算出t统计量的观测值和对应的伴随概率p值。
❖ 两独立样本t检验基本原理和步骤
4
检验判断显著性水平 ɑ
① 方差齐次性检验:给定显著性水平以后,SPSS会先利用F检验判断 两总体的方差是否相等,并由此决定抽样分布方差和自由度的计算方 法和计算结果。
•单一样本t检验基本原理和步骤
提出原假设
单一样本t检验的原假设:总体均值与
1
检验值之间不存在显著差异,即:=,为
总体均值,为检验值。
•单一样本t检验基本原理和步骤
选择检验统计量 2
当总体分布为正态分布
时,样本均值的抽样分布仍是正态分布,
该正态分布的均值为 , 方差为 2,其中 为总体均值, 2为总体方差,n
2
选择检验统计量
由于 度为
(原假设),所以可以略去。这里的t统计量服从自由 的t分布。
当两总体方差未知且不同的情况下,即
,分别用样本方差代
替总体方差,此时两样本均值差的抽样分布的方差为
定义t统计量的计算公式为:
❖ 两独立样本t检验基本原理和步骤
2
选择检验统计量
其中、分别为第一组和第二组样本的样本方差, 、 分别为第一组和 第二组的样本容量。此时两样本均值差的抽样分布的方差为:

第四章SPSS描述统计分析

第四章SPSS描述统计分析
本例以上四个复选框全部选择
第4步:设置绘图
点击【图】按钮,弹出“探索:图”对话框。
在“描述”栏内,同 时选择“ 茎叶图”、 “直方图”两个复选框 ,要求作茎叶描述,以 及直方图显示。
同时,选择“含检验 的正态图”。
第5步:设置选项。点击【选项】按钮,弹 出“探索:选项”对话框。
第6步:在主对话框中点击【确定】按 钮 。SPSS在输出窗口的输出结果。
□描述:输出均数、 中位数、众数、5%修正 均数、标准误、方差、 标准差、最小值、最大 值、范围、四分位全距 、峰度系数、峰度系数 的标准误、偏度系数、 偏度系数的标准误。
□M-估计量:作中心趋势的粗略最大似然确 定,输出四个不同权重的最大似然确定数;
□离群值:输出五个最大值与五个最小值; □百分位数:输出第5%、10%、25%、50%、 75%、90%、95%位数;
SPSS 23.0 统计分析
——在心理学与Leabharlann 育学中的应用第四章 描述统计分析
2020/7/9
全书目录
第一章 SPSS 23.0简介与基本操作 第二章 数据编辑与整理 第三章 数据转换 第四章 描述统计分析 第五章 交叉表分析 第六章 比较平均值 第七章 方差分析 第八章 相关分析 第九章 回归分析
所谓Z分值是指某原始数值比其均值高 多少个标准差。
4.2 描述分析
案例:【例4- 2】被试对某一次测验的测验
总分进行分析,描述该测验分数的基本描述 信息,以及将每个被试的分数转化为标准化 分数。
第1步:打开分析数据。打开“测验数据文 件.sav”文件。
第2步:启动分析过程。点击【分析】【描述

四 4.1 频数分析

描 4.2 描述分析 述 4.3 探索分析

SPSS课件第4章

SPSS课件第4章


H0 : price 258;
H1 : price 258
由于单样本t检验要求样本数据服从正态分布,因此进行单 表4-3 One-Sample K-S Test 样本的K-S检验,得到检验分析表。从检验结果看到, 统计量Z等于0.697,相伴概率P等于0.716,远大于显著 性水平,因此接受零假设,认为该数据服从正态分布, 可以利用单样本t检验方法。具体操作步骤如下。
t
df 25
Sig. (2tailed) .471
99% Confidence Int erval of the Differen ce Mean Dif ference Lower Upper
.53846 -1.5141 2.5911
通勤 时间
.731
4.1.4 实例进阶分析:机票的折扣费
1 .实例内容
在该对话框左侧的候选变量列表框中选择一个或几 个变量,将其移入【Test Variable(s)(检验变 量)】列表框中。其中,左侧候选变量列表框中显 示的是可以进行t检验的变量。
Step03: 选择样本检验值。
在【Test Value(检验值)】文本框中输入检验值, 相当于t
D S n
式中,D是样本均值与检验值之差;因为总体方差未知, 故用样本方差S代替总体方差;n为样本数。
3.概率P值
如果概率P值小于或等于显著性水平,则拒 绝零假设; 如果概率P值大于显著性水平,则接受零假 设。
4.软件使用方法
(1)在SPSS中,软件将自动计算t值,由于该统计量 服从n-1个自由度的t分布,SPSS将根据t分布表给 出t值对应的相伴概率P值。 (2)如果相伴概率P值小于或等于给定的显著性水平, 则拒绝H0,认为总体均值与检验值之间存在显著差 异。 (3)相反,相伴概率值大于给定的显著性水平,则不 应拒绝H0,可以认为总体均值与检验值之间不存在 显著差异。

spss4-3(基本统计分析)

spss4-3(基本统计分析)

实例分析 1 为了探讨吸烟与慢性支气管炎有无关 系,调查了339人,情况如下: (数据为:吸烟与支气管炎.sav)
患慢性支气管炎 吸烟 不吸烟 43 13 未患慢性支气管炎 162 121
实例分析
1 操作步骤:
在Data菜单中选Weight Cases…项,打开Weight Cases对 话框。 Weight Cases by,再将变量x3选入Frequence Variable 框,单击OK完成加权。 按Analyze--Descriptive Statistics--Crootabs 顺序打开 Crootabs 主对话框。将x1变量 选入Row框作为行变量, 将x2变量 选入Column 框作为列变量。
计算非标准化残差 计算标准化残差 计算调整后残差
Table Format 对话框
决定各行的排列顺序: 各行的排列按升序 各行的排列按降序
实例分析
对居民储蓄调查数据.sav建立列联表,分析 户口和职业的关系
CROSSTABS /TABLES=a13 BY a14 /FORMAT= AVALUE TABLES /CELLS= COUNT /COUNT ROUND CELL .
Crosstabs 对话框
该框中的变量 作为分布表中 的行变量,
显示每 一组中 各变量 的分类 条形图。
该框中的变量 作为分布表中 的列变量,
该框中的变量作 为控制变量,决 定频数分布表中 的层,可有多个 控制变量
只输出统 计量,不 输出多维 列联表。
exact 精确检验
Statistics 对话框
f11+ f12 f21+ f22 n
列联表的结构
(r c 列联表的一般表示)

第4章:SPSS的统计分析

第4章:SPSS的统计分析

把“地区标 志”作为分 组变量,对 不同的组进 行比较
ADD 平均绝 对离差
COD离散 系数 Mean centered COV 均值的变异系数
COV变异系数
Median centered COV中位数变异系 数
分析analyze描述统计descriptivestatistics频数frequencies点击图表chart选择统计图点击格式format调整频数分布表中数据的输出顺序点击格式format调整分布表中数据的输出顺序统计结果输出结果输出窗口413频数分析的扩展功能spss编制频数分布表和绘制统计图是频数分析的基本任务除此之外在频率窗口中通点击统计量statistics按钮还可以计算其他的统量
数据拆分
表明该数据是进行拆分了的
计算描述统计
分析结果(结果输出窗口) 分析结果(结果输出窗口)
4.3 交叉分组下的频数分析
4.3.1 交叉分组下的频数分析的目的和基本任务 通过频数分析能够掌握单个变量的数据分布情况。在实际 分析中,不仅要了解单变量的特征,还要分析多个变量不同取 值下的分布,掌握多变量的联合分布特征,进而分析变量间的 相互影响和关系。对多变量的联合分布特征的分析,常采用交 叉分组下的频数分析来完成。 交叉分组下的频数分析又称列联表分析,它包括两大基本 任务:第一,根据收集到的样本数据编制交叉列联表;第二, 在交叉列联表的基础上,对两两变量间是否存在一定的相关性 进行分析。
1.多选项二分法 1.多选项二分法 多选项二分法就是将多选项问题中的每个答案设为一个 SPSS变量,每个变量只有0或1两个取值,分别表示选择该答案 和不选择该答案。例如:多选项二分法. 2. 多选项分类法 多选项分类法中,首先估计多选项问题最多可能出现的 答案个数;然后,为每个答案设置一个SPSS变量,变脸取值为 多选项问题中的可选答案。例如:多选项分类法. 在选择多选项问题分解时,对于所选答案具有一定顺序的多 选项问题可采用多选项分类法分解,而没有顺序的问题可采用 二分法分解。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

集 中 趋 势 栏
离散趋势
分布形态栏
输出统计量对话框
案例:分析人均住房面积的分布情况,并对本 市户口和外地户口家庭进行比较
展示所有样本的四分位数:在变量【variable(s)】中
选择“人均面积”,在【statistics】中选择四分位数 【quartiles】即可。
按“户口状况”对数据进行拆分,然后分类比较人均住
⑷按【format】,可以调整频数分布表中数据的输出顺 序,这里选择频数的降序【descending counts】。 累计
变 量值
频 数
百分 比
此外,在SPSS输出窗口中用鼠标双击待编辑的图形,会 出出现【chart editor】图形编辑窗口。例如在 【elements】选择【show data lables】,可以在图中显示 频数数据。
SPSS提供了计算任意分位数的功能,用户可以指定将 数据等分为n份(Cut points for n equal groups)。 还可以直接指定分位点(Percentile)。
四分位差(也称内距或四分位距)
它是上四分位数(QU,即位于75%)与下四分位数(
QL,即位于25%)。计算公式为:Qd =QU-QL 四分位差反映了中间50%数据的离散程度,其数值越 小,说明中间的数据越集中;其数值越大,说明中间 的数据越分散。
结果一:人均住房面积频数分布表
结果二:分组后人均住房面积直方图
扩展二
计算分位数
分位数是变量在不同分位点上的取值。分位点在0- 100之间。
一般使用较多的是四分位点(Quartiles),即将所有数 据按升序排序后平均等分成四份,各分位点依次是25 %,50%,75%。于是四分位数便分别是25%,50% ,75%点所对应的变量值。此外,还有八分位数、十 六分位数等。
房面积的分位数。 操作:先使用【data】中【 split file】按“户口状况” 进行拆分,再选择【analyze】→【descriptive statistics】→ 【frequercies】,选择“人均面积”,并仅在【statistics】 中选择四分位数【quartiles】即可。
4.2计算基本描述统计量 ——对定距数据分布的精确认识
4.1 4.2 4.3 4.4 4.5
频数分析 计算基本描述统计量 交叉分组下的频数分析 多选项分析 比率分析
学习目标及内容:
掌握SPSS频数分析的基本方法及其操作 明确基本描述统计量的含义,并掌握其操作
掌握交叉列联分析的基本方法,了解卡方检验的基本 思想,并熟练操作 掌握对多选项问题的不同拆分方法和应用场合,并能 用于数据分析
1 n 3 3 Skewness ( xi x) / S n 1 i 1
当分布为对称分布时,正负总偏差相等,偏 度值等于0; 当分布为不对称分布时,正负总偏差不相等,偏度 值大于0或小于0。 偏度值大于0表示正偏差值大,称为正偏或右偏; 偏度值小于0表示负偏差值大,称为负偏或左偏. 偏度绝对值越大,表示数据分布形态的偏斜程度越 偏大。
(2) 任务二是绘制统计图 ①柱形图或条形图(bar chart) 条形图用横坐标的长短表示频数(百分比)的变化, 柱形图用纵坐标的高度表示频数(百分比),如下图 。 适合于定序和定类变量;
②饼图(pie chart):用圆形或扇形的面积表示频数、 百分比的变化。
③直方图(histograms):用矩形的面积表示频数分布变 化的图形,适用于定距性变量的分析。可以附加正态 分布曲线。
常见的刻画离散程度的描述统计量如下: (1)全距(Range):也称极差,是数据的最大值 (Maximum)与最小值(Minimum)之间的绝对 离差。 (2)样本方差(Variance):也是表示变量取值离 散程度的统计量,是各变量值与算术平均数离差平 方的算术平均数。其计算公式为:
1 2 S ( xi x) n 1 i 1
案例二:利用住房状况数据,分析人均住房面积 是否存在不均衡的现象
人均住房面积是否均衡,可以从人均住房面积是否 有大量的异常值入手。假设人均住房面积的总体分布 为正态分布,根据统计学中的3σ准则,异常值指在3 个标准差之外的变量值。
xi x P{ zi 3} 99.7%
3 原则认为正态分布中大概有0.3%的异常值,超 过这个标准就认为数据分布不均衡。
目的:精确把握变量的总体分布状况,了解数据的集 中趋势、离散趋势、对称程度、陡峭程度。 常见的基本描述统计量有三大类:
刻画集中趋势的统计量 刻画离散程度的统计量 刻画分布形态的统计量
4.2.1 基本描述统计量
一、刻画集中趋势的描述统计量 集中趋势是指一组数据向某一中心值靠拢的倾 向。 (1)均值(Mean):即算术平均数,是反映某变量 所有取值的集中趋势或平均水平的指标。如某企业 职工的平均月收入。其计算公式为:
操作:运用前面介绍的分组操作按“人均面积”将住房 分成1、2、3、4组,并赋给变量值,如1为人均住房 “小于10平方米”„ 【transform】→【recode into different variables】 然后选择频数分析【analyze】→【descriptive statistics】 → 【frequercies】,采用“分组后的人均面积”作 为计算频数的变量。在【charts】中使用直方图 histograms,带正态曲线with normal curve;
zi
xi x
~ N (0,1)
计算人均住房面积标准化值的操作:
【analyze】→【descriptive statistics】→ 【descriptives】→【save standardized values as variables】 SPSS会自动生成一个变量名存放人均住房面积的标准 化值“Z人均面积” 然后分别使用排序【sort by】(可以观察到异常值)、 分组【recode into different variables】、频数分析 功能
1 n x xi n i 1
(2)中位数(Median):即一组数据按升序排序后,处于中间 位置上的数据值。如评价社会的老龄化程度时,可用中位数 。 (3)众数(Mode):即一组数据中出现次数最多的数据值。如 生产鞋的厂商在制定各种型号鞋的生产计划时应该运用众数 。 (4)均值标准误差(Standard Error of Mean):描述样本均值 与总体均值之间的平均差异程度的统计量。其计算公式为:
数据分布特征和描述统计量
4.2.2计算基本描述统计量的应用举例 案例一:按户口状况对“人均住房面积”计 算基本描述统计量,并分别对本市户口和外 地户口家庭进行比较。 【analyze】→【descriptive statistics】→ 【descriptives】,在【variables】框中选“人 均面积”,再按【options】,从中选择需要 的特征描述。
(2)峰度(Kurtosis):描述变量取值分布形态陡峭程 度的统计量。其计算公式为:
1 n 4 4 Kurtosis ( xi x) / S 3 n 1 i 1
当数据分布与标准正态分布的陡峭程度相同时,峰 度值等于0; 峰度大于0表示数据的分布比标准正态分布更陡峭,为 尖峰分布; 峰度小于0表示数据的分布比标准正态分布平缓,为平 峰分布。
4.1频数分析
4.1.1频数分析的目的和基本任务
1、目的:基本统计分析往往从频数分析开始。通过频数分 析能够了解变量取值的状况,对把握数据的分布特征是非 常有用的。 2、基本任务 (1)频数分析的第一个基本任务是编制频数分布表。 频数(Frequency):即变量值落在某个区间(或某个 类别)中的次数 百分比(Percent):即各频数占总样本数的百分比 有效百分比(Valid Percent):即各频数占有效样本数 的百分比,这里有效样本数=总样本-缺失样本数 累计百分比(Cumulative Percent):即各百分比逐级 累加起来的结果。最终取值为1。
4.1.3 SPSS频数分析的扩展功能
按【statistics】还可以计算其他重要的统计量,如计 算分位数percentile values、以及反映集中趋势和 离散程度的统计量。这些扩展分析较适合于定距型变 量。 扩展一
定距型变量的频数分析 例如:分析 “人均住房面积”的分布情况
由于“人均面积”属于定距型变量,需要进行分组后, 才能进行频数分析。
问题:分析户主的从业状况和房屋产权情况 操作: ⑴选择【analyze】→【descriptive statistics】→ 【frequercies】
4.1.2频数分析的应用举例(住房状况调 查)
⑵再选择频数分析变量,即“从业状况”、“房屋产权” 到【varable(s)】框中 ⑶按【charts】选统计图形,在【chart values】中选择坐标 的含义(柱形、饼图),其中【frequencies】表示频数, 【percentages】表示百分比。
职 称* 文 化 程 度Crosstabulation 文 化 程 度 本 科 职 称 高 级 工 程 师 Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total 1 33.3% 25.0% 6.3% 1 25.0% 25.0% 6.3% 2 33.3% 50.0% 12.5% 0 .0% .0% .0% 4 25.0% 100.0% 25.0% 专 科 1 33.3% 25.0% 6.3% 3 75.0% 75.0% 18.8% 0 .0% .0% .0% 0 .0% .0% .0% 4 25.0% 100.0% 25.0% 高 中 1 33.3% 20.0% 6.3% 0 .0% .0% .0% 1 16.7% 20.0% 6.3% 3 100.0% 60.0% 18.8% 5 31.3% 100.0% 31.3% 初 中 0 .0% .0% .0% 0 .0% .0% .0% 3 50.0% 100.0% 18.8% 0 .0% .0% .0% 3 18.8% 100.0% 18.8% Total 3 100.0% 18.8% 18.8% 4 100.0% 25.0% 25.0% 6 100.0% 37.5% 37.5% 3 100.0% 18.8% 18.8% 16 100.0% 100.0% 100.0%
相关文档
最新文档