第四章 SPSS的基本统计分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
进一步计算
– cells选项:选择在频数分析表中输出各种百分比.
row:行百分比(Row pct); column:列百分比(Col pct); total:总百分比(Tot pct);
分析列联表中变量间的关系
目的:
通过列联表分析,检验行列变量之间是否独立。
方法:
– 卡方检验:对品质数据的相关性进行度量
(68.2%,95.4%,99.7%) save standardized values as variables选项 将变量作标准化后,结果存入名为“Z+原变量名”
的新变量中.
交叉分组下的频数分析
目的
了解不同变量在不同水平下的数据分布情况
例:学习成绩与性别有关联吗?(两变量) 例:职业、性别、爱逛商店有关联吗?(三变量)
频数分析
• 频数分析中的其他分析
• 计算分位数:适用于定距数据
– 数据按升序排序后,找到若干个分位点上的变量值 – quartiles:计算四分位数25%(QL)、50%(中位数)、75%(QU) – cut points for n equal groups:n等份 – percentile:自定义百分位点
采用的方法
– 计算频分布表:包括计算 频数、累计频数、百分比、累 计百分比
– 绘制统计图形:条形图、饼图
频数分析
基本操作步骤
(1)菜单选项:analyze->descriptive statistics->frequencies (2)选择几个待分析的变量到variables框. (3)chart选项,选择所需要的图形
多选项分析
多选项分析的基本思路
– 定义多选项变量集 – 多选项频数分析 – 多选项交叉分组下的频数分析
多选项分析
定义多选项变量集
目的:将已分解的变量定义为一个集合,便于进行多选 项分析
– 菜单选项:analyze->multiple response->define sets – 从原变量中选取被分解的变量(数值型)到variables in
– 菜单选项:analyze->multiple response->crosstabs
分析的主要步骤
– 产生交叉列联表 – 分析列联表中变量间的关系
产生交叉列联表
•什么是列联表
控制变量
行变量
地区
职称
高(人)
列变量
收入 中(人)
低(人)
高工
频数
工程师
助工
技术员
合计
产生交叉列联表
基本操作步骤
(1)菜单选项: analyzwenku.baidu.com->descriptive statistics-> crosstabs
于均值; 小于0表示负偏差大(左偏)。
计算描述统计量
描述陡峭程度的统计量
– 峰度(kurtosis):描述某变量所有变量值分布形态陡缓 程度的统计量。
峭度为0表示与标准正态分布峭度相同。 大于0表示比标准正态分布陡,尖峰。 小于0表示比标准正态分布缓;平峰。
计算描述统计量
• 其他统计量
第四章 SPSS的基本统计分析
基本统计分析
• 频数分析 • 计算基本描述统计量(分布特征测度) • 图形分析工具 • 列联分析
频数分析
目的
粗略把握变量值的分布状况。
例:研究被调查者的特征(如:性别、年龄、收入) 研究被调查者对某个问题的总体看法(如:教学方式、选修课程) 研究被调查者某方面的状态(如:购买家电的类型、居民月支出状况)
•统计量服从(r-1)*(c-1)个
优 良 中 及格 总数
自由度的卡方分布
•count:观察(实际)频数 男 10 5
5
3
23
•expected count:期望频数
(期望频数反映的是H0成立情 女 8
12 4
1
25
况下的数据分布特征)
•Residual:剩余
总数 18 17 9
4
48
(观察频数-期望频数)
37.5 35.4 18.8 8.3 100
分析列联表中变量间的关系
卡方检验基本步骤
(3)计算卡方统计量的值,并得到该统计量值的概率P 值
(4)决策。概率P与显著性水平比较,小于等于则拒绝 H0,否则不能拒绝
实现步骤
statistics选项 cells选项
分析列联表中变量间的关系
卡方检验的要求: – 一般要求列联表中期望频数小于5的格子数不超过 20%,否则会夸大卡方值,容易得出拒绝结论,可 以合并单元格。 – 卡方值会受样本数的影响
计算描述统计量
描述集中趋势的统计量
– 均值(mean):表示某变量所有变量值集中趋势或平均水平的统计量。 适用于定距数据。 特点:利用了全部数据,易受极端值的影响。
描述离散程度的统计量
– 标准差(standard deviation--Std Dev):表示某变量的所有变量值离散程度的 统计量。 SPSS中计算的是样本标准差。
– 标准误差(standard error S.E):抽样分布中的标准差, 反映样本误差。
– 均值标准误差(means of S.E)
• 中心极限定理认为:样本均值~N(u,2/n) • 反映样本均值与总体真值间的平均离散程度 • 样本数越大,样本均值的离散程度越小,对真值的估计越
准确
计算描述统计量
(2)选择一个变量作为行变量到row框. (3)选择一个变量作为列变量到column框. (4)可选一个或多个变量作为控制变量到layer框.
– 控制变量的层次设置:同层为水平数加;不同层为水平数积.
(5)是否显示各分组的棒图(display clustered bar charts )
产生交叉列联表
sets框 – 指定被分解的变量是按多选项二分法(dichotomize)
分解还是按多选项分类法(categories)分解的 – 为变量集命名。系统自动在名字前加字符$.
多选项分析
多选项频数分析
– 菜单选项:analyze->multiple response->frequencies
多选项交叉分析下的频数分析
分析列联表中变量间的关系
卡方检验
年龄与工资收入交叉列联表
低中高
青 400 0
0
中0
500 0
老0
0
600
低中 高
青0
0
500
中 0 600 0
老 400 0
0
分析列联表中变量间的关系
•卡方检验基本步骤
(1)H0:行列变量之间无关 联或相互独立 (2)构造卡方统计量
2
( fo fe)2 fe
– 方差(variance):标准差的平方。 SPSS中计算的是样本方差。
– 极差 (range):最大值(maximum)—最小值(minimum)
计算描述统计量
描述对称程度的统计量
– 偏度(skewness):描述某变量分布形态的偏斜程度和 方向的统计量.
偏度为0表示对称; 大于0表示正偏差大(右偏),频数最大的值比均值小,极值大
• 分位数的应用
• 在排除极端值影响的条件下,通过计算分位数差,比较两 组样本数据的离散程度
– 例: ( QL=50,QU=80) 和 (QL=70,QU=75) 的比较
计算描述统计量
目的
– 精确把握变量的总体分布状况,了解数据的集中趋 势、离散趋势、对称程度、陡峭程度。
基本方法
– 计算基本描述统计量
基本操作步骤 (1)菜单选项:analyze->descriptive statistics-
>descripive (2)选择将参加计算的数值型变量名到variables
框。
计算描述统计量
其他功能
– 数据标准化处理
新变量的均值为0,标准差为1; 小于0表示在平均水平下,大于0反之. 正态分布的数据标准化后呈标准正态分布
相关文档
最新文档