第四章SPSS的基本统计分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
220
200
180
160
140
120
100
80
60
户口所在地
中心城市
边远郊区
140 120 100 80 60 40 20
0 中心城市
户口所在地
300
200
100
边远郊区
0 中心城市
收入水平
户口所在地
1000元以下 1000~3000元 3000~5000元 1500元以上
边远郊区
收入水平
1500元以上 3000~5000元 1000~3000元 1000元以下
• 分位数的应用
• 在排除极端值影响的条件下,通过计算分位数差,比较两 组样本数据的离散程度
– 例: ( QL=50,QU=80) 和 (QL=70,QU=75) 的比较 • 分位数、中位数、众数的应用举例
不同户口所在地的储户取款金额比较 利用分位数(不显示频数分析表)
计算描述统计量
• 目的
– 精确把握变量的总体分布状况,了解数据的集中趋势、离散趋势、对 称程度、陡峭程度。
• 基本方法
– 计算基本描述统计量
计算描述统计量
• 描述集中趋势的统计量
– 均值(mean):表示某变量所有变量值集中趋势或平均水平的统计量。 • 适用于定距数据。 • 特点:利用了全部数据,易受极端值的影响。
• 描述离散程度的统计量
– 标准差(standard deviation--Std Dev):表示某变量的所有变量值离散程度的 统计量。 • SPSS中计算的是样本标准差。
频数分析
• 应用举例 储户的职业分析 特点:定类数据 频数分布表输出按频数升降序输出
储户收入水平分析 特点:定序数据 除使用频数、百分比、总数外,还可以充分使用累计百分比
频数分析
• 频数分析中的其他分析 • 计算分位数:适用于定距数据
– 数据按升序排序后,找到若干个分位点上的变量值 – quartiles:计算四分位数25%(QL)、50%(中位数)、75%(QU) – cut points for n equal groups:n等份 – percentile:自定义百分位点
收入情况 未来收入情况
边远郊区
未来收入情况 收入情况
N <2 N <2
N <2
基本统计分析的图形工具
• 箱线图
• (箱线图中以四分位差的1.5倍为标准剔除值)
100 90 80 70 60 50 40 30 20
N=
SEX
30
female
30
male
1Fra Baidu bibliotek0
100
80
60
40
20
N=
60
60
MA TH
第四章 SPSS的基本统计分析
基本统计分析
• 频数分析 • 计算基本描述统计量(分布特征测度) • 图形分析工具 • 列联分析
频数分析
• 目的
粗略把握变量值的分布状况。
例:研究被调查者的特征(如:性别、年龄、收入) 研究被调查者对某个问题的总体看法(如:教学方式、选修课程) 研究被调查者某方面的状态(如:购买家电的类型、居民月支出状况)
• 小于0表示在平均水平下,大于0反之.
• 正态分布的数据标准化后呈标准正态分布(68.2%,95.4%,99.7%)
• save standardized values as variables选项
• 将变量作标准化后,结果存入名为“Z+原变量名”的新变量中.
– 数据标准化处理应用举例
• 你能以较简便的方法快速找到取款数目出众的储户吗?
•
– 均值标准误差(means of S.E)
• 中心极限定理认为:样本均值~N(u,2/n) • 反映样本均值与总体真值间的平均离散程度 • 样本数越大,样本均值的离散程度越小,对真值的估计越
准确
计算描述统计量
• 基本操作步骤 (1)菜单选项:analyze->descriptive statistics->descripive
• 采用的方法
– 计算频分布表:包括计算频数、百分比、累计百分比 – 绘制统计图形:条形图、饼图
频数分析
• 基本操作步骤
(1)菜单选项:analyze->descriptive statistics->frequencies (2)选择几个待分析的变量到variables框. (3)chart选项,选择所需要的图形
C HI
MATH
基本统计分析的图形工具
• 直方图和P-P图
10
Expected Cum Prob
计算描述统计量
• 描述陡峭程度的统计量
– 峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。
• 峭度为0表示与标准正态分布峭度相同。 • 大于0表示比标准正态分布陡,尖峰。 • 小于0表示比标准正态分布缓;平峰。
计算描述统计量
• 其他统计量 •
– 标准误差(standard error S.E):抽样分布中的标准差,反映样本误差。
– 方差(variance):标准差的平方。 • SPSS中计算的是样本方差。
– 极差 (range):最大值(maximum)—最小值(minimum)
计算描述统计量
• 描述对称程度的统计量
– 偏度(skewness):描述某变量分布形态的偏斜程度和方向的统计量.
• 偏度为0表示对称; • 大于0表示正偏差大(右偏),频数最大的值比均值小,极值大于均值; • 小于0表示负偏差大(左偏)
Count Count
Count
基本统计分析的图形工具
• 以制作条形图为例
• 第二种模式下的三种图形:用于若干变量的统计量的比较
62 60 58 56 54 52 50 48 46
收入情况
未来收入情况
50
40
30
20
10 0
中心城市
户口所在地
边远郊区
100 80 60 40 20
0 中心城市
户口所在地
基本统计分析的图形工具
• 以制作条形图为例
绘制简单条图(单式条图) 绘制复式条图
绘制堆积条图(分段条图) 定义统计图中数据的表达类型:
同一变量若干条记录的分组汇总 条图反映了不同变量的汇总 条图反映了个体观察值
基本统计分析的图形工具
• 以制作条形图为例
• 第一种模式下的三种图形:用于某变量在各分类情况的比较
(2)选择将参加计算的数值型变量名到variables框。
• 分析比较不同户口所在地储户取款情况
• 比较集中趋势 • 比较离散趋势 • 比较偏斜程度 • 比较陡峭程度
• 实现方式:数据拆分
计算描述统计量
• 其他功能
– 数据标准化处理
• 新变量的均值为0,标准差为1;
zi (xi x) / SD