第4章 SPSS基本统计分析讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
25%、50%、75%的百分 位数;
将数据平均分为所设定 的相等等份,可输入2— 100 的整数,如键入4则输 出第25、50、75百分位数
自定义百分位数,可输 入0—100 的整数。
离散趋势 分布形态栏
输出统计量对话框
案例:分析人均住房面积的分布情况,并对本 市户口和外地户口家庭进行比较
?展示所有样本的四分位数:在变量【variable(s)】 中选择“人均面积”,在【statistics】中选择四分位 数【quartiles】即可。
?按“户口状况”对数据进行拆分,然后分类比较人均住 房面积的分位数。
操作:先使用【data】中【 split file】按“户口状况” 进行拆分,再选择【analyze】→【descriptive statistics】→【frequercies】,选择“人均面积”,并 仅在【statistics】中选择四分位数【quartiles】即可。
4.2计算基本描述统计量 ——对定距数据分布的精确认识
目的:精确把握变量的总体分布状况,了解数据的集 中趋势、离散趋势、对称程度、陡峭程度。
常见的基本描述统计量有三大类:
刻画集中趋势的统计量 刻画离散程度的统计量 刻画分布形态的统计量
4.2.1 基本描述统计量
按【statistics】还可以计算其他重要的统计量,如计 算分位数percentile values、以及反映集中趋势和 离散程度的统计量。这些扩展分析较适合于 定距型变
扩量展。一 定距型变量的频数分析
例如:分析 “人均住房面积”的分布情况
由于“人均面积”属于定距型变量,需要进行分组后, 才能进行频数分析。
操作:运用前面介绍的分组操作按“人均面积”将住房 分成1、2、3、4组,并赋给变量值,如1为人均住房 “小于10平方米”…
?【transform 】→【recode into different variables 】
?然后选择频数分析【analyze 】→【descriptive statistics 】→ 【frequercies 】,采用“分组后的 人均面积”作为计算频数的变量。在【charts 】中使 用直方图histograms ,带正态曲线with normal curve;
②饼图(pie chart):用圆形或扇形的面积表示频数、 百分比的变化。
③直方图(histograms):用矩形的面积表示频数分布变 化的图形,适用于定距性变量的分析。可以附加正态 分布曲线。
4.1.2频数分析的应用举例(住房状况调 查)
问题:分析户主的从业状况和房屋产权情况
操作:
⑴选择【analyze】→【descriptive statistics】→ 【frequercies】
4.1 频数分析 wk.baidu.com.2 计算基本描述统计量 4.3 交叉分组下的频数分析 4.4 多选项分析 4.5 比率分析
学习目标及内容:
掌握SPSS 频数分析的基本方法及其操作 明确基本描述统计量的含义,并掌握其操作
掌握交叉列联分析的基本方法,了解卡方检验的基本 思想,并熟练操作
掌握对多选项问题的不同拆分方法和应用场合,并能 用于数据分析
4.1频数分析
4.1.1频数分析的目的和基本任务
1、目的:基本统计分析往往从频数分析开始。通过频数分 析能够了解变量取值的状况,对把握数据的分布特征是非 常有用的。
2、基本任务
(1)频数分析的第一个基本任务是编制频数分布表。 频数(Frequency ):即变量值落在某个区间(或某 个类别)中的次数
百分比(Percent ):即各频数占总样本数的百分比 有效百分比(Valid Percent ):即各频数占有效样本 数的百分比,这里有效样本数=总样本-缺失样本数
累计百分比(Cumulative Percent ):即各百分比逐 级累加起来的结果。最终取值为 1。
(2) 任务二是绘制统计图
①柱形图或条形图(bar chart) 条形图用横坐标的长短表示频数(百分比)的变化, 柱形图用纵坐标的高度表示频数(百分比),如下图 。 适合于定序和定类变量;
?四分位差反映了中间 50% 数据的离散程度,其数值越 小,说明中间的数据越集中;其数值越大,说明中间 的数据越分散。
?四分位差不受极值的影响。此外,由于 中位数处于数 据的中间位置,因此,四分位差的大小在一定程度上 也说明了中位数对一组数据的代表程度。
栏势趋中集
输出百分位数: 输出四分位数,显示
?SPSS 提供了计算任意分位数的功能,用户可以指定将 数据等分为n份(Cut points for n equal groups )。
?还可以直接指定分位点(Percentile )。
四分位差(也称内距或四分位距)
?它是上四分位数(QU,即位于75% )与下四分位数 (QL,即位于25% )。计算公式为:Qd =QU-QL
序,这里选择频数的降序【descending counts】。累计
变
频
量
数
值
百分 比
此外,在SPSS输出窗口中用鼠标双击待编辑的图形,会 出出现【chart editor】图形编辑窗口。例如在 【elements】选择【show data lables】,可以在图 中显示频数数据。
4.1.3 SPSS频数分析的扩展功能
结果一:人均住房面积频数分布表
结果二:分组后人均住房面积直方图
扩展二 计算分位数
? 分位数是变量在不同分位点上的取值。分位点在 0- 100 之间。
?一般使用较多的是四分位点(Quartiles ),即将所有 数据按升序排序后平均等分成四份,各分位点依次是 25 %,50 %,75 %。于是四分位数便分别是 25 %, 50%,75%点所对应的变量值。此外,还有八分位数 、十六分位数等。
⑵再选择频数分析变量,即“从业状况”、“房屋产权” 到【varable(s)】框中
⑶按【charts】选统计图形,在【chart values】中选择坐 标的含义(柱形、饼图),其中【frequencies】表示频 数,【percentages】表示百分比。
⑷按【format】,可以调整频数分布表中数据的输出顺
将数据平均分为所设定 的相等等份,可输入2— 100 的整数,如键入4则输 出第25、50、75百分位数
自定义百分位数,可输 入0—100 的整数。
离散趋势 分布形态栏
输出统计量对话框
案例:分析人均住房面积的分布情况,并对本 市户口和外地户口家庭进行比较
?展示所有样本的四分位数:在变量【variable(s)】 中选择“人均面积”,在【statistics】中选择四分位 数【quartiles】即可。
?按“户口状况”对数据进行拆分,然后分类比较人均住 房面积的分位数。
操作:先使用【data】中【 split file】按“户口状况” 进行拆分,再选择【analyze】→【descriptive statistics】→【frequercies】,选择“人均面积”,并 仅在【statistics】中选择四分位数【quartiles】即可。
4.2计算基本描述统计量 ——对定距数据分布的精确认识
目的:精确把握变量的总体分布状况,了解数据的集 中趋势、离散趋势、对称程度、陡峭程度。
常见的基本描述统计量有三大类:
刻画集中趋势的统计量 刻画离散程度的统计量 刻画分布形态的统计量
4.2.1 基本描述统计量
按【statistics】还可以计算其他重要的统计量,如计 算分位数percentile values、以及反映集中趋势和 离散程度的统计量。这些扩展分析较适合于 定距型变
扩量展。一 定距型变量的频数分析
例如:分析 “人均住房面积”的分布情况
由于“人均面积”属于定距型变量,需要进行分组后, 才能进行频数分析。
操作:运用前面介绍的分组操作按“人均面积”将住房 分成1、2、3、4组,并赋给变量值,如1为人均住房 “小于10平方米”…
?【transform 】→【recode into different variables 】
?然后选择频数分析【analyze 】→【descriptive statistics 】→ 【frequercies 】,采用“分组后的 人均面积”作为计算频数的变量。在【charts 】中使 用直方图histograms ,带正态曲线with normal curve;
②饼图(pie chart):用圆形或扇形的面积表示频数、 百分比的变化。
③直方图(histograms):用矩形的面积表示频数分布变 化的图形,适用于定距性变量的分析。可以附加正态 分布曲线。
4.1.2频数分析的应用举例(住房状况调 查)
问题:分析户主的从业状况和房屋产权情况
操作:
⑴选择【analyze】→【descriptive statistics】→ 【frequercies】
4.1 频数分析 wk.baidu.com.2 计算基本描述统计量 4.3 交叉分组下的频数分析 4.4 多选项分析 4.5 比率分析
学习目标及内容:
掌握SPSS 频数分析的基本方法及其操作 明确基本描述统计量的含义,并掌握其操作
掌握交叉列联分析的基本方法,了解卡方检验的基本 思想,并熟练操作
掌握对多选项问题的不同拆分方法和应用场合,并能 用于数据分析
4.1频数分析
4.1.1频数分析的目的和基本任务
1、目的:基本统计分析往往从频数分析开始。通过频数分 析能够了解变量取值的状况,对把握数据的分布特征是非 常有用的。
2、基本任务
(1)频数分析的第一个基本任务是编制频数分布表。 频数(Frequency ):即变量值落在某个区间(或某 个类别)中的次数
百分比(Percent ):即各频数占总样本数的百分比 有效百分比(Valid Percent ):即各频数占有效样本 数的百分比,这里有效样本数=总样本-缺失样本数
累计百分比(Cumulative Percent ):即各百分比逐 级累加起来的结果。最终取值为 1。
(2) 任务二是绘制统计图
①柱形图或条形图(bar chart) 条形图用横坐标的长短表示频数(百分比)的变化, 柱形图用纵坐标的高度表示频数(百分比),如下图 。 适合于定序和定类变量;
?四分位差反映了中间 50% 数据的离散程度,其数值越 小,说明中间的数据越集中;其数值越大,说明中间 的数据越分散。
?四分位差不受极值的影响。此外,由于 中位数处于数 据的中间位置,因此,四分位差的大小在一定程度上 也说明了中位数对一组数据的代表程度。
栏势趋中集
输出百分位数: 输出四分位数,显示
?SPSS 提供了计算任意分位数的功能,用户可以指定将 数据等分为n份(Cut points for n equal groups )。
?还可以直接指定分位点(Percentile )。
四分位差(也称内距或四分位距)
?它是上四分位数(QU,即位于75% )与下四分位数 (QL,即位于25% )。计算公式为:Qd =QU-QL
序,这里选择频数的降序【descending counts】。累计
变
频
量
数
值
百分 比
此外,在SPSS输出窗口中用鼠标双击待编辑的图形,会 出出现【chart editor】图形编辑窗口。例如在 【elements】选择【show data lables】,可以在图 中显示频数数据。
4.1.3 SPSS频数分析的扩展功能
结果一:人均住房面积频数分布表
结果二:分组后人均住房面积直方图
扩展二 计算分位数
? 分位数是变量在不同分位点上的取值。分位点在 0- 100 之间。
?一般使用较多的是四分位点(Quartiles ),即将所有 数据按升序排序后平均等分成四份,各分位点依次是 25 %,50 %,75 %。于是四分位数便分别是 25 %, 50%,75%点所对应的变量值。此外,还有八分位数 、十六分位数等。
⑵再选择频数分析变量,即“从业状况”、“房屋产权” 到【varable(s)】框中
⑶按【charts】选统计图形,在【chart values】中选择坐 标的含义(柱形、饼图),其中【frequencies】表示频 数,【percentages】表示百分比。
⑷按【format】,可以调整频数分布表中数据的输出顺