第二讲SPSS描述性统计与统计图表的制作解析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二讲
描述统计与统计图表的制作
本章内容
第一节
描述性统计
频数分析 描述统计 探索分析 Means过程及应用
一、 二、 三、 四、
第二节
统计图表的制作
数据分析
数据中包含大量的信息,以致我们无法全部理解 数据的含义。因此,必须用一些方法从数据中提 取重要信息并转化成便于使用的形式,这就是数 据分析。
一、 频数分析
Analyze→Descriptive Statistics →Frequencies
百分位数
ຫໍສະໝຸດ Baidu集中量数
离散量数
数据分布
输出的直方图中带 有正态分布曲线
负偏态分布 比标准正 态分布的 峰值略高
二、 描述统计
Analyze→Descriptive Statistics → Descriptives
表3-5-1 被试摘要表
表3-5-2 四组被试数学成绩描述统计表
缺失值的处理 (Transform→Replace Missing Values)
第二节 统计图表的制作
一、条形图(bar chart) 二、线图(line graph) 三、面积图(arear) 四、饼图(circle graph or pie) 五、直方图(histogram) 六、概率图(P-P图和Q-Q图)
四、饼图(Graphs→Legacy Dialogs →Pie)
五、直方图 Graphs→Legacy Dialogs →Histogram
六、概率图(P-P图和Q-Q图)---检验数据分布 Analyse→Descriptive Statistics → P-P Plots
图3-4-9 两组被试数学成绩的箱图
排除异常值、极值 后数据的最大值 75% 50% 25% 异常值 因变量 排除异常值、极值 后数据的最小值
分组变量
三、 Means过程及应用—分组计算描述统计量
Analyze→Compare Means → Means
因变量 (连续性变量) 点击next实现分层 自变量 (分类变量)
一、条形图(Graphs→Legacy Dialogs →bar)
双击图表的任意位置,均可对图表做出修改
比较两个班级数学成绩高于80分的男女生数量
二、线图(Graphs→Legacy Dialogs →Line)
三、面积图(Graphs→Legacy Dialogs →Area)
偏度与峰度
偏度(skewness):描述某变量所有变量值分布形 态的偏斜程度和方向的统计量。偏度为0表示 对称;大于0表示正偏差大(右偏),频数最大的 值比均值小,极值大于均值;小于0表示负偏差 大(左偏)。 峰度(kurtosis):描述某变量所有变量值分布形态 陡缓程度的统计量。峰度为0表示与正态分布 峰度相同;大于0表示比正态分布缓,平峰; 小于0表示比正态分布陡,尖峰。
数据分析通常包含下列三种活动中的一种或多种: 1、为数据做一个图(graph); 2、为数据制一个表(table); 3、从数据中计算(compute)出一些东西。
集中量数和差异量数
一组变量的次数分布至少有两方面的基本特 征:中心位置和离散程度。 描述数据集中趋势的统计量称为集中量数。 集中量数包括:平均数、中数、众数等。 描述数据间彼此差异程度的统计量称为差异 量数。差异量数包括:全距、四分位距、平 均差、方差、标准差等。
Analyse→Descriptive Statistics → Q-Q Plots
因变量 分组变量 标识变量
输出5个最大值, 5个最小值
表3-4-1 高、低两种焦虑水平组被试人数表
表3-4-2 两组被试数学成绩的描述统计表
表3-4-3 最大值、最小值统计表
图3-4-7 高焦虑组数学成绩茎叶图
比如数据78,茎表 示为7,叶表示为8, 茎宽为10, 78=(7+8×0.1) ×10
将原始分数转换为Z分数
标准得分
标准得分是用某一观测值减均值所得的差除 以标准差所得的值。 不同变量一般有不同的平均数和标准差。在 统计上,均值和标准差不同时,一个变量的 值不能与另一个变量值相比较。
思考:如何比较葡萄和西瓜的大小?
三、探索分析—探索数据中是否存在极值 Analyze→Descriptive Statistics →Explore
描述统计与统计图表的制作
本章内容
第一节
描述性统计
频数分析 描述统计 探索分析 Means过程及应用
一、 二、 三、 四、
第二节
统计图表的制作
数据分析
数据中包含大量的信息,以致我们无法全部理解 数据的含义。因此,必须用一些方法从数据中提 取重要信息并转化成便于使用的形式,这就是数 据分析。
一、 频数分析
Analyze→Descriptive Statistics →Frequencies
百分位数
ຫໍສະໝຸດ Baidu集中量数
离散量数
数据分布
输出的直方图中带 有正态分布曲线
负偏态分布 比标准正 态分布的 峰值略高
二、 描述统计
Analyze→Descriptive Statistics → Descriptives
表3-5-1 被试摘要表
表3-5-2 四组被试数学成绩描述统计表
缺失值的处理 (Transform→Replace Missing Values)
第二节 统计图表的制作
一、条形图(bar chart) 二、线图(line graph) 三、面积图(arear) 四、饼图(circle graph or pie) 五、直方图(histogram) 六、概率图(P-P图和Q-Q图)
四、饼图(Graphs→Legacy Dialogs →Pie)
五、直方图 Graphs→Legacy Dialogs →Histogram
六、概率图(P-P图和Q-Q图)---检验数据分布 Analyse→Descriptive Statistics → P-P Plots
图3-4-9 两组被试数学成绩的箱图
排除异常值、极值 后数据的最大值 75% 50% 25% 异常值 因变量 排除异常值、极值 后数据的最小值
分组变量
三、 Means过程及应用—分组计算描述统计量
Analyze→Compare Means → Means
因变量 (连续性变量) 点击next实现分层 自变量 (分类变量)
一、条形图(Graphs→Legacy Dialogs →bar)
双击图表的任意位置,均可对图表做出修改
比较两个班级数学成绩高于80分的男女生数量
二、线图(Graphs→Legacy Dialogs →Line)
三、面积图(Graphs→Legacy Dialogs →Area)
偏度与峰度
偏度(skewness):描述某变量所有变量值分布形 态的偏斜程度和方向的统计量。偏度为0表示 对称;大于0表示正偏差大(右偏),频数最大的 值比均值小,极值大于均值;小于0表示负偏差 大(左偏)。 峰度(kurtosis):描述某变量所有变量值分布形态 陡缓程度的统计量。峰度为0表示与正态分布 峰度相同;大于0表示比正态分布缓,平峰; 小于0表示比正态分布陡,尖峰。
数据分析通常包含下列三种活动中的一种或多种: 1、为数据做一个图(graph); 2、为数据制一个表(table); 3、从数据中计算(compute)出一些东西。
集中量数和差异量数
一组变量的次数分布至少有两方面的基本特 征:中心位置和离散程度。 描述数据集中趋势的统计量称为集中量数。 集中量数包括:平均数、中数、众数等。 描述数据间彼此差异程度的统计量称为差异 量数。差异量数包括:全距、四分位距、平 均差、方差、标准差等。
Analyse→Descriptive Statistics → Q-Q Plots
因变量 分组变量 标识变量
输出5个最大值, 5个最小值
表3-4-1 高、低两种焦虑水平组被试人数表
表3-4-2 两组被试数学成绩的描述统计表
表3-4-3 最大值、最小值统计表
图3-4-7 高焦虑组数学成绩茎叶图
比如数据78,茎表 示为7,叶表示为8, 茎宽为10, 78=(7+8×0.1) ×10
将原始分数转换为Z分数
标准得分
标准得分是用某一观测值减均值所得的差除 以标准差所得的值。 不同变量一般有不同的平均数和标准差。在 统计上,均值和标准差不同时,一个变量的 值不能与另一个变量值相比较。
思考:如何比较葡萄和西瓜的大小?
三、探索分析—探索数据中是否存在极值 Analyze→Descriptive Statistics →Explore