描述性统计分析ppt课件
合集下载
实验三 描述性统计分析20191010

4
49
5
0
注从意这:个在图制可作以茎直叶观图的时看,出重: 复出现的数据要重复记录,不能遗漏, 特该别运是动“员叶中”位部数分、;众同数一都数在据2出0和现4几0之次间,,就且要呈在"图单中峰体"状现几次.
且分布较对称,集中程度高,说明其发挥比较稳定.
7、QQ图和QQ趋势图
QQ趋势图主要描述观察数值的离散趋势,从中可以发现异常点及观察数 值的变化趋势
Z变换(标准正态变换):
zi
xi
S
x
其中 x 表变量的均值,S表变量的标准差。如果选择该项,
则数据文件中将自动生成一列名为“Z+原变量名”的新
变量。
•
变换前
变换后
2.4 探索性分析——Explore
• 与前面介绍的两个过程相比,【Explore】过程更加强大。 • 它除了可以计算常见描述性统计量之外,还可以给出一些简
其中,5% Trimmed Mean:去掉5%极端数之后的均值(排在 最前面和最后面5%的数据都删掉)。
2、M-均值估计——检验异常数据。
3、分位点表
其中Tukey's Hinges表示的是绘制箱图时所用的分位点数据, 它的计算方法和一般的百分位数略有不同。
4、极值表 5、正态性检验
6、茎叶图
• 思路:是将数组中的数按位数进行比较
• 具体化:将数的大小基本不变或变化不大的 位作为一个主干(茎),将变化大的位的数 作为分枝(叶),列在主干的后面,这样就 可以清楚地看到每个主干后面的几个数,每 个数具体是多少。
探究:某篮球运动员在某赛季各场比赛的得分情况如 下:12,15,24,25,31,31,36,36,37,39,44, 49,50
最新第2讲.SPSS描述性统计分析PPT课件

一、操作(实践数据:产品的销售量.sav) 1)菜单“分析→描述统计→频率”。 2)对话框中,左侧选择一个或多个
待分析变量,移入右侧。 3)“显示频率表格”,勾选该复选
框,可输出频数分析表。
SPSS频数分析
二、几个重要的设置对话框 “统计量”按钮对应的对话框:
1)四分位数:显示25%、50%、 75%的分位数。 2)割点:勾选后可输入数值A, 将数据平分为A等分。例如,输 入5,表示输出20%、40%、 60%、80%的百分位数。 3)百分位数:选中后,可激活 右侧的文本框和列表。可输入、 更改和删除自定义的百分位数。
幂估计:对每一组数据产生一个中位数的自然对数与四 分位数的自然对数的散列点图,达到方差齐次性要求的 幂次估计;并据此散布图,来估计将各组方差转换成同 方差所需的幂次。
转换:对原始数据进行变换。可在下拉列表中选 择转换的幂值。 未转换:不对数据进行转换,产生原始数据的散 布图。注:“无”是不产生该选项的图形。
二、按钮对应的界面介绍
统计量对话框
输出前面所讲述的各个描述统计量,并可设置均值的 置信5个最大值与最小值。在输出窗 口被表明为极端值。
“选项”对话 框
输出结果显示5%,10%,25%,50%,75%,90%和95% 的百分位数。
从所有分析中,将因变量或分组变量中带有缺失值的观测 量予以剔除。 从当前分析中,将有缺失值的观测量均予以剔除。
SPSS探索性统计分析整体分析与设计的内容
二、操作
探索性数据分析过程用于计算指定变量的探索性统计量和有关的图 形。从这个过程中可以获得箱图、茎叶图、直方图、各种正态检验 图、频数表、方差齐性检验等结果,以及对非正态或正态非齐性数据 进行变换,以表明和检验连续变量的数值分布情况。
待分析变量,移入右侧。 3)“显示频率表格”,勾选该复选
框,可输出频数分析表。
SPSS频数分析
二、几个重要的设置对话框 “统计量”按钮对应的对话框:
1)四分位数:显示25%、50%、 75%的分位数。 2)割点:勾选后可输入数值A, 将数据平分为A等分。例如,输 入5,表示输出20%、40%、 60%、80%的百分位数。 3)百分位数:选中后,可激活 右侧的文本框和列表。可输入、 更改和删除自定义的百分位数。
幂估计:对每一组数据产生一个中位数的自然对数与四 分位数的自然对数的散列点图,达到方差齐次性要求的 幂次估计;并据此散布图,来估计将各组方差转换成同 方差所需的幂次。
转换:对原始数据进行变换。可在下拉列表中选 择转换的幂值。 未转换:不对数据进行转换,产生原始数据的散 布图。注:“无”是不产生该选项的图形。
二、按钮对应的界面介绍
统计量对话框
输出前面所讲述的各个描述统计量,并可设置均值的 置信5个最大值与最小值。在输出窗 口被表明为极端值。
“选项”对话 框
输出结果显示5%,10%,25%,50%,75%,90%和95% 的百分位数。
从所有分析中,将因变量或分组变量中带有缺失值的观测 量予以剔除。 从当前分析中,将有缺失值的观测量均予以剔除。
SPSS探索性统计分析整体分析与设计的内容
二、操作
探索性数据分析过程用于计算指定变量的探索性统计量和有关的图 形。从这个过程中可以获得箱图、茎叶图、直方图、各种正态检验 图、频数表、方差齐性检验等结果,以及对非正态或正态非齐性数据 进行变换,以表明和检验连续变量的数值分布情况。
第三章描述性统计分析

描述性统计分析指标
统计量可分为两类
一类表示数据的中心位置,例如均值、中位数、众 数等 一类表示数据的离散程度,例如方差、标准差、极 差等用来衡量个体偏离中心的程度。
描述单变量分布的三种方式
用数字呈现一个变量的分布 用表格呈现一个变量的分布 用图形呈现一个变量的分布
Frequencies
在交叉列联表中,除了频数外还引进了各种百分 比。例如表中第一行中的33.3%, 33.3%, 33.3 %分别是高级工程师3人中各学历人数所占的比例 ,称为行百分比(Row percentage),一行的百 分比总和为100%;表中第一列的25.0%,25.0% ,50.0%分别是本科学历4人中各职称人数所占的 比例,称为列百分比(Column percentage), 一列的列百分比总和为100%,表中的6.3%,6.3 %,12.5%等分别是总人数16人中各交叉组中人 数所占的百分比,称为总百分比(Total percentage),所有格子中的总百分比之和也为 100%。
例子
假设我们有以下的三组观测值:
观测A:11,12,13,16,16,17,18,21 观测B:14,15,15,15,16,16,16,17 观测C:11,11,11,12,19,20,20,20
这三组观测值的均值都是15.5,那么这三组数 据是否相似呢?
离散趋势
离散趋势的描述
本科 职称 高 级工 程师 Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total 1 33.3% 25.0% 6.3% 1 25.0% 25.0% 6.3% 2 33.3% 50.0% 12.5% 0 .0% .0% .0% 4 25.0% 100.0% 25.0%
数学建模 统计分析ppt课件

整理版课件
41
不同方法测定的干草磷含量
整理版课件
42
例2:随机选取三种千足虫,测定了不同性别个 体血淋巴中的丙氨酸含量(mg/L),试检验性别和 物种对丙氨酸含量的影响有无显著性差异。
整理版课件
43
1. 单因素方差分析的Matlab实现:
p=anova1(x) % x是样本观测值构成的矩阵,每一列为 一个水平 % p是检验的p-值. % 输出结果除p-值外,还有方差分析表以 及箱形图。
整理版课件
3
2. 描述性统计量
sum(x) mean(x) std(x)
%和 % 均值 % 标准差
var(x) sort(x) median(x)
% 方差 % 顺序统计量 % 中位数
整理版课件
4
skewness(x) % 偏度,正态是0 kurtosis(x) % 峰度,正态是3
Outline
一、描述性统计 二、随机数的生成 三、参数假设检验 四、正态性检验* 五、方差分析 六、回归分析
整理版课件
பைடு நூலகம்
1
一、描述性统计
直方图 均值 标准差 … 偏度 峰度
整理版课件
2
1. 直方图 (histogram) hist(x) hist(x, m) histfit(x, m) % 带正态拟合的直方图
整理版课件
26
3. 检验的水平*
在零假设成立下,重复执行检验过程,考察 零假设被拒绝的概率,这就是犯第一类错误的概 率,即检验的实际水平。
整理版课件
27
clear
n=20;
N=10000;
mu0=0;
for i=1:N
x=randn(1, n);
统计学ppt课件

配对样本非参数检验
包括Wilcoxon符号秩次检验、McNemar检验等,用于比较同一组 样本在两个不同条件下的差异。
多元线性回归模型构建
1 2
多元线性回归模型基本概念 介绍自变量、因变量、误差项等概念,以及模型 的数学表达式。
多元线性回归模型的参数估计 通过最小二乘法等方法估计模型参数,得到回归 方程。
概率可以通过古典概型、几何概型、频率等方法进行计算。古典概型适用于等可能 事件,几何概型适用于连续型随机变量,而频率则是在大量重复试验中出现的相对 频率。
02 描述性统计方法
数值型数据描述
集中趋势度量
01
平均数、中位数、众数
离散程度度量
02
极差、四分位差、方差、标准差
偏态与峰态度量
03
偏度系数、峰度系数
统计学ppt课件
目录
• 统计学基本概念与原理 • 描述性统计方法 • 推论性统计方法 • 非参数检验与多元统计分析 • 实验设计与抽样技术 • 数据可视化与报告撰写技巧
01 统计学基本概念 与原理
统计学定义及作用
统计学的定义
统计学是一门研究如何收集、整理、 分析、解释和呈现数据的科学。
统计学的作用
数据分布形态判断
正态性检验
直方图、QQ图、P-P图、Shapiro-Wilk检验等方 法
对称性检验
通过观察频数分布表或图形判断
峰度与偏度检验
通过计算峰度系数和偏度系数判断
03 推论性统计方法
参数估计原理及应用
点估计与区间估计
利用样本数据对总体参数进行估计,包括点估计和区间估计两种方 法。
估计量的评价标准
3
多元线性回归模型的假设检验 对模型参数进行显著性检验,判断自变量对因变 量的影响是否显著。
包括Wilcoxon符号秩次检验、McNemar检验等,用于比较同一组 样本在两个不同条件下的差异。
多元线性回归模型构建
1 2
多元线性回归模型基本概念 介绍自变量、因变量、误差项等概念,以及模型 的数学表达式。
多元线性回归模型的参数估计 通过最小二乘法等方法估计模型参数,得到回归 方程。
概率可以通过古典概型、几何概型、频率等方法进行计算。古典概型适用于等可能 事件,几何概型适用于连续型随机变量,而频率则是在大量重复试验中出现的相对 频率。
02 描述性统计方法
数值型数据描述
集中趋势度量
01
平均数、中位数、众数
离散程度度量
02
极差、四分位差、方差、标准差
偏态与峰态度量
03
偏度系数、峰度系数
统计学ppt课件
目录
• 统计学基本概念与原理 • 描述性统计方法 • 推论性统计方法 • 非参数检验与多元统计分析 • 实验设计与抽样技术 • 数据可视化与报告撰写技巧
01 统计学基本概念 与原理
统计学定义及作用
统计学的定义
统计学是一门研究如何收集、整理、 分析、解释和呈现数据的科学。
统计学的作用
数据分布形态判断
正态性检验
直方图、QQ图、P-P图、Shapiro-Wilk检验等方 法
对称性检验
通过观察频数分布表或图形判断
峰度与偏度检验
通过计算峰度系数和偏度系数判断
03 推论性统计方法
参数估计原理及应用
点估计与区间估计
利用样本数据对总体参数进行估计,包括点估计和区间估计两种方 法。
估计量的评价标准
3
多元线性回归模型的假设检验 对模型参数进行显著性检验,判断自变量对因变 量的影响是否显著。
《统计学》完整ppt课件

秩和检验的应用场景
适用于等级资料或无法精确测量的数据,如医学 领域的疗效评价、心理学中的量表评分等。
3
秩和检验的优缺点
优点在于对数据分布的假设较为宽松,适用范围 广;缺点是当样本量较大时,检验效率可能降低 。
符号检验
符号检验的基本原理
通过比较样本数据的中位数或均值与某个参考值的大小关 系,判断总体分布是否存在显著差异。
推论性统计分析
介绍如何在Excel中进行推论性统计分析, 如假设检验、方差分析等。
Python编程实现统计分析案例展示
Python统计分析库介绍
数据处理与可视化
简要介绍Python中常用的统计分析库,如 NumPy、Pandas、SciPy等。
演示如何使用Python进行数据清洗、处理 及可视化,包括缺失值处理、异常值检测 等。
相关分析与回归分析
相关分析
研究两个或多个变量之间相关关系的统计分析方法,通过计算相关系数来衡量变量之间 的相关程度。
回归分析
研究因变量与一个或多个自变量之间关系的统计分析方法,通过建立回归模型来预测因 变量的取值。
04
CATALOGUE
非参数统计方法
卡方检验
卡方检验的基本原理
通过比较实际观测值与理论期望值之间的差异,判断两个或多个分 类变量之间是否存在显著关联。
03
CATALOGUE
推论性统计方法
参数估计方法
点估计
用样本统计量直接作为总体参数的估计值。
区间估计
根据样本统计量和抽样分布,构造一个包含总体参数的真值的置信区间,并给出该区间被总体参数真值覆盖的概 率。
假设检验原理及步骤
假设检验的基本原理
先对总体参数提出一个假设,然后利用样本信息判断这一假设是否合理,即判断总体参数与假设值是 否有显著差异。
适用于等级资料或无法精确测量的数据,如医学 领域的疗效评价、心理学中的量表评分等。
3
秩和检验的优缺点
优点在于对数据分布的假设较为宽松,适用范围 广;缺点是当样本量较大时,检验效率可能降低 。
符号检验
符号检验的基本原理
通过比较样本数据的中位数或均值与某个参考值的大小关 系,判断总体分布是否存在显著差异。
推论性统计分析
介绍如何在Excel中进行推论性统计分析, 如假设检验、方差分析等。
Python编程实现统计分析案例展示
Python统计分析库介绍
数据处理与可视化
简要介绍Python中常用的统计分析库,如 NumPy、Pandas、SciPy等。
演示如何使用Python进行数据清洗、处理 及可视化,包括缺失值处理、异常值检测 等。
相关分析与回归分析
相关分析
研究两个或多个变量之间相关关系的统计分析方法,通过计算相关系数来衡量变量之间 的相关程度。
回归分析
研究因变量与一个或多个自变量之间关系的统计分析方法,通过建立回归模型来预测因 变量的取值。
04
CATALOGUE
非参数统计方法
卡方检验
卡方检验的基本原理
通过比较实际观测值与理论期望值之间的差异,判断两个或多个分 类变量之间是否存在显著关联。
03
CATALOGUE
推论性统计方法
参数估计方法
点估计
用样本统计量直接作为总体参数的估计值。
区间估计
根据样本统计量和抽样分布,构造一个包含总体参数的真值的置信区间,并给出该区间被总体参数真值覆盖的概 率。
假设检验原理及步骤
假设检验的基本原理
先对总体参数提出一个假设,然后利用样本信息判断这一假设是否合理,即判断总体参数与假设值是 否有显著差异。
《管理统计学》焦建玲 第03章 描述性统计分析

第三章 描述性统计分析
3.1 统计数据整理与显示
频数分布
【例3-1】以下是一个班级60名学生数学期末考试成绩,请编制 组距式变量数列。 90 78 81 64 83 75 78 79 81 82 91 93 95 94 84 64 61 87 70 60 20 65 77 73 78 92 88 73 86 73 64 76 71 67 63 69 70 89 90 83 74 79 76 99 75 38 55 82 93 98 85 78 89 66 71 84 70 68 72 80
第三章 描述性统计分析
3.1 统计数据整理与显示
统计分组
统计分组是根据统计研究的任务的要求和现象总体的内 在特点,按照一定的标志,将统计总体区分为不同类型或 不同性质的若干组成部分。这些组成部分中的每一个部分 就叫做一个分组,通过分组把总体内部不同性质的单位分 开,把性质相同的单位归并在一个组内,说明总体内部各 组之间的相互关系及其特征。
下限公式: 上限公式:
Me L
fi 2 Sm1 h fm
Me U
fi 2 Sm1 h fm
第三章 描述性统计分析
3.1 统计数据整理与显示
【例3-2】某高校随机抽取300名学生的身高样本资料,
并根据研究需求对样本进行分组,数据如表3-4所示,试
计算该校学生身高的中位数。
表3-4 某高校学生身高样本数据
第三章 描述性统计分析
3.1 统计数据整理与显示
频数分布
组限的具体形式有间断组限和重合组限,开口组限和闭口组限。 例如:企业职工按年龄分组,其 组限可表示为:30岁以下,30~39 岁,40~49岁,50~59岁,60岁以 上。
间断组限是每一组的组限与邻组的组限都是间断设置的。
统计学PPTPPT课件

假设检验
零假设和备择假设
零假设是我们要检验的假设,备择假 设是与零假设相对立的假设。
第一类错误和第二类错误
第一类错误是拒绝了正确的零假设, 第二类错误是接受了错误的零假设。
显著性水平
显著性水平表示在零假设为真的情况 下,拒绝零假设的概率。
样本容量和样本误差
样本容量越大,样本误差越小,推断 的准确性越高。
通过观察记录的方式收集数据,适用于小样本的定性研究。
实验法
通过实验的方式控制变量,收集数据,适用于因果关系的研究。
数据的整理和展示
数据整理
对数据进行清洗、分类、 编码等处理,使其符合统 计分析的要求。
数据展示
通过图表、表格等形式展 示数据,以便更好地理解 和分析数据。
数据可视化
利用图形、图像等技术将 数据可视化,以便更直观 地展示数据的特征和关系。
在生物统计学中,统计学方法用于遗 传学、分子生物学等领域的研究。
在商业决策中的应用
市场调查
通过统计学方法进行市场调查,了解客户需 求和市场趋势。
预测分析
利用统计学方法进行销售预测、需求预测等, 为决策提供依据。
质量控制
通过统计学方法监控生产过程,确保产品质 量符合标准。
风险评估
统计学用于评估商业风险,如信用评级、投 资组合优化等。
010203定量数据数值型数据,如身高、体 重、年龄等,可以通过测 量或计数得到。
定性数据
非数值型数据,如性别、 婚姻状况、文化程度等, 通常通过分类或编码得到。
数据来源
数据可以来源于调查、观 察、实验、档案资料等途 径。
数据收集的方法
调查法
通过问卷、访谈等方式收集数据,适用于大样本的定量研究。
统计数据描述性分析PPT课件

识别异常值
描述性统计可以帮助我们 识别异常值,即远离数据 集中心的值,这些值可能 会对数据分析产生影响。
提供决策依据
通过描述性统计,我们可 以了解数据的总体情况, 为进一步的数据分析提供 决策依据。
描述性统计的常用指标
01
02
03
04
均值
均值是数据集中所有数值的和 除以数值的数量,用于表示数
据的集中趋势。
通过实地观察记录数据, 适用于难以通过问卷等
方式获取的数据。
通过实验设计获取数据, 适用于需要控制变量的
实验研究。
通过查阅文献资料获取 数据,适用于历史数据 或无法直接获取的数据。
数据整理的步骤
数据清洗
去除重复、错误或不完整的数 据,确保数据质量。
数据分类
将数据按照一定的标准进行分 类,便于后续分析。
散点图
总结词
用于展示两个变量之间的关系,体现变量之间的关联程度
详细描述
散点图通过将数据点在坐标系上标出并连接成线来展示两个 变量之间的关系,能够反映变量之间的关联程度和趋势。适 用于展示两个变量之间的相关性分析。
05 数据的数值描述
数据的集中趋势描述
平均数
表示数据的集中趋势,计算所有数值的和除以数 值的数量。
样本代表性
在选择样本时,要确保样本具有代表性,能 够反映总体情况。
结论的可信度
在分析过程中,要注意排除偶然因素和误差 的影响,确保结论的可信度。
07 案例分析
案例一:销售数据描述性分析
总结词
通过销售数据的描述性分析,了解销 售情况,发现潜在问题,为决策提供 依据。
01
02
收集销售数据
收集一定时间段内的销售数据,包括 销售额、销售量、销售渠道、客户信 息等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8
3.2 频率分析
3.2.2 SPSS实例分析
【例3-1】以下是调查问卷中针对被调查人设置的两个问题: 1、您的家庭月收入大约是:(请包括所有工资、奖金、津贴等在内,以人 民币为单位)单选
500-1000……..1
1000-1999……2
2000-2999……3
3000-3999……4
4000-4999……5
6
主要内容
3.1 基本描述性统计量简介 3.2 频率分析 3.3 描述性分析 3.4 探索性分析 3.5 交叉表分析 3.6 多重响应分析
7
3.2 频率分析 3.2.1 基本概念及统计原理
频率就是一个变量在各个变量值上取值的个案数,分析 时不考虑其实际取值。基本统计分析往往从频率分析开始。 通过频率分析能够了解变量取值的状况,对把握数据的分布 特征是非常有用的。 经过频率分析可以得到如下结果: (1)频率分布表:该表中包含频率、各频率占总样本数的 百分比、有效百分比、累计百分比。 (2)统计图:用统计图形展示变量的取值状况,频率分析 中提供的统计图形可以是条形图、饼图或者直方图。
第三章 1
描述性统计分析
主要内容
3.1 基本描述性统计量简介 3.2 频率分析 3.3 描述性分析 3.4 探索性分析 3.5 交叉表分析 3.6 多重响应分析
2
3.1 基本描述性统计量简介
3.1.1 描述集中趋势的统计量
1.均值(Mean) 2.众数(Mode) 3.中位数(Median) 4.总和(Sum) 5.百分位数(Percentile Value)
大专/大学非本科/高职高专……4
大学本科……………………….5
研究生及以上…………………..6
从问卷中收集到的数据如表3.1所示 , 试对收集到的数据进行频数分析
9
3.2 频率分析
第1步 数据组织:根据表3.1生成SPSS 数据文件,建2个变量:“收入”、“教 育”, 度量标准均为序号。 第2步 频率分析设置: 选择菜单:“分析→ 描述统计 → 频率”,
3.2 频数分析
变量“收入”的频率分布表
有效 0 1 2 3 4 5 6 7 8 9 10 11 合计
频率 2
收入
有效百分 累积百分
百分比
比
比
.2
.2
.2
87
10.4
10.4
10.6
152
18.2
18.2
28.8
157
18.8
18.8
47.6
137
16.4
16.4
64.0
88
10.5
10Байду номын сангаас5
74.5
3
3.1 基本描述性统计量的定义及计算
3.1.2 描述离散程度的统计量
1.样本方差(Variance) 2.样本标准差(Std. deviation) 3.极差(Range) 4.均值标准误差(Standard Error of Mean)
4
3.1 基本描述性统计量的定义及计算
3.1.3 描述总体分布形态的统计量
打开“频率(F)”对话框,将“教育”和 “收入”加入到“变量”列表框中。 打开“统计量”对话框,选中“百分位数”
“众数”,并在“百分位数”中添加30.0、 60.0、90.0; 打开“图表”对话框,选中“直方图”及后 面的复选框
10
表3.1
家庭月收入 受教育程度
3
5
1
5
2
5
1
5
1
5
…
…
6
4
10
5
5000-5999……6
6000-6999……7 9000-9999……10
7000-7999……8 10000及以上…11
8000-8999……9
2、 您的教育程度:(指您受过的最高或正在接受的教育程度)单选
没有受过正式教育/小学……….1
初中……………………..………2
高中/中专/技校… ……… ……..3
85
10.2
10.2
84.7
52
6.2
6.2
90.9
27
3.2
3.2
94.1
9
1.1
1.1
95.2
8
1.0
1.0
96.2
32
3.8
3.8
100.0
836
100.0
100.0
12
表中显示了变量“收入”在各个 取值上出现的次数(频率)、其 频率占所有个案中的百分比、有 效百分比及累积百分比。
3.2 频数分析
4
5
3.2 频率分析
第3步 主要结果及分析:
统计量表
表中分别显示两个分析变量“教 育”及“收入”的有效个案数、 缺失值个数、及两个分析变量的 “众数”及对应于30%、60%及 90%的百分位数 。
变量“教育”的频率分布表
有效 1 2 3 4 5 6 合计
缺失 系统 合计
教育
有效百分 累积百分
频率 百分比
14
3.3 描述性分析 3.3.1 基本概念及统计原理
描述性分析主要用于输出变量的各类描述性统计量 的值,通过上一节的学习可知,频率分析同样可以做到, 都是以计算数值型单变量的统计量为主。描述性统计分析 没有图形功能,也不能生成频率表,但描述性分析可以将 原始数据标准化为Z分数,并以变量形式存入数据文件中, 以便后续分析时应用。
比
比
8
1.0
1.0
1.0
39
4.7
4.7
5.6
114
13.6
13.7
19.3
165
19.7
19.8
39.0
456
54.5
54.6
93.7
53
6.3
6.3 100.0
835
99.9 100.0
1
.1
11
836 100.0
表中显示了变量“教育”在各个 取值上出现的次数(频率)、其 频率占所有个案中的百分比、有 效百分比及累积百分比。
的统计量;峰度系数等于0,表明数据分布的陡峭程度与正 态分布相同。峰度系数大于0时为尖峰分布,表明数据分布 的陡峭程度比正态分布大,峰度系数小于0时为平峰分布, 表明数据分布的陡峭程度比正态分布小。
5
3.1 基本描述性统计量的定义及计算 3.1.3 描述总体分布形态的统计量
来自于正态总体的偏度及峰度均近似为0,可以利用偏 度和峰度的值是否接近0作为检验是否是正态分布的重要依 据。
变量“教育”的直方图
变量“收入”的直方图
表中显示了变量“教育”的直方 图,从图上可以看出受访者教育 程度同正态分布相比左偏,不具 备明显的正态分布。
表中显示了变量“收入”的直方 图,从图上可以看出受访者家庭 收入同正态分布相比右偏,不具 备明显的正态分布。
13
主要内容
3.1 基本描述性统计量简介 3.2 频率分析 3.3 描述性分析 3.4 探索性分析 3.5 交叉表分析 3.6 多重响应分析
1. 偏度(Skewness):是描述取值分布形态对称性
的统计量;偏度系数大于0,表示其数据分布形态有一条长 尾拖在右边,称为右偏或正偏,偏度系数小于0,表示其数据 分布形态有一条长尾拖在左边,称为左偏或负偏。偏度系数 的绝对值越大,与正态分布相比越偏斜。
2. 峰度(Kurtosis):是描述变量取值分布形态陡缓
3.2 频率分析
3.2.2 SPSS实例分析
【例3-1】以下是调查问卷中针对被调查人设置的两个问题: 1、您的家庭月收入大约是:(请包括所有工资、奖金、津贴等在内,以人 民币为单位)单选
500-1000……..1
1000-1999……2
2000-2999……3
3000-3999……4
4000-4999……5
6
主要内容
3.1 基本描述性统计量简介 3.2 频率分析 3.3 描述性分析 3.4 探索性分析 3.5 交叉表分析 3.6 多重响应分析
7
3.2 频率分析 3.2.1 基本概念及统计原理
频率就是一个变量在各个变量值上取值的个案数,分析 时不考虑其实际取值。基本统计分析往往从频率分析开始。 通过频率分析能够了解变量取值的状况,对把握数据的分布 特征是非常有用的。 经过频率分析可以得到如下结果: (1)频率分布表:该表中包含频率、各频率占总样本数的 百分比、有效百分比、累计百分比。 (2)统计图:用统计图形展示变量的取值状况,频率分析 中提供的统计图形可以是条形图、饼图或者直方图。
第三章 1
描述性统计分析
主要内容
3.1 基本描述性统计量简介 3.2 频率分析 3.3 描述性分析 3.4 探索性分析 3.5 交叉表分析 3.6 多重响应分析
2
3.1 基本描述性统计量简介
3.1.1 描述集中趋势的统计量
1.均值(Mean) 2.众数(Mode) 3.中位数(Median) 4.总和(Sum) 5.百分位数(Percentile Value)
大专/大学非本科/高职高专……4
大学本科……………………….5
研究生及以上…………………..6
从问卷中收集到的数据如表3.1所示 , 试对收集到的数据进行频数分析
9
3.2 频率分析
第1步 数据组织:根据表3.1生成SPSS 数据文件,建2个变量:“收入”、“教 育”, 度量标准均为序号。 第2步 频率分析设置: 选择菜单:“分析→ 描述统计 → 频率”,
3.2 频数分析
变量“收入”的频率分布表
有效 0 1 2 3 4 5 6 7 8 9 10 11 合计
频率 2
收入
有效百分 累积百分
百分比
比
比
.2
.2
.2
87
10.4
10.4
10.6
152
18.2
18.2
28.8
157
18.8
18.8
47.6
137
16.4
16.4
64.0
88
10.5
10Байду номын сангаас5
74.5
3
3.1 基本描述性统计量的定义及计算
3.1.2 描述离散程度的统计量
1.样本方差(Variance) 2.样本标准差(Std. deviation) 3.极差(Range) 4.均值标准误差(Standard Error of Mean)
4
3.1 基本描述性统计量的定义及计算
3.1.3 描述总体分布形态的统计量
打开“频率(F)”对话框,将“教育”和 “收入”加入到“变量”列表框中。 打开“统计量”对话框,选中“百分位数”
“众数”,并在“百分位数”中添加30.0、 60.0、90.0; 打开“图表”对话框,选中“直方图”及后 面的复选框
10
表3.1
家庭月收入 受教育程度
3
5
1
5
2
5
1
5
1
5
…
…
6
4
10
5
5000-5999……6
6000-6999……7 9000-9999……10
7000-7999……8 10000及以上…11
8000-8999……9
2、 您的教育程度:(指您受过的最高或正在接受的教育程度)单选
没有受过正式教育/小学……….1
初中……………………..………2
高中/中专/技校… ……… ……..3
85
10.2
10.2
84.7
52
6.2
6.2
90.9
27
3.2
3.2
94.1
9
1.1
1.1
95.2
8
1.0
1.0
96.2
32
3.8
3.8
100.0
836
100.0
100.0
12
表中显示了变量“收入”在各个 取值上出现的次数(频率)、其 频率占所有个案中的百分比、有 效百分比及累积百分比。
3.2 频数分析
4
5
3.2 频率分析
第3步 主要结果及分析:
统计量表
表中分别显示两个分析变量“教 育”及“收入”的有效个案数、 缺失值个数、及两个分析变量的 “众数”及对应于30%、60%及 90%的百分位数 。
变量“教育”的频率分布表
有效 1 2 3 4 5 6 合计
缺失 系统 合计
教育
有效百分 累积百分
频率 百分比
14
3.3 描述性分析 3.3.1 基本概念及统计原理
描述性分析主要用于输出变量的各类描述性统计量 的值,通过上一节的学习可知,频率分析同样可以做到, 都是以计算数值型单变量的统计量为主。描述性统计分析 没有图形功能,也不能生成频率表,但描述性分析可以将 原始数据标准化为Z分数,并以变量形式存入数据文件中, 以便后续分析时应用。
比
比
8
1.0
1.0
1.0
39
4.7
4.7
5.6
114
13.6
13.7
19.3
165
19.7
19.8
39.0
456
54.5
54.6
93.7
53
6.3
6.3 100.0
835
99.9 100.0
1
.1
11
836 100.0
表中显示了变量“教育”在各个 取值上出现的次数(频率)、其 频率占所有个案中的百分比、有 效百分比及累积百分比。
的统计量;峰度系数等于0,表明数据分布的陡峭程度与正 态分布相同。峰度系数大于0时为尖峰分布,表明数据分布 的陡峭程度比正态分布大,峰度系数小于0时为平峰分布, 表明数据分布的陡峭程度比正态分布小。
5
3.1 基本描述性统计量的定义及计算 3.1.3 描述总体分布形态的统计量
来自于正态总体的偏度及峰度均近似为0,可以利用偏 度和峰度的值是否接近0作为检验是否是正态分布的重要依 据。
变量“教育”的直方图
变量“收入”的直方图
表中显示了变量“教育”的直方 图,从图上可以看出受访者教育 程度同正态分布相比左偏,不具 备明显的正态分布。
表中显示了变量“收入”的直方 图,从图上可以看出受访者家庭 收入同正态分布相比右偏,不具 备明显的正态分布。
13
主要内容
3.1 基本描述性统计量简介 3.2 频率分析 3.3 描述性分析 3.4 探索性分析 3.5 交叉表分析 3.6 多重响应分析
1. 偏度(Skewness):是描述取值分布形态对称性
的统计量;偏度系数大于0,表示其数据分布形态有一条长 尾拖在右边,称为右偏或正偏,偏度系数小于0,表示其数据 分布形态有一条长尾拖在左边,称为左偏或负偏。偏度系数 的绝对值越大,与正态分布相比越偏斜。
2. 峰度(Kurtosis):是描述变量取值分布形态陡缓