描述性统计分析文稿演示

合集下载

描述性统计分析

描述性统计分析

统计分析本次问卷调查主要是广大的游客为主要的对象,采用的是网上发放问卷的形式,主要借助的是问卷星网站这个平台。

此次问卷总计发放了420份,回收问卷388份,回收率达到92.38%,回收问卷有效率为92.38%,在问卷星的设计中提交前提是完成问卷,因此回收问卷都为有效问卷。

本部分将根据对有效问卷的统计,对所得数据进行相关的数据分析。

描述性统计分析描述性统计(DescriPtivestatistics)是对统计结构和总体情况所进行的描述,本部分将对游客基本信息进行描述性统计分析。

游客基本信息描述性统计分析游客的基本信息主要包括,第一部分关于游客的人口统计学信息,包括游客的性别、年龄、受教育程度、职业、收入等;第二部分是关于游客在姨奶奶中的旅游次数的一个简单的统计。

表____反映了这一系列的基本信息。

从性别上看,男女比例基本持平,其中女性游客稍占多数51.5%,男性游客占48.5%,女性游客的平均人数比男性游客稍微多一些;从年龄上看,主要集中在18~25岁这个年龄段上,占到了游客总数的91.2%,这说明了青少年时目前旅游人群的主要构成部分,这一方面和现当代的生活水平,价值观、消费观有密切的联系。

从学历上看,游客的学历主要集中在高中、本科及以上这三块,分别占到这次调查样本数的11.9%、78.9%、6.2%。

充分证明对待旅游的看法和学历的高低是一个正相关的关系。

从职业上看,学生占到了最多的一个比例64.9%,比其他的职业人群高出很多,公司职员在其中也占到了13.4%,在这一点上有力的证明了在影响旅游愿景的因素中,时间是一个相当大的权重,个体其实在经济实力这一权重来看是比较具有优势的一个群体,但是在这次调查中仅占了 2.6%,从这一方面也可以得出时间是一个较大权重的结论;从收入状况上看,主要集中在1400~3000和3000~5000这两个段的人群,分别达到67%和19.6%,这印证了旅游公共服务的不断健全和旅游的逐步平民化。

实验三 描述性统计分析20191010

实验三 描述性统计分析20191010

4
49
5
0
注从意这:个在图制可作以茎直叶观图的时看,出重: 复出现的数据要重复记录,不能遗漏, 特该别运是动“员叶中”位部数分、;众同数一都数在据2出0和现4几0之次间,,就且要呈在"图单中峰体"状现几次.
且分布较对称,集中程度高,说明其发挥比较稳定.
7、QQ图和QQ趋势图
QQ趋势图主要描述观察数值的离散趋势,从中可以发现异常点及观察数 值的变化趋势
Z变换(标准正态变换):
zi

xi
S
x
其中 x 表变量的均值,S表变量的标准差。如果选择该项,
则数据文件中将自动生成一列名为“Z+原变量名”的新
变量。

变换前
变换后
2.4 探索性分析——Explore
• 与前面介绍的两个过程相比,【Explore】过程更加强大。 • 它除了可以计算常见描述性统计量之外,还可以给出一些简
其中,5% Trimmed Mean:去掉5%极端数之后的均值(排在 最前面和最后面5%的数据都删掉)。
2、M-均值估计——检验异常数据。
3、分位点表
其中Tukey's Hinges表示的是绘制箱图时所用的分位点数据, 它的计算方法和一般的百分位数略有不同。
4、极值表 5、正态性检验
6、茎叶图
• 思路:是将数组中的数按位数进行比较
• 具体化:将数的大小基本不变或变化不大的 位作为一个主干(茎),将变化大的位的数 作为分枝(叶),列在主干的后面,这样就 可以清楚地看到每个主干后面的几个数,每 个数具体是多少。
探究:某篮球运动员在某赛季各场比赛的得分情况如 下:12,15,24,25,31,31,36,36,37,39,44, 49,50

最新第2讲.SPSS描述性统计分析PPT课件

最新第2讲.SPSS描述性统计分析PPT课件
一、操作(实践数据:产品的销售量.sav) 1)菜单“分析→描述统计→频率”。 2)对话框中,左侧选择一个或多个
待分析变量,移入右侧。 3)“显示频率表格”,勾选该复选
框,可输出频数分析表。
SPSS频数分析
二、几个重要的设置对话框 “统计量”按钮对应的对话框:
1)四分位数:显示25%、50%、 75%的分位数。 2)割点:勾选后可输入数值A, 将数据平分为A等分。例如,输 入5,表示输出20%、40%、 60%、80%的百分位数。 3)百分位数:选中后,可激活 右侧的文本框和列表。可输入、 更改和删除自定义的百分位数。
幂估计:对每一组数据产生一个中位数的自然对数与四 分位数的自然对数的散列点图,达到方差齐次性要求的 幂次估计;并据此散布图,来估计将各组方差转换成同 方差所需的幂次。
转换:对原始数据进行变换。可在下拉列表中选 择转换的幂值。 未转换:不对数据进行转换,产生原始数据的散 布图。注:“无”是不产生该选项的图形。
二、按钮对应的界面介绍
统计量对话框
输出前面所讲述的各个描述统计量,并可设置均值的 置信5个最大值与最小值。在输出窗 口被表明为极端值。
“选项”对话 框
输出结果显示5%,10%,25%,50%,75%,90%和95% 的百分位数。
从所有分析中,将因变量或分组变量中带有缺失值的观测 量予以剔除。 从当前分析中,将有缺失值的观测量均予以剔除。
SPSS探索性统计分析整体分析与设计的内容
二、操作
探索性数据分析过程用于计算指定变量的探索性统计量和有关的图 形。从这个过程中可以获得箱图、茎叶图、直方图、各种正态检验 图、频数表、方差齐性检验等结果,以及对非正态或正态非齐性数据 进行变换,以表明和检验连续变量的数值分布情况。

第三章描述性统计分析

第三章描述性统计分析

描述性统计分析指标

统计量可分为两类


一类表示数据的中心位置,例如均值、中位数、众 数等 一类表示数据的离散程度,例如方差、标准差、极 差等用来衡量个体偏离中心的程度。
描述单变量分布的三种方式

用数字呈现一个变量的分布 用表格呈现一个变量的分布 用图形呈现一个变量的分布
Frequencies

在交叉列联表中,除了频数外还引进了各种百分 比。例如表中第一行中的33.3%, 33.3%, 33.3 %分别是高级工程师3人中各学历人数所占的比例 ,称为行百分比(Row percentage),一行的百 分比总和为100%;表中第一列的25.0%,25.0% ,50.0%分别是本科学历4人中各职称人数所占的 比例,称为列百分比(Column percentage), 一列的列百分比总和为100%,表中的6.3%,6.3 %,12.5%等分别是总人数16人中各交叉组中人 数所占的百分比,称为总百分比(Total percentage),所有格子中的总百分比之和也为 100%。
例子

假设我们有以下的三组观测值:

观测A:11,12,13,16,16,17,18,21 观测B:14,15,15,15,16,16,16,17 观测C:11,11,11,12,19,20,20,20

这三组观测值的均值都是15.5,那么这三组数 据是否相似呢?
离散趋势
离散趋势的描述
本科 职称 高 级工 程师 Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total 1 33.3% 25.0% 6.3% 1 25.0% 25.0% 6.3% 2 33.3% 50.0% 12.5% 0 .0% .0% .0% 4 25.0% 100.0% 25.0%

实验五描述性统计分析

实验五描述性统计分析

第二篇 数据分析基础实验五 描述性统计分析实验目的:了解相关系数和偏相关系数的计算方法。

实验工具:SPSS 描述性统计分析菜单项。

知识准备:一、统计整理统计整理是根据统计研究的目的,对统计调查所获得的大量原始资料(初级资料),进行科学的分类和汇总,使之条理化、系统化,得出能够反映现象总体特征的综合资料的工作过程。

统计整理的结果为统计表与统计图。

统计表主要表现为频数表,而统计图的表现形式多样,前面已经介绍了各种统计图的制作方法,此处不在专门进行介绍。

二、集中趋势的测量集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。

集中趋势主要依赖各种平均指标进行反映。

1、算术平均数算术平均数又称为均值,其定义为:设1X ,2X ,…,n X 是取自某总体的一个样本,它的算术平均数∑==ni i X n X 11算术平均数有四个重要性质:①各变量值与平均数离差之和等于零;②各个变量值与平均数离差平方和为最小值;③常数的算术平均数是其本身;④对于任何两个变量x 和y ,它们的代数和的算术平均数就等于两个变量的算术平均数的代数和。

2、调和平均数调和平均数是根据标志值的倒数计算的,它是标志值倒数的算术平均数的倒数。

调和平均数的计算公式为:使用调和平均数要注意三个问题:①变量X 的取值不能为零,因为零不能作为分母,此时调和平均数无法计算;②调和平均数与算术平均数一样,易受极端值的影响③调和平均数只适用于特殊的数据情况,所以要注意区分它的适用条件。

在SPSS 中,调和平均数可以在Report 子菜单的4个报表过程中计算输出。

3、几何平均数几何平均数是n 个变量值乘积的n 次方根。

凡是现象的连乘积等于现象的总比率或总速度都可用几何平均数来计算它们的平均比率和平均速度。

其计算公式为:n n n x x x x x G ∏=⋅⋅⋅⋅= (321)式中:标志值个数。

连乘符号;各个标志值;数;几何平均------------∏n x G在SPSS 中,几何平均数可以在Report 子菜单的4个报表过程中计算输出。

实验一、变量的描述性统计分析

实验一、变量的描述性统计分析

【实验名称】实验一、变量的描述性统计分析【实验目的】1、掌握在Eviews中建立工作文件的方法;2、掌握单变量序列的描述统计分析;3、利用有关命令,进行多变量的相关分布,会绘制多变量的散点图。

【实验内容】P42-练习题2:查找近二十年来我国财政收入和国内生产总值的数据,利用EViews软件分别以菜单方式和命令方式建立EViews文件,并进行初步的描述性分析。

【实验步骤及结果】一、查找原始数据:在网上查找到1978年-2008年我国财政收入和国内生产总值的数据,将其复制粘贴制作成EXCEL。

EXCEL如下所示:二、导入数据:打开Eviews,点击菜单中的下拉依次选择,,如下图所示。

输出如下图对话框,选择相应的文件,点击打开,再点击finish按钮即可。

得到如下的财政收入y和国内生产总值gdp的数据表:三、单个序列的分析:(1)、折线图:在对话框内输入line语句:依次得到如下财政收入y和国内生产总值gdp单个和合起来的折线图如下所示:从上图中我们可以看出财政收入y和国内生产总值gdp都随着时间不断增长,且存在一定的趋势性。

(2)、直方图:在对话框内输入bar语句:得到如下财政收入y和国内生产总值gdp的直方图如下所示:从上图中我们同样可以看出财政收入y和国内生产总值gdp都随着时间不断增长,且存在一定的趋势性。

(3)、P值:在对话框内输入hist语句:得到如下财政收入y和国内生产总值gdp的描述性统计图:从上图中可知财政收入y的均值是11703.27,中位数是4348.95,最大值是61330.35,最小值是1132.26,标准差是15425.52,偏度是1.86,峰度是5.74,P值接近于0。

从P值可知,序列在99%的置信水平下拒绝原假设,即财政收入y不服从正态分布。

从上图中可知国内生产总值gdp的均值是72289.11,中位数是35333.9,最大值是314045.4,最小值是3645.2,标准差是82654.74,偏度是1.40,峰度是4.22,P值接近于0。

实验三、描述性统计分析实验报告

实验三、描述性统计分析实验报告

实验三、描述性统计分析实验报告上海对外贸易学院实验报告⼀、实验⽬的和要求1.熟练掌握描述性统计分析的基本原理2.熟练掌握频数分析原理、SPSS操作及案例分析3.熟练掌握基本描述统计量原理、SPSS操作及案例分析4.熟练掌握探索性分析原理、SPSS操作及案例分析5.熟练掌握原理交叉列联表原理、SPSS操作及案例分析6.熟练掌握多选项分析的SPSS操作及案例分析⼆、实验内容及结果分析1.频数分析(数据⽂件:3-studentscore.sav)(1)完成各门成绩的统计结果(抓图后复制到下⾯)图1分析解释:(2)完成语⽂成绩区间频度分布表(抓图后复制到下⾯)图2分析解释:(3)计算全部学⽣各门成绩的平均值、标准差、极差和四分位数(抓图后复制到下⾯)图3分析解释:2.基本描述统计量(数据⽂件:3-studentscore.sav)计算全部学⽣各部门成绩的平均值、标准差、最⼤值和最⼩值(抓图后复制到下⾯)图4分析解释:3.探索性分析(数据⽂件:3-studentscore.sav)(1)完成语⽂成绩茎叶图和箱图(抓图后复制到下⾯)图5分析解释:图6分析解释:(2)语⽂成绩正态分布检验的Q-Q概率图(抓图后复制到下⾯)(数据⽂件:4-Explore.sav)图7分析解释:(3)完成考察学⽣“英语”、“数学”、“语⽂”三门课程成绩的分布、极端值以及正态分布性和⽅差的齐性。

(抓图后复制到下⾯)图8分析解释:4.交叉列联表分析(数据⽂件:4-crosstabulation.sav)(1)⼆维交叉列联表(P64,抓图后复制到下⾯)图9分析解释:(2)X2检验结果(P671,抓图后复制到下⾯)图10分析解释:三、思考题(P79-P80)完成思考题3、4,并将关健图抓下来粘贴到相应题下⾯,并进⾏简单的解释。

四、学完“描述性统计分析”章节后的收获。

《管理统计学》焦建玲 第03章 描述性统计分析

《管理统计学》焦建玲 第03章 描述性统计分析

第三章 描述性统计分析
3.1 统计数据整理与显示
频数分布
【例3-1】以下是一个班级60名学生数学期末考试成绩,请编制 组距式变量数列。 90 78 81 64 83 75 78 79 81 82 91 93 95 94 84 64 61 87 70 60 20 65 77 73 78 92 88 73 86 73 64 76 71 67 63 69 70 89 90 83 74 79 76 99 75 38 55 82 93 98 85 78 89 66 71 84 70 68 72 80
第三章 描述性统计分析
3.1 统计数据整理与显示
统计分组
统计分组是根据统计研究的任务的要求和现象总体的内 在特点,按照一定的标志,将统计总体区分为不同类型或 不同性质的若干组成部分。这些组成部分中的每一个部分 就叫做一个分组,通过分组把总体内部不同性质的单位分 开,把性质相同的单位归并在一个组内,说明总体内部各 组之间的相互关系及其特征。
下限公式: 上限公式:
Me L
fi 2 Sm1 h fm
Me U
fi 2 Sm1 h fm
第三章 描述性统计分析
3.1 统计数据整理与显示
【例3-2】某高校随机抽取300名学生的身高样本资料,
并根据研究需求对样本进行分组,数据如表3-4所示,试
计算该校学生身高的中位数。
表3-4 某高校学生身高样本数据
第三章 描述性统计分析
3.1 统计数据整理与显示
频数分布
组限的具体形式有间断组限和重合组限,开口组限和闭口组限。 例如:企业职工按年龄分组,其 组限可表示为:30岁以下,30~39 岁,40~49岁,50~59岁,60岁以 上。
间断组限是每一组的组限与邻组的组限都是间断设置的。

统计数据报告中的描述性统计分析

统计数据报告中的描述性统计分析

统计数据报告中的描述性统计分析统计数据报告是对大量数据进行整理和分析的一种形式,旨在总结和揭示数据中的模式、趋势和关系。

而其中的描述性统计分析则是其中重要的一部分,通过对数据进行统计和分析,可以帮助我们更好地理解数据的特征和背后的规律。

在本篇文章中,将从六个方面进行详细论述,介绍统计数据报告中的描述性统计分析。

一、数据的基本描述1. 样本量:描述数据的数量包括样本总量和每个观测变量的观测数量。

2. 平均数:平均数是最常用的统计指标,用于描述一组数据的中心趋势。

3. 中位数:中位数是按照从小到大的顺序排列数据后位于中间位置的数值,用于描述数据的中心位置。

4. 众数:众数是一组数据中出现次数最多的数值,用于描述数据的集中趋势。

5. 极差:极差是一组数据中最大值与最小值之间的差异,用于描述数据的变异程度。

6. 方差和标准差:方差是数值与平均数之间差异的平方和的平均值,标准差是方差的平方根,用于描述数据的离散程度。

二、数据的分布情况1. 频数分布表:频数分布表将数据分成若干个类别,统计每个类别中数据出现的次数,帮助我们了解数据的分布情况。

2. 直方图:直方图是一种用矩形表示不同类别频数的图表,直观地展示了数据的分布情况。

3. 箱线图:箱线图以五数概括(最小值、下四分位数、中位数、上四分位数、最大值)和异常值的方式展示了数据的分布情况。

三、数据的关系分析1. 相关分析:相关分析用来研究两个或多个变量之间的相关关系,通过计算相关系数来描述变量之间的线性关系强度和方向。

2. 散点图:散点图可以帮助我们观察到两个变量之间的关系,有助于了解变量之间的线性或非线性相关关系。

3. 回归分析:回归分析是一种用来研究因果关系的技术,可以通过建立回归方程来描述自变量对因变量的影响程度。

四、数据的偏倚度和峰度1. 偏倚度:偏倚度用于度量数据分布的对称性,可以帮助我们了解数据是否存在偏倚。

正偏表示数据右偏,负偏表示数据左偏。

2. 峰度:峰度用于度量数据分布的峰态,可以帮助我们了解数据是否呈现尖峭或平坦的分布形态。

实验一 数据资料的描述性统计分析(Excel应用)

实验一 数据资料的描述性统计分析(Excel应用)

2.3 图表的编辑:误差线的添加
➢ 打开数据系列格式对话框,在“误差线Y”选项卡中,选择显示 方式为“正偏差”,再选择误差量为“自定义”,单击其后数据框 右边的“折叠对话框”按钮,选择误差数据。
绘图区格式 网络线格式 图例格式 数据系列格式
叶绿素含量/%
叶绿素含量/%
图2-4 四个水稻品种类型不同时期的叶绿素含量
练习2
测定5个不同小麦品种 灌浆结实期叶片的蒸 腾速率(右图),
使用Excel软件将测定 结果绘成复式线图( 要求含误差线) 。
日期
品种
5/2 5/9 5/16 5/23 5/30
陕229
5.2 4.8 4.3
3
1
5.1
5 4.6 2.7 0.8
5.4 4.5
4 3.3 1.1
长武134 4.9 4.5 3.6 3.1 0.5
插 入 函 数
1.1 算术平均数的计算
步骤3:设置“函数参数”,在Number1后的框中选定待分析的数据
2. Excel软件的“描述统计”分析工 具
➢ 步骤1:调用菜单“工具”“数据分析”,打开“分析工
具库”对话框,选择“描述统计”工具。
2. Excel软件的“描述统计”分析工 具
➢ 步骤2:打开“描述统计”对话框,设置数据位置(输入区域)、
纸质报告和电子版文件务必在下次实验课之前 提交或发送!
练习1
使用Excel软件分别计算下面两个玉米品种的10 个果穗长度(cm)的平均数和标准差,并用柱形 图 表 示 结 果 。 ( 提 示 : 使 用 函 数 AVERAGE 和 STDEV)
品种 BS24 金皇后
果穗长度 19 21 20 20 18 19 22 21 21 19 16 21 24 15 26 18 20 19 22 19

描述性统计分析ppt文档

描述性统计分析ppt文档
83. 3来自80~8915. 6
5. 6
88. 9
90~100
2
11. 1
11. 1
100.0
Tot al
18 100.0
100.0
二、频数分析
频度分析的扩展功能: Percentile Values(计算分位数)
分位数是变量在不同分为点上的取值。 分位数反映了变量的取值分布状态。
Central Tendency(集中趋势)
16 20.78% 20.78% 100.00%
合计 0-100
77 100.00% 100.00% 100.00%
返回
二、频数分析
3. 频数分析中的统计图 频数分析的基本功能之二:是绘制统计图,统计图能非常清晰直观 地展示变量的取值状况,包括以下三种图:
条形图(Bar Chart): 饼图(Pie Chart): 直方图(Histograms):
二、频数分析
4. SPSS操作及案例 例一:各门成绩统计
(结果保存为: 3-StudentScore_Frenquency.spo)
二、频数分析
4. SPSS操作及案例(数据文件:3-StudentScore.sav) Analyze → Descriptive Statistics→Frequencies…
1 2
二、频数分析
4. SPSS操作及案例(数据文件:3-StudentScore.sav) 例二:语文成绩区间频度分布表
步骤1:对“语文”成绩进行分段 Transform→Recode →Into Different Variables…
(结果保存为:3-StudentScore_成绩分段.sav)
1 2
3

统计数据描述性分析PPT课件

统计数据描述性分析PPT课件

识别异常值
描述性统计可以帮助我们 识别异常值,即远离数据 集中心的值,这些值可能 会对数据分析产生影响。
提供决策依据
通过描述性统计,我们可 以了解数据的总体情况, 为进一步的数据分析提供 决策依据。
描述性统计的常用指标
01
02
03
04
均值
均值是数据集中所有数值的和 除以数值的数量,用于表示数
据的集中趋势。
通过实地观察记录数据, 适用于难以通过问卷等
方式获取的数据。
通过实验设计获取数据, 适用于需要控制变量的
实验研究。
通过查阅文献资料获取 数据,适用于历史数据 或无法直接获取的数据。
数据整理的步骤
数据清洗
去除重复、错误或不完整的数 据,确保数据质量。
数据分类
将数据按照一定的标准进行分 类,便于后续分析。
散点图
总结词
用于展示两个变量之间的关系,体现变量之间的关联程度
详细描述
散点图通过将数据点在坐标系上标出并连接成线来展示两个 变量之间的关系,能够反映变量之间的关联程度和趋势。适 用于展示两个变量之间的相关性分析。
05 数据的数值描述
数据的集中趋势描述
平均数
表示数据的集中趋势,计算所有数值的和除以数 值的数量。
样本代表性
在选择样本时,要确保样本具有代表性,能 够反映总体情况。
结论的可信度
在分析过程中,要注意排除偶然因素和误差 的影响,确保结论的可信度。
07 案例分析
案例一:销售数据描述性分析
总结词
通过销售数据的描述性分析,了解销 售情况,发现潜在问题,为决策提供 依据。
01
02
收集销售数据
收集一定时间段内的销售数据,包括 销售额、销售量、销售渠道、客户信 息等。

第四讲的描述统计演示文稿

第四讲的描述统计演示文稿
p1 p5 p95 p99 q1 q3 max min var Income;
run;
运行结果
第九页,共41页。
可以计算的描述性统计量关键字及其含义见下表。
关键字
所代表的含义
关键字
所代表的含义
n
有效数据记录数
skewness
偏度
nmiss mean std stderr var median mode cv max min sum sumwgt css uss range
1 14 4275.00 2400.00 3305.00
4275.00
1760.00
2 16 2460.00 1740.50 2192.00
2460.00
1080.00
-----------------------------------------------------------------------------------------------------------------
Lower
Upper
R_ID Obs 99th Pctl Quartile Quartile Maximum Minimum -----------------------------------------------------------------------------------------------------------------
第十页,共41页。
缺失数据记录数 均值 标准差 标准误 方差 中位数 众数 变异系数 最大值 最小值 总计 加权值总计 校正平方和 未校正平方和 极差
kurtosis t probt q1 q3 qrange p1 p5 p10 p90 p95 p99 CLM LCLM UCLM
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相对比描述用于对两变量间变量值对比变化的 描述分析,适用于定距型变量。在实际问题中,研究 者有时除了希望了解变量自身的统计特征外,还希望 得到两个变量相对比之间的统计描述。通常,这可以 通过对两个变量做除法形成一个新变量,然后分析新 变量的统计特征来得到(如均值、中位数、标准差、 全距等)。SPSS的Ratio过程除了能够完成上述分析 外,还提供了其他相对比描述指标,大致属于集中趋 势描述指标(Central Tendency)和离散程度描述指标 (Dispersion)的范畴。
⑵ 在Variables(s)框定义要分析的数值型变量,可同时选择多 个变量。 ⑶ 若需将原始数据的标准正态评分存为新变量,则选择Save standardized values as variables选项。 ⑷ 单击【Options】按钮指定计算哪些基本描述性统计量,出 现如图所示的窗口。
【实验案例】 例4-1 测量20台液晶显示器的重量,数据见4-1-1.sav,对其进行 描述性统计分析。
4.4 列联表分析
通过频数分析能够掌握单个变量的数据分布情况。 在实际分析过程中,不仅要了解单变量的分布特征,还 要分析多个变量不同取值下的分布,掌握多变量的联合 分布特征,进而分析变量之间的相互影响和关系。当问 题涉及多个变量时,采用单纯的频数分析方法显然不 够,这时,我们需要借助交叉分组下的频数分析,又称 为列联表分析。
描述性统计分析文稿演示
(优选)描述性统计分析
4.1 描述统计量
常见的描述性统计量主要包括以下3类: 描述变量集中趋势的统计量、描述变量分布 情况的统计量、描述变量离散程度的统计 量。
通常,综合这三类统计量就能够极为准 确和清晰的把握数据的分布特点。
描述变量集中趋势的统计量:
均值Mean:表示变量值的平均水平 中位数Median:一组数据中处于最中间位置的数 众数Mode:一组数据中出现次数最多的数 和Sum:某变量的所有变量值之和
【界面介绍】 ⑴ 选择菜单【Analyze】→【Descriptive Statistics】→ 【Frequencies】,进入频数分析的分析界面,出现如图所 示的窗口。
⑵ 将若干频数分析变量选择到Variables(s)框中;选择Display frequency tables复项表示在结果中输出频数表。
列联表分析的主要任务有两个:
• 第一,根据收集到的样本数据,产生二维或多维交叉 列联表。交叉列联表是两个或多个以上变量交叉分组 后形成的频数分布表。
• 第二,在交叉列联表的基础上,分析两两变量之间是 否具有独立性或一定的相关性。对交叉列联表中的行 变量和列变量之间关系进行分析是列联表分析的第二 个任务。在列联表基础上做进一步分析,可以得到行 变量和列变量之间是否有联系、联系的紧密程度如何 等更深层次的信息。
(4 )单击【Options】按钮,在弹出的子对话框中选择对 缺失值的处理方式,可以是不分析有任一缺失值的记录 (Exclude cases listwise)、不分析计算某统计量时有缺 失值的记录(Exclude cases pairwise),或报告缺失值 (Report values)。
例4-3 已知有某地城市和农村各55名10岁女生身高数 据,数据见文件4-2-1.sav,请利用Explore过程分组分 析。
【界面介绍】
⑴ 选 择 菜 单 【Analyze】→【Descriptive Statistics】→ 【Crosstabs】,进入列联表分析界面。
【实验案例】
例4-4 调查339名45岁以上吸烟习惯与患肺癌的关系,数 据见4-4-1.sav。试问吸烟者与不吸烟者患肺癌的概率是 否有所不同。
4.5 相对比描述
4.2 频数分布表分析
频数分析统计的是每一组中观测点的个数,而不是 考虑其实际取值。
通过频数分析能够了解变量取值的情况,对于把握 数据的分布特征非常有用。当某变量的自然取值是局限 在有限的几个数值中,则频数分析就是统计该变量在各 个取值点的个数分布情况;如果某变量的取值是在某范 围内的离散值,则需要将其取值区域划分为几个取值区 间,频数分析就是统计该变量在各个取值区间观测点个 数的分布情况。
⑶ 单击【Statistics】按钮后弹出Statistics子对话框。
⑷ 单击【Charts】按钮后弹出Charts子对话框。
⑸ 单击【Format】按钮,弹出Format子对话框。该对话框 用于定义输出频数表的格式,在实际中,我们一般采用 默认格式。
• 例4-2 已知有某地110名10岁女生身高数据,数据见文 件4-2-1.sav ,请编制频数表。
在描述性统计分析中,Descriptives过程是连 续资料统计描述应用最多的一个过程,他可对变 量进行描述性统计分析,计算并列出一系列相应 的统计指标。
【界面介绍】
⑴ 选 择 菜 单 【Analyze】→【Descriptive Statistics】→ 【Descriptives】,进入基本描述性统计量的分析界面, 出现如图所示的窗口。
4.3 探索性分析
Explore过程可对变量进行更为深入详尽的描述性统 计分析,主要用于对资料的性质、分布特点等完全不清楚 时,故又称之为探索性分析。
它在一般描述性统计指标的基础上,增加有关数据其他 特征的文字与图形描述,如茎叶图、箱图等,显得更加详 细、全面,有助于用户制定继续分析的方案。
【界面介绍】
描述变量分布情况的统计量
偏度Skewness:描述变量分布的对称程度和方 向。偏度为0表示对称,大于0表示右偏,小于0表 示左偏
峰度Kurtosis:描述变量分布的陡峭程度。峰度为 0表示陡峭程度和正态分布相同,大于0表示比正 态分布陡峭,小于0表示比正态标准差Std.deviation:描述变量关于均值的偏离程度 方差Variance:标准差的平方 极大值Maximum:某变量所有取值的最大值 极小值Minimum:某变量所有取值的最小值 全距Range:某变量极大值与极小值之差 均值的标准误差S.E.mean:均值的标准误差
⑴ 选 择 菜 单 【Analyze】→【Descriptive Statistics】→ 【Explore】,进入探索性分析界面,出现如图所示的 窗口。
(2)单击【Statistics】按钮,弹出Statistics子对话框,如图 所示。该项用于选择所需要的描述统计量。
(3)单击【Plots】按钮,弹出Plots子对话框。该项用于选择 所需要的统计图。
相关文档
最新文档