《统计学—基于SPSS》((03)第3章 数据的描述性分析:概括性度量(S3)
第3章SPSS描述性统计分析

3.1.1 频数分析的基本原理
图3-14 【描述性】对话框
Step 02 在左侧的候选变量列表框中选择“male”和 “female”变量,将其添加至【变量】列表框中,表示它是 进行描述性统计分析的变量,如图3-15所示。
图3-15 选择分析变量
Step 03 单击【选项】按钮,其主要目的是选择需要输出 的描述性统计量,这里除了选择系统默认的统计量外,还勾 选了范围、偏度系数和峰度系数复选框;再单击【继续】按 钮,返回【描述性】对话框,如图3-16所示。 Step 04 单击【确定】按钮完成操作。
图3-13 【描述:选项】对话框
Step 04 在【描述性】对话框中,勾选【将标准化得分另 存为变量】复选框,表示对所选择的每一个变量进行标准化 处理,同时产生相应的Z得分,并作为新变量保存到数据窗 口中。
Step 05 单击【Bootstrap】按钮,弹出如图3-5所示的 【Bootstrap】对话框,在此对话框中可以进行均值、标准 差、方差、偏度和峰度的Bootstrap估计。
图3-17 【探索】对话框
Step 02 在对话框左侧的候选变量列表框中选取一个或多 个待分析变量,将它们移入右侧的【因变量列表】列表框中 ,表示要进行探索性分析的变量。 Step 03 在候选变量列表框中可以选取一个或多个分组变 量,将它们移入右侧的【因子列表】列表框中。分组变量的 选择可以将数据按该变量中的观测值进行分组分析。如果选 择的分组变量不止一个,那么会以分组变量的不同取值进行 组合分组。
SPSS统计分析第3章-描述性统计分析课件

3.4 探索性分析
➢描述性统计量表
科目 成 语 均值 绩文
均值的 95% 置信区间
5% 修整均值 中值 方差 标准差 极小值 极大值 范围 四分位距 偏度 峰度
描述
下限 上限
统计量 69.17
45.63
92.70 69.91 73.50 502.967 22.427
30 95 65 34 -1.085 1.617
打开“描述:选项”对话框,选中“均值”、“标准差” 、“最小值”、“最大值”、“峰度”、“偏度”及显示顺 序的“变量列表”等选项。
SPSS统计分析第3章-描述性统计分析
3.3 描述性分析
第3步 运行结果及分析: 描述性分析结果表
描述统计量
身高
N 极小值 极大值 均值 标准差
偏度
峰度
统计
标准 统计 标准
5
打开“图表”对话框,选中“直方图”及后
4
5
面的复选框
SPSS统计分析第3章-描述性统计分析
3.2 频率分析
第3步 主要结果及分析:
统计量表
统计量ห้องสมุดไป่ตู้
教育
收入
N
有效
缺失
众数
百分位数 30
60
90
835 1 5
4.00 5.00 5.00
836 0 3
3.00 4.00 7.00
变量“教育”的频率分布表
3.3 描述性分析 3.3.1 基本概念及统计原理
描述性分析主要用于输出变量的各类描述性统计量 的值,通过上一节的学习可知,频率分析同样可以做到, 都是以计算数值型单变量的统计量为主。描述性统计分析 没有图形功能,也不能生成频率表,但描述性分析可以将 原始数据标准化为Z分数,并以变量形式存入数据文件中, 以便后续分析时应用。
多媒体课件-商业统计-第五周

n为奇数
n为偶数
2017-1-3
统计学
基于SPSS
中位数的计算
(数据个数为偶数)
【例3—2】 10名学生的考试分数的中位数
3 - 11
2017-1-3
统计学
基于SPSS
四分位数—用3个点等分数据
(quartile)
1. 排序后处于25%和75%位置上的值
25%
QL
25%
25%
QM
25%
统计学
基于SPSS
众数
(mode)
1. 2. 3. 4.
一组数据中出现次数最多的变量值 适合于数据量较多时使用 不受极端值的影响 一组数据可能没有众数或有几个众数
mo
3 - 14 2017-1-3
3.1 水平的描述 3.1.3 水平代表值的选择
统计学
基于SPSS
众数、中位数和平均数的关系
3 - 16
3 - 35
2017-1-3
第 3 章 数据的描述性分析:概括性度量
3.3 分布形状的度量
偏态与峰度
统计学
基于SPSS
数据分布的形状—偏态与峰度
3 - 37
2017-1-3
统计学
基于SPSS 1.
偏态
(skewness)
2. 3.
4.
5.
统计学家K.Pearson于1895年首次提出。是指数据分布 的不对称性 测度统计量是偏态系数(coefficient of skewness) 偏态系数 =0 为对称分布; >0 为右偏分布; <0 为左偏分 布 偏态系数大于 1 或小于 -1 ,为高度偏态分布;偏态系数 在 0.5 ~ 1 或 -1 ~ -0.5 之间,为是中等偏态分布;偏态系 数越接近0,偏斜程度就越低 计算公式
spss3-描述性分析

Descriptive对话框1
分析大学生的人格表现:神经质、内外向、精神质、掩饰度
计算并保存所选变量 的标准化值,公式为
Zi
Xi X S
指定统计量 与输出结果 显示的顺序
Descriptive对话框2
均值 离散趋势
标准差
合计
方差 全距
均值标准误
分布
峰度
偏度
输出顺序
按数据集中变量的排列顺序显示统计量 按变量名字母顺序显示统计量
两种形式的数据分析:
3.1 经过初步统计的数据,已汇总得到各组间的人数,需要先进 行加权,指定加权变量,然后再通过Analyze进行卡方检验
3.2 未处理的二维结构的原始数据,直接通过Analyze进行卡方 检验
3.3 卡方检验过程,通过Crosstabs对话框实现 (Analyze→Descriptive Statistics→Crosstabs)。
检验
相关 定序变量的相关指标
本例中选择chi-square
Crosstabs 对话框
行顺序 升序 降序
本例中选择频数 及频率输出项
频数 观察频数 期望频数
频率 行频率
列频率 总和频率
残差 非标准化 标准化
调整的标准化残差
输 出 结 果 ㈠:
输 出 结 果 ㈡:
示范练习:
(1)男女大学生中独生子女情况有无差异? (2)男女大学生在居住地分布情况有无差异?
(2)父母亲文化程度情况的分析。
2、Descriptives:描述性统计分析
主要用以计算描述集中趋势和离散趋势的 各种统计量,此外还可对变量进行标准化 转换。
描述统计分析过程,可通过Descriptives 对话框(Analyze→Descriptive Statistics→Descriptives) 来具体实现。
第三章---数据的概括性度量PPT课件

vs
s x
.
39
4.3 偏态与峰态的度量
• 4.3.1 偏态及其测度 • 4.3.2 峰态及其测度
.
40
偏态与峰态分布的形状
.
41
偏态(skewness)
1. 统计学家Pearson于1895年首次提出 2. 数据分布偏斜程度的测度
3. 偏态系数=0为对称分布
4. 偏态系数> 0为右偏分布
5. 偏态系数< 0为左偏分布
(Population variance and Standard deviation)
.
34
标准分数(standard score)
1. 也称标准化值 2. 对某一个值在一组数据中相对位置的度量 3. 可用于判断一组数据是否有离群点(outlier) 4. 用于对变量的标准化处理 5. 计算公式为
6. 偏态系数大于1或小于-1,被称为高度偏态分布; 偏态系数在0.5~1或-0.5~-1之间,被认为是中 等偏态分布;偏态系数越接近0,偏斜程度就越 低
第 3 章 数据的概括性度量
• 集中趋势的度量 • 离散程度的度量 • 偏态与峰态的度量
.
1
数据分布的特征
.
2
3.1集中趋势(central tendency)
• 一组数据向其中心值靠拢的倾向和程度 • 测度集中趋势就是寻找数据水平的代表值
或中心值 • 不同类型的数据用不同的集中趋势测度值 • 低层次数据的测度值适用于高层次的测量
4. 按着这一逻辑,如果对n个观测值附加的 约束个数为k个,自由度则为n-k
.
32
5. 样=据本5可。有以当3自个由x数取=值值5,确,即定另x后1一=2,个,x则x1,2=不4x能,2和x自x3=3由有9,取两则值个数,x 比取其如他x1=值6,x2=7,那么x3则必然取2,而不能
数据的概括性度量ppt课件

实例分析
按零件加工数分组
80-90 90-100 100-110 110-120 120-130
合计
人数
3 7 13 5 2
30
组中值
5-
2021精选ppt
25
加权均值 (例题分析)
k
x
xi fi
i 1 k
fi
85 3 95 7 105 13 115 5 125 2 30
i 1
5-
2021精选ppt
2
4.1 集中趋势的度量
4.1.1 众数 4.1.2 中位数和分位数 4.1.3 平均数 4.1.4 众数、中位数和平均数的比较
2021精选ppt
3
集中趋势
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值 4. 低层次数据的测度值适用于高层次的测量数据,但高
原始数据:
分组数据:
5-
2021精选ppt
16
数值型数据的四分位数
(9个数据的算例)
【例1】:9个家庭的人均月收入数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630
排 序: 750 780 850 960 1080 1250 1500
1630 2000
5-
20Байду номын сангаас1精选ppt
34
思考题
假如你是一个公司的采购代理,定期向两个不同的 供应商订货,经过几个月的运营,你发现两个供应 商完成订单所需时间大概为10天,
供应商1完成时间:9,9,10,10,10,10,10, 11,11
第三讲 SPSS的数据描述

Female 均值 计数 2.54 91 4.33 2.60 2.57 2.67 27 42 9 215
步骤如下: 步骤如下: 表格框架(行列层及汇总变量)的设定。 表格框架(行列层及汇总变量)的设定。在 基本表的行( 基本表的行 ( Down) 、 列 ( Across) 、 单独 ) ) 表(层)(Separate tables)、摘要(汇总变 ) 摘要( 量)( Summaries)对话框中设定变量。 )对话框中设定变量。
第三讲 SPSS的数据描述 SPSS的数据描述
统计学分类: 统计学分类: 描述性统计学: 描述性统计学: 研究如何把数据用易于理 解的形式展示出来,结果可能是表格、 解的形式展示出来 ,结果可能是表格 、 图 形或者统计指标数值 推断性统计学: 推断性统计学: 利用部分数据对总体数据 的规律性做出预测和检验, 的规律性做出预测和检验 ,为了实现这一 功能, 功能,统计学家建立了大量的统计模型
注 意 : Basic tables 过 程 输 出 表 格 为 枢 轴 表 (pivot table)行、列、层可自由互换 。 )
汇总统计量添加和格式设置: 通过“ 汇总统计量添加和格式设置 : 通过 “ 统计 量(Statistic)”子对话框定义 ) 汇总变量和统计量标签排列格式的调整: 汇总变量和统计量标签排列格式的调整 : 通过“布局( 通过“布局(Layout)”子对话框定义 ) 添加汇总量:通过“总计( 添加汇总量:通过“总计(Totals)”子对 ) 话框定义 空单元格的格式设定:通过“格式 (Format)”子对话框定义 ) 标题和脚注的添加:通过“标题( 标题和脚注的添加 : 通过 “ 标题 ( Titles)” ) 子对话框定义
(grade.sav)
SPSS数据分析教程-3-描述性统计分析PPT课件

.
46
条形图
.
47
饼图
.
48
帕累托图
.
49
直方图-茎叶图-箱图
描述性->探索
直方图 茎叶图 箱图
示例:数据Employ Data.sav
直方图 茎叶图 箱图
.
50
直方图和茎叶图
.
51
箱图
.
52
从旧对话框作图
重新完成上面两个例子中的图形(箱图除外)
.
53
饼图-帕累托图
SPSS数据分析 教程
.
1
第3章 描述性统计分析
—《SPSS数据分析教程》
.
2
主要内容
描述性统计分析
频率分析 对数据进行描述的图形化方法和数值方法 学习分析数据分布的方法 应用SPSS进行描述性数据分析的方法 常用统计图形的绘制方法和解释技巧 数据标准化
.
3
本章学习目标:
掌握数据分析项目的整个过程; 掌握数据的分类方法; 掌握对数据进行描述的图形化方法和数值方法; 学习分析数据分布的方法; 掌握应用SPSS进行描述性数据分析的方法; 掌握常用统计图形的绘制方法和解释技巧
平均 若i不是整数,则向上取整。
.
28
总结五数
最小值、第一个四分位数、中位数、第三个四 分位数、最大值
从这五个值可以大致看出数据分布的中心和离 散程度。而箱图则是这五个数的图形表现
.
29
3.4 分布的形状
偏度
当偏度0时,分布为正偏 或右偏,布图形在右边拖 尾,分布图有很长的右尾, 尖峰偏左
.
42
设定表格
.
43
表格:摘要统计量设置
.
SPSS第三单元描述性统计分析

SPSS应用
(3)Explore过程:计算描述统计量,通过各类统 计图等描述数据的分布类型;在描述数据分布特点 方面表现出强大的功能,能够输出常见的描述统计 量,还有箱式图、枝叶图、直方图、正态图等。 (4)Crosstabs过程:适用于由两个或两个以上变 量进行交叉分类形成的列联表,对变量之间的关联 性进行分析。
SPSS应用
茎叶图(stem-leaf plot)
将数据分离成两部分:整数部分和尾数 部分,整数部分形成图的茎,尾数部分形成 图的叶。茎叶图的排列方式与频数表有些相 似,每行由一个整数的茎和若干叶构成。左 边是茎的数值,茎宽一般标在图的下方。右 边是叶,图显示每个叶的尾数数值,同样在 图的下方标示每个叶代表几个实际观察值。 茎叶图可以非常直观地显示数据的分布范围 和形态,近年非常流行。
SPSS应用
(1)Frequencies过程:适用于连续型和离散型的 随机变量,除可以输出均值、中位数、众数、标准 差、方差、全距等样本统计量外,还可以生成频数 分布表和条形图、饼图、直方图等常用的统计图。 (2)Descriptives过程:适用于连续型随机变量, 可以输出均值、标准差、方差、全距等样本统计量。 此外,还可以将原始数据标准化后得到的数据保存 在一个新变量中,以便进一步统计分析。 Descriptives的绝大多数功能都可以由Frequencies 来实现,其操作过程、输出结果与Frequencies输出 的统计量也近似。
SPSS应用
【Display单选钮组】 用于选择输出结果中是否包含统计描述、统计图 或两者均包括。 【Dependent List框】 用于选入需要分析的变量。 【Factor List框】 如果想让所分析的变量按某种因素取值分组分析, 则在这里选入分组变量。 【Label cases by框】 选择一个变量,他的取值将作为每条记录的标签。 最典型的情况是使用记录ID号的变量。
第三章-spss描述性统计课件

PPT学习交流
1
第一节 描述性统计 理论
• 一、描述性统计(Descriptive Statistics)
• 1、概念:
• 描述性统计就是组织、描述和总结所收集到的 一组数据的特征。
• 需要注意的是,它所描述的是这组数据本身的 分布特征,并不能深入了解统计数据的内部规律。
SPSS的许多模块都可完成描述性统计分析, 但专门为该目的而设计的几个模块则集中在描述统 计菜单中,他们就是计算各种统计量或绘制统计图 来实现描述功能。
PPT学习交流
4
1、集中趋势的量度
• 集中趋势(平均数值)是对整个群体的数值的最好的代表。 • 有三种形式的平均数值:平均值(mean)、中位数
(median)、众数(mode)。 其中,最常用的是平均 值。
PPT学习交流
5
算术平均数
算术平均数等于所有样本数据的总 和除以数据个数。算术平均值是描述 样本数据中心趋势最常用的统计量。
PPT学习交流
15
正态分布概率密度曲线示意图
PPT学习交流
16
不同均值正态分布示意图
PPT学习交流
17
1.5 1
不同标准差的正态分布示意图
PPT学习交流
18
正态曲线下面积的分布规律:
通过对密度函数积分我们可以知道正态曲线下,横轴
所夹的面积为1。理论上:
范围内曲线下的面积占总面积的
68.27%;
1.645
范围内曲线下的面积占总面积的
90%;
1.96
范围内曲线下的面积占总面积的
95%;
2.58
99%。
范围内曲线下的面积占总面积的
PPT学习交流
SPSS统计分析—描述性统计分析

2.卡方检验方法的适用条件
• 吸烟习惯与患病率的关系
调查339名50岁以上吸烟习惯与患慢性气管炎病的关系,如上表所示。试 问吸烟者与不吸烟者慢性气管炎患病率是否有所不同。 数据的预处理: WEIGHT CASE
• 执行【Analyze】/【Descriptive Statistics】/【Crosstabs】命 令, 弹出如图所示对话框
• ① Frequencies: 产生变量值的频数分布表,并可计算 常见描述性统计量和绘制相对应的统计图。
• ② Descriptives: 计算一般的描述性统计量。 • ③ Explore: 探索性分析,使用户能够从大量的分析结
果之中挖掘到所需要的统计信息。
• ④ Crosstabs: 对分类变量进行统计推断,包括卡方检验、确切 概率等,是SPSS重要的过程。
点功能: • 1、产生详细的频数表 • 2、按要求给出某个分位点 • 3.绘制常用的条图、饼图等统计图 • 适用范围:更适用于对分类变量以及不服从正态分布的连续性变量
进行描述。
• 学生身高频数表: 已知有某地120名12岁男童身高数据,编制其传统 的简易频数表。
• 执行【Analyze】/【Descriptive Statistics】/【Frequencies】 • 命令,弹出如下所示对话框
• 学生身高的探索性分析
• 执行【Analyze】/【Descriptive Statistics】/【Explore】命令, 弹出如图所示对话框
• 结果解读 • 1.描述性统计分析表
其中,5% Trimmed Mean: 去掉5%极端数之后的均值。
2.M-均值估计——检验异常数据。
3.分位点表
2.标准正态分布变化
统计学 数据的概括性度量

数值型分组数据的四分位数
1. 计算累积频数
2. 确定四分位数所在组
3. 采用下列近似公式计算:
QL
LL
N 4
SL fL
iL
QU
LU
3N 4
SU
fU
iU
LL和LU为QL和QU所在组的下限值; SL和SU为QL和QU所在组以前各组的累积频数 fL和fU为QL和QU所在组的频数, iL和iU为QL和QU所在组的组距
★主要用于顺序数据,也可用数值型数据, 但不能用于分类数据
计算中位数的步骤
1. 排序 2. 确定中位数的位置(按公式)
中位数位置 N 1 2
N为数据的个数
顺序数据的中位数
(算例)
表3-2 甲城市家庭对住房状况评价的频 数分布
甲城市 回答类别
户数 (户) 累计频数
非常不满意 24
24
不满意
108
◆ 排序后处于25%和75%位置上的值
25% 25% 25% 25%
QL
QM
QU
◆ 不受极端值的影响
◆主要用于顺序数据,也可用于数值型数 据,但不能用于分类数据
四分位数的计算
1. 排序
2. 确定四分位数的位置
下四分位数为QL,上四分位数为QU,公式为:
n QL位置 = 4
QU位置 =
3n 4
★ 如果位置是整数,四分位数就是该位置 上的值;
1. 平均数是一组数据相加后除以数据个数 得到的结果。
2. 集中趋势的最主要测度值 3. 易受极端值的影响 4. 用于数值型数据,不能用于分类数据和
顺序数据。
简单平均数
对未分组数据计算的平均数
统计学课件:数据的概括性度量

4 - 36
四分位差
(例題分析)
甲城市家庭對住房狀況評價的頻數分佈
回答類別
甲城市 戶數 (戶) 累計頻數
非常不滿意
24
24
不滿意
108
132
一般
93
225
滿意
45
270
非常滿意
30
300
vr
fi fm 1 fm
fi
fi
4. 用於衡量眾數的代表性
4 - 33
異眾比率
(例題分析)
不同品牌飲料的頻數分佈
飲料品牌
頻數
比例
百分 比(%)
果汁
6 0.12 12
礦泉水
10 0.20 20
綠茶
11 0.22 22
其他
8 0.16 16
碳酸飲料 15 0.30 30
合計
50 1 100
4 - 34
lg xn )
lg xi
i 1
n
4 - 25
幾何平均數
(例題分析)
【例】一位投資者購持有一種股票,連續4年收益 率 分 別 為 4.5% 、 2.1% 、 25.5% 、 1.9% 。 計 算 該 投資者在這四年內的平均收益率 幾何平均:
G 4 104.5% 102.1% 125.5% 101.9% 1 8.0787%
4 - 30
離中趨勢
1. 數據分佈的另一個重要特徵 2. 反映各變數值遠離其中心值的程度(離散程度) 3. 從另一個側面說明了集中趨勢測度值的代表程度 4. 不同類型的數據有不同的離散程度測度值
《统计学》课后答案(第二版_贾俊平版)

第1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。
本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。
本章各节的主要容和学习要点如下表所示。
二、主要术语1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计:研究数据收集、处理和描述的统计学分支。
3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。
4. 分类数据:只能归于某一类别的非数字型数据。
5. 顺序数据:只能归于某一有序类别的非数字型数据。
6. 数值型数据:按数字尺度测量的观察值。
7. 观测数据:通过调查或观测而收集到的数据。
8. 实验数据:在实验中控制实验对象而收集到的数据。
9. 截面数据:在相同或近似相同的时间点上收集的数据。
10. 时间序列数据:在不同时间上收集到的数据。
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。
12. 普查:为特定目的而专门组织的全面调查。
13. 总体:包含所研究的全部个体(数据)的集合。
14. 样本:从总体中抽取的一部分元素的集合。
15. 样本容量:也称样本量,是构成样本的元素数目。
16. 参数:用来描述总体特征的概括性数字度量。
17. 统计量:用来描述样本特征的概括性数字度量。
18. 变量:说明现象某种特征的概念。
19. 分类变量:说明事物类别的一个名称。
20. 顺序变量:说明事物有序类别的一个名称。
21. 数值型变量:说明事物数字特征的一个名称。
22. 离散型变量:只能取可数值的变量。
23. 连续型变量:可以在一个或多个区间中取任何值的变量。
第2章数据的图表展示一、学习指导数据的图表展示是应用统计的基本技能。
本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。
本章各节的主要容和学习要二、主要术语24. 频数:落在某一特定类别(或组)中的数据个数。
SPSS-3-数据的描述性统计

i
X ) min
2
调和平均数
1. 2. 3. 4. 5. 6.
集中趋势的测度值之一 均值的另一种表现形式 易受极端值的影响 用于定比数据 不能用于定类数据和定序数据 计算公式为
HM XF XF X
i i i i i
XF F
i i
i
调和平均数
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据一般水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值
4. 低层次数据的集中趋势测度值适用于高层次的测量数据, 反过来,高层次数据的集中趋势测度值并不适用于低层次 的测量数据 5. 选用哪一个测度值来反映数据的集中趋势,要根据所掌握 的数据的类型来确定
5. 不受极端值的影响
6. 用于衡量中位数的代表性
均值
(计算公式)
设一组数据为:X1 ,X2 ,… ,XN 简单均值的计算公式为
X1 X 2 X N X N
X
i 1
N
i
N
设分组后的数据为:X1 ,X2 ,… ,XK 相应的频数为: F1 , F2,… ,FK 加权均值的计算公式为
X 1 F1 X 2 F2 X N FN X F1 F2 FN
4. 用于衡量众数的代表性
异众比率
(算例)
【例4】根据下表中的数据, 计算异众比率。
表8 某中学学生选择专业的频数分布 专业类型
工科 文科 理科 农科 地科 其他 合计
解:
Vr =
人数(人)
112 51 9 16 10 2 200
频率(%)
56.0 25.5 4.5 8.0 5.0 1.0 100
SPSS-03描述性统计分析

-【频率】菜单中,选择“直方图”,勾选在 直方图上方显示正态曲线,单击【继续】, 返回,单击【确定】 分析结果显示,图形右边拖尾,呈现右偏分 布特征。
② 箱式图和茎叶图的绘制操作:
选择【分析】-【描述统计】-【探索】,弹出探索 分析主对话框,将“电话时长”选入“因变量列表” 即分析变量框中 单击右边的“统计量”按钮,进入新的对话框,选 项含义如下:
统计分析往往是从了解数据的基本特征开始的。 统计上,需要把样本数据所含信息进行概括、融合 和抽象,从而得到样本数据的综合指标。这些指标 统称为统计量。 描述数据特征的统计量可分为两类:一类表示数 据的中心位置,例如均值、中位数、众数等;另一 类表示数据的离散程度,例如方差、标准差、极差 等。 需要注意的是,不同度量标准(度量型、序号型、 名义型)的变量,其描述统计的方法是不同的,如 果不分类型胡乱使用,这种计算没有任何意义,结 果也不能说明任何问题。 这里首先介绍序号型变量和名义性变量的描述性 统计分析;接着介绍度量型变量的描述性统计分析; 最后介绍两种变量的列联表分析。
操作:选择【分析】-【描述统计】-【频
率】,进入频数分析主对话框,左边是待选 变量,中间是频率分析变量框,右边是频数 分析设置按钮
将“广告类型”选入频数分析变量框 如果勾选对话框下方“显示频率表格”的复选框,
可在输出中显示统计变量各具体值的频率、百分比、 有效百分比、累计百分比、并且显示统计变量的有 效和无效个案数。如果不勾选,则分析结果仅仅显 示统计变量的有效和无效记录数。 点击右边“统计量”按钮,由于只能计算众数,所 以只勾选“众数”,点击【继续】 返回刚才的对话框,点击右边的“图表”按钮,只 能选择条形图或饼形图,点击【继续】
统计学数据的概括性度量PPT课件

由上表可以看出,家庭人口数为3人的家庭数最多,因此本例中家庭人
口数的众数为3人。
2019/12/23
13
数值型分组数据的众数
1. 众数的值与相邻两组频数的分布有关
2. 相邻两组的频数相等时,众数组的组中值
即为众数
Mo
3. 相邻两组的频数不相等时,众数采用 下列近似公式计算
Mo
该公式假定众数组的频数在众数组内均匀分布
**品质变量的众数——观察次数,出现次数最多的
变量值就是众数。
例如:企业的所有制结构分布、人口的城乡分布。
**数值变量的众数
未分组资料——观察次数,出现次数最多的数据
就是众数。
分组资料
(1)单项式数列——直接观察,次数最多的组的 变量值即为众数。
fi
2019/12/23
10
定类数据的众数
【例】根据表4-1中的数据,计 算众数
按零件数分组 频数(人) 累积频数
105~110
3
3
110~115
5
8
115~120
8
16
120~125
14
30
125~130
10
40
130~135
6
46
135~140
4
50
合计
50
—
QL位置=50/4=12.5
50 8
QL 115
4 8
5 117.81(个)
QU位置=3×50/4=
Mo=不满意
12
[例]单项式变量数列确定众数实例
表4-3 某市居民家庭按家庭人口数分组
家庭人口数(人) 1 2 3 4 5 6
合计