统计学-数据分布特征
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
14
15
例:某城市居民关注广告类型的频数分布
16
例:甲城市家庭对住房状况评价的分布频数
17
四、各度量值的比较
18
四、各度量值的比较
19
四、各度量值的比较
20
各度量值适用的数据类型
21
源自文库
4.2离散程度的度量
22
4.2离散程度的度量
离散程度 数据分布的另一个重要特征 离中趋势的各测度值是对数据离散程度所作的描述 反映各变量值远离其中心值的程度,因此也称为离 中趋势 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的数据有不同的离散程度测度值
50
51
一、偏态及其测度
52
二、峰态及其测度
53
例:
54
55
56
57
用Excel计算描述统计量
58
用Excel计算描述统计量 72页习题2
59
60
61
62
63
作业1:
64
65
作业2:
66
答案:
67
68
2
描述集中趋势的统计量
平均数 中位数和分位数 众数
3
一、平均数
平均数:
集中趋势的测度值之一
最常用的测度值
一组数据的均衡点所在 易受极端值的影响
用于数值型数据,不能用于品质型数据
4
一、平均数
5
平均数的计算公式
6
二、中位数和分位数
(一)中位数 集中趋势的测度值之一 排序后处于中间位置上的值 不受极端值的影响
对某一个值在一组数据中相对位置的度量 可用于判断一组数据是否有离群点 用于对变量的标准化处理
40
标准分数的性质
41
例:
42
43
思考:
在衡量任何现象尤其是不同类型现象的离 散情况,是否有标准差这种类型的测度值 就够了?
44
45
46
47
四、离散系数:比较几组数据的离散程度
48
49
4.3偏态与峰态的度量
第四章 数据分布特征的测度
主要内容和学习目标:
集中趋势的测度
离散程度的测度 偏度与峰度的测度
1
4.1集中趋势的测度
一组数据向其中心值靠拢的倾向和程度 测度集中趋势就是寻找数据一般水平的代表值或中心值 不同类型的数据用不同的集中趋势测度值 低层次数据的集中趋势测度值适用于高层次的测量数据, 反过来,高层次数据的集中趋势测度值并不适用于低层次 的测量数据 选用哪一个测度值来反映数据的集中趋势,要根据数据的 来型来确定
23
描述数据离散程度的测度值
极差和四分位差 平均差 方差和标准差 离散系数
24
作用1:衡量平均值的代表性
离中趋势越大,均值的代表性就越小 例:过去三年,某公司的平均销售额为1200万元, 这可能有三种情况:
25
作用2:反映社会经济活动的均衡性
离散程度可以表明生产过程的节奏性和其他经济活 动的均衡性,因此可以作为企业产品质量控制和评 价经济管理工作的依据。 例:某公司下属两个企业销售额计划完成情况
30
(二)四分位差
31
二、平均差
离散程度的测度值之一 各变量值与其均值离差绝对值的平均数 能全面反映一组数据的离散程度 数学性质较差,实际应用少 计算公式为:
32
三、方差和标准差
33
34
35
36
37
38
39
相对位置的测量:标准分数
也称标准化值,计算公式为:
26
一、极差和四分位差
27
一、极差和四分位差
(一)极差(全距Range)
离散程度的最简单测度值 易受极端值的影响 未考虑数据的分布
28
例:
29
(二)四分位差
也称为内距或四分位数间距 上四分位数与下四分位数之差
反映了中间50%数据的离散程度 不受极端值的影响 用于衡量中位数的代表性
7
中位数位置的确定
8
例:9个家庭的人均月收入数据
9
例:10个家庭的人均月收入数据
10
(二)四分位数
集中趋势的测度值之一 排序后处于25%(下四分位)和75%(上四分位) 位置上的值 不受极端值的影响
11
四分位数位置的确定
12
13
三、众数
一组数据中出现次数最多的变量值 适合于数据量较多时使用 不受极端值的影响 可能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和 数值型数据