中级经济师基础第二十四章描述统计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二十四章描述统计
本章重点:
1.测度数据集中趋势的统计量:均值、中位数和众数。
2.测度数据离散程度的统计量:方差、标准差和离散系数。
3.测度数据分布偏态的统计量:偏态系数、标准分数。
4.测度变量相关关系的统计量:散点图、相关系数。
知识点一:集中趋势的测度
1.均值。平均数,就是数据组中所有数值的总和除以该组数值的个数。
均值是集中趋势最主要的测度值,它是一组数据的重心所在,解释了一组数据的平均水平。
【示例】某售货小组5名营业员,元旦一天的销售额分别为520元、600元、480元、750元和500元,求该日平均销售额。
平均销售额=(520+600+480+750+500)÷5=570(元)
【注意1】均值主要适用于数值型数据,但不适用于分类和顺序数据。
【注意2】均值容易受到极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。
需要全部信息避不开极端值!
2.中位数。把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数,用Me表示:
【注意1】中位数是一个位置代表值,主要用于顺序数据和数值型数据,但不适用于分类数据。
【注意2】中位数的优点:不受极端值的影响,抗干扰性强,尤其适用于偏斜分布的数值型数据。
不需要全部信息能避开极端值!
3.众数:指一组数据中出现次数(频数)最多的变量值。不适用于定量数据。
【注意】适用于描述分类数据和顺序数据的集中趋势。在定量数据中,可能出现多众数和无众数的情况,因此众数不适于描述定量数据的集中位置。
不需要全部信息能避开极端值!
指标适用特点
均值定量变量◎利用全部信息,受极端值影响◎如有明显极端值,则代表性差
中位数顺序变量定量变量◎不受极端值影响
◎适用于分布不对称的数据
◎没有充分利用全部信息,稳定性优于众数,差于均值
众数分类变量顺序变量◎没有充分利用全部信息,不受极端值影响◎适用于分布明显呈偏态的数据
◎可能不唯一
【例题·单选题】(2018年)下列统计量中,适用于描述分类数据和顺序数据集中趋势的是()。
A.众数
B.均值
C.标准分数
D.中位数
『正确答案』A
『答案解析』本题考查众数。众数适用于描述分类数据和顺序数据的集中趋势。
【例题·单选题】(2017年)2016年某企业集团下辖8个分公司的销售额分别为10000万元、3600万元、800万元、1000万元、600万元、3000万元、2800万元、2200万元,这组数据中的中位数是()万元。
A.2200
B.2800
C.2500
D.3000
『正确答案』C
『答案解析』本题考查中位数的计算。(2800+2200)/2=2500。
【例题·单选题】在对数据集中趋势的测度中,适用于偏斜分布的数值型数据的是()。
A.中位数
B.均值
C.标准差
D.方差
『正确答案』A
『答案解析』本题考查中位数。中位数主要适用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数不受极端值的影响,抗干扰性强,尤其适用于收入这类偏斜分布的数值型数据。
知识点二:离散程度的测度
(一)方差和标准差
离散程度:反映的是数据之间的差异程度。集中趋势的测度值对一组数据的代表程度,取决于该组数据的离散水平。
数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。
1.方差
(1)方差:数据组中各数值与其均值离差平方的平均数。
(2)方差越小,说明数据值与均值的平均距离越小,均值的代表性越好。
总体方差公式:
【示例】某售货小组5名营业员,元旦一天的销售额分别为520元、600元、480元、750元和500元,平均销售额为570元,计算日销售额的样本方差。
=[(520-570)2+(600-570)2+(480-570)2+(750-570)2+(500-570)2]÷(5-1)=12200(元2)
2.标准差
(1)标准差:方差的平方根。
【示例】5名营业员元旦当天的销售额的标准差
(2)标准差与方差只适用于数值型数据,它们对极端值很敏感。
(二)离散系数
1.离散系数:变异系数或标准差系数。
2.标准差与均值的比值:
3.适用:不同类别数据离散程度的比较。
【注意】标准差的大小不仅与数据的测度单位有关,也与观测值的均值大小有关,不能直接用标准差比较不同变量的离散程度。离散系数消除了测度单位和观测值水平不同的影响,因而可以直接用来比较变量的离散程度。
【示例】某学校学生的平均年龄为20岁,标准差为3岁;该校教师的平均年龄为38岁,标准差为3岁。比较该校学生年龄和教师年龄的离散程度。
『正确答案』学生年龄的离散程度更大。
『答案解析』学生年龄的离散系数=3/20=0.15
教师年龄的离散系数=3/38=0.0789
【例题·多选题】(2017年)下列统计量中,适用于测度数据离散程度的有()。
A.众数
B.方差
C.中位数
D.标准差
E.均值
『正确答案』BD
『答案解析』本题考查测度数据离散程度的指标。选项ACE属于测度集中趋势的指标。
【例题·多选题】(2015年)下列统计量中,容易受极端值影响的有()。
A.均值
B.方差
C.众数
D.中位数
E.标准差
『正确答案』ABE
『答案解析』本题考查集中趋势和离散程度的测度指标。均值、方差、标准差容易受极端值的影响。