贾俊平《统计学》(第5版)课后习题-第4章 数据的概括性度量【圣才出品】

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第4章 数据的概括性度量

一、思考题

1.一组数据的分布特征可以从哪几个方面进行测度?

答:数据分布的特征可以从三个方面进行测度和描述:

(1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;

(2)分布的离散程度,反映各数据远离其中心值的趋势;

(3)分布的形状,反映数据分布的偏态和峰态。

2.怎样理解平均数在统计学中的地位?

答:平均数也称为均值,它是一组数据相加后除以数据的个数得到的结果。平均数在统计学中具有重要的地位,是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。

3.简述四分位数的计算方法。

答:首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。四分位数的位置确定方法如下:设下四分位数为L Q ,上四分位数为U Q ,根据四分位数的定义有:

14

L n Q +=位置()

314

U n Q +=位置如果位置是整数,四分位数就是该位置对应的值;如果是在0.5的位置上,则取该位

置两侧值的平均数;如果是在0.25或0.75的位置上,则四分位数等于该位置的下侧值加上按比例分摊位置两侧数值的差值。

4.对于比率数据的平均为什么采用几何平均?

答:几何平均数是指n 个变量值乘积的n

次方根,称为几何平均数。其计算公式为:

G ==比率数据属于相对数,它不能如绝对数那样对其进行累加,而只能对其进行连乘,比如工厂年产量去年比前年的年增长率为10%,今年比去年的增长率为20%,那么今年对前年的相对增长率为(1+10%)×(1+20%)—1。而不能用(1+10%)+(1+20%)—1来计算,这样累加的结果是没有实际意义的,因此对于比率数据,在对其计算平均数的时候,就不能像计算一般的平均数那样计算,而要用几何平均数的计算公式计算。

实际上,几何平均数也可以看做是均值的一种变形。只要对其计算公式两边取对数,则其公式的形式变为算术平均数的公式形式。

5.简述众数、中位数和平均数的特点和应用场合。

答:(1)众数的特点如下:①其优点是不受极端值的影响;②其缺点是具有不惟一性。一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。

众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。众数主要适合作为分类数据的集中趋势测度值。

(2)中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。

中位数主要适合作为顺序数据的集中趋势测度值。

(3)平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。

平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择中位数或众数,这时它们的代表性要比平均数好。

6.简述异众比率、四分位差、方差或标准差的应用场合。

答:(1)异众比率主要用于衡量众数对一组数据的代表程度。异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性就越差;异众比率越小,说明非众数组的频数占总频数的比重越小,众数的代表性越好。异众比率主要适合测度分类数据的离散程度,当然,对于顺序数据以及数值型数据也可以计算异众比率。

(2)四分位差主要用于测度顺序数据的离散程度。对于数值型数据也可以计算四分位差,但不适合分类数据。

(3)方差或标准差能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。方差开方后即得到标准差。与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚。因此,在对实际问题进行分析时更多地使用标准差。

7.标准分数有哪些用途?

答:变量值与其平均数的离差除以标准差后的值称为标准分数。也称标准化值或z分

数。设标准分数为z 。则有

i i x x

z s -=标准分数给出了一组数据中各数值的相对位置。在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。

标准分数具有平均数为0、标准差为1的特性。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0,标准差为1。

8.为什么要计算离散系数?

答:方差和标准差是反映数据分散程度的绝对值,其数值的大小一方面受原变量值本身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平小的离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同。采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。

9.测度数据分布形状的统计量有哪些?

答:测度数据分布形状的统计量有以下两种:

(1)偏态,如果一组数据的分布是对称的,则偏态系数等于0;如果偏态系数明显不等于0,表明分布是非对称的。若偏态系数大于1或小于-1,被称为高度偏态分布;若偏

态系数在0.5~1或-1~-0.5之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低。

(2)峰态,通常是与标准正态分布相比较而言的。如果一组数据服从标准正态分布,则峰态系数的值等于0;若峰态系数的值明显不等于0,则表明分布比正态分布更平或更尖,通常称为平峰分布或尖峰分布。

二、练习题

1.一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:

2 4 7 10 10 10 12 12 14 15

要求:

(1)计算汽车销售量的众数、中位数和平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:(1)10名销售人员5月份销售的汽车数量中,销售10台汽车的人数最多,为3人,因此众数M 0=10。

中位数位置=

1101 5.522n ++==,所以1010102e M +==(台)。平均数12415969.61010

n i

i x x n =+++====∑L (台)(2)由题中数据可得:

相关文档
最新文档