第五章 离中趋势的量度:变异指标

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章离中趋势测量法

平均指标对总体的共性和一般水平作了概括,以此来说明总体标志值分布的集中趋势。但是总体作为统计对象,还有其变异性的一面。变异指标用以反映总体各单位标志值的变动范围或参差程度,与平均指标相对应,从另一个侧面反映了总体的特征。变异指标不仅可以综合地显示变量值的离中趋势,还可以用来判别平均数的代表性。所谓离中趋势,是指数列中各变量值之间的差距和离散程度。离势小,平均数的代表性高;离势大,平均数代表性低。

变异指标的种类较多,如按计算的基准来分有以下两类:

(1)以两数之差来表达的有全距和四分位差等。

(2)以对平均数偏差来表达的有平均差、标准差等。

变异指标如按数量关系来分有以下两类;

(1)凡用绝对数来表达的变异指标,统称绝对离势,主要有极差、平均差、四分位差、标准差等。

(2)凡用相对数来表达的变异指标,统称相对离势,主要有异众比率、标准差系数、平均差系数和一些常用的偏态系数。

第一节全距与四分位差

1.全距

全矩是最大变量值与最小变量值之差,用R来表示。对未分组资料,计算全距用原始式。由于全距是一组数据中两个极端值之差,所以它又称极差。

全距的最大优点是:计算简单,便于直观。缺点是;①受极端值影响大,遇含开口组的资料时将无法计算;②由于没有量度中间各个单位间的差异性,所以数据利用率很低,信息丧失严重;③受抽样变动影响很大。一般说来,大样本全距要比小样本全距大些,因为大样本有较多的机会包含最极端的变量值。

2.四分位差

四分位是用第三四分位数和第一四分位数的半距作为测定离中趋势的一种变异指标,它可以避免全距测量离中趋势受极端值影响大这个缺点。但由于它仅以两数之差为基准,全距的另两个缺点依然无法避免。

第二节平均差

要测定变量值的离中趋势,尤其是要测定各变量值相对于平均数的差异情况,一个很自然的想法就是计算各变量值与算术平均数的离差。但由于算术平均数的性质,各变量值与其算术平均数离差的代数和恒为零,所以用这个性质无法构造出能够测定离中趋势的变异指标。为此,我们采取处理离差绝对值的办法,如此构造出来的变异指标,称为平均差

1.对于未分组资料A·D的计算

平均差被定义为各变量值对其算术平均数(或中位数)离差绝对值的算术平均数,用A·D 表示。对于未分组资料,求平均差用原始式。

2.对于分组资料A·D的计算

对于分组资料,计算平均差需用加权式。

3.平均差的性质

平均差以及接下来要讨论的标准差,虽都是变异指标,但就其计算的数学方法来看,仍属于算术平均数。所以,平均差在受抽样变动影响、受极端值影响和处理不确定组距这三方面,它的性质均同于算术平均数。与此同时,平均差由于计算时采用了取绝对值来消除正负号的影响的方法,它不便于代数运算,而且平均差的意义在理论上也不容易作出阐述。所以,平均差作为变异指标,其运用比下面的标准差要少得多。

另外,根据中位数的性质可知,各变量值对中位数之差的绝对值总和为最小。因而,有时以中位数为基准来计算平均差反倒比以算术平均数为基准来计算平均差更合理。

第三节标准差

为了克服平均差带有绝对值计算的缺点,同时保留平均差的优点(即它已将总体中各个单位标志值的差异全部包括在内),故将各离差平方后求算术平均,再求平方根,来构造变异指标,这样就得到一个常用的而且也是最重要的变异指标——标准差,用S表示。

1.对于未分组资科S的计算

标准差被定义为各变量值对其算术平均数的离差平方的算术平均数的平方根,又称均方差。对于未分组资料,求标准差用原始式。

2.对于分组资料S的计算

对分组资料,计算标准差要用加权式。

3. 标准差的性质

标准差是测定总体各单位标志值的离散状况和差异程度的最佳指标,这是因为它在数学上便于代数运算,并且具有许多特有的性质:

(1)以算术平均数为基准计算的标准差,较之以任何其他数值为基准计算的标准差要小,这是因为算术平均数的“最小平方”性质。

(2) 标准差同平均差一样,虽都是变异指标,但就其计算的数学方法来看,仍属于算术平均数。因为它已将总体中各单位标志值的差异全部包括在内了,所以它受抽样变动的影响小。但是,标准差在受极端值影响和处理不确定组距这两方面,缺点均与算术平均数相同。

值得注意的是,在推论统计中我们将发现,方差是比标准差更有理论价值的概念。所谓方差,即标准差的平方,它直接写成S2。

4.标准分

运用标准差.还可将原来不能直接比较的离差标准化,使之可以相加、相减、平均或者相互比较。为此我们引入一个新的变量,用符号Z表示。由公式可以看到,Z分数是以离差与标准差的比值来测定变量X与X的相对位置的。

第四节相对离势

上述各种反映离中趋势的变异指标,都具有和原资料相同的计算单位,称绝对离势。但欲比较具有不同单位的资料的参差程度,或比较单位虽相同而均值不相同的资料的参差程度,离势的绝对指标则很可能导致某些错误结论。所以,我们还得了解和学习相对离势。

1.变异系数

用离势的绝对指标除以其平均指标来求离势的相对指标,就可以在计量单位不同或平均水平不一的对象之间进行直接比较。这种由绝对离势转化而来的相对离势称为变异系数,用符号V表示。变异系数指绝对离势统计量与其算术平均数(或其他适当数值)的比值,变异系数是最具有代表性的相对离势。

(1)全距系数,是众数据的全距与其算术平均数之比。

(2)平均差系数,是众数据的平均差与其算术平均数之比。

(3) 标准差系数,是众数据的标准差与其算术平均数之比。

用绝对数表示离中趋势,对于描述数列的频数分布状况来说,其意义明显而易于理解。但是,绝对离势只有在研究性质相同的总体且其平均水平也大体一致的情况下,才能用来在不同总体间进行比较。我们知道,实际上,不同总体不但在水平上往往相差很大,而且它们的性质也往往互不相同。在这种情况下,我们便要用离势的相对指标作为比较的依据了。

2.异众比率

所谓异众比率,是指非众数的频数与总体单位数的比值,用V·R来表示。异众比率的意义在于能够表明众数不能代表的那一部分变量值在总体中的比重。异众比率越大,各变量值相对于众数越离散;异众比率越小,各变量值相对于众数越集中。

异众比率计算简单,只要知道众数的频数和总体单位数就可以了。因而,这种相对离势的测定不但适用于定距资料,也适用于定比、定类资料。

3.偏态系数

偏态系数是以标准差为单位的算术平均数与众数的离差,其取值一般在0与土3之间。偏态系数为0表示对称分布,偏态系数为3

-则表示极右或极左偏态。

+或3

相关文档
最新文档