对平均数的理解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
漫谈对平均数的理解
平均数就是集中量数的代表,也就是最常用的一种描述统计指标。它反映了数据的代表性、也即可以通过平均数对数据的集中性或代表性有一个直观的了解。其次,平均数也就是常用的一种统计量,许多推断统计方法都就是基于平均数进行的。目前大多数统计方法中,平均数都占有最重要的位置、无论就是要掌握某个总体的状况,还就是要比较不同总体的差异等,都涉及到平均数、。
在分析数据的时候,面对一组数据,人们最容易想到的就是对这些数据进行求与,瞧她们的总数就是多少。然而,总数常常远远大于每一个具体数据,不能反映数据的真实状态,很难推断数据产生背景的真实状态。如果出现了两组数据总数相等的情况,用总数便很难对两组数据进行评价。鉴于此,人们想到了用一个量来表示数据的一般水平,以消除数据个数造成的总数与单个数据的偏差,便用总数除以个数,也就就是平均数来代表数据的一般水平或者大致状态。
平均数的特征有很多。首先,平均数介于最大值与最小值之间,即平均数比最小的数大一些,比最大的数小一些。其次,平均数就是一个虚拟值,即平均数不一定就是这一组数据中的数;平均数反映的就是一组数据的特征,不就是其中每一个数据的特征;为了弥补这一缺陷,统计学上用众数来代表数据的一般情况,众数就是一个真实值。同时,平均数易受极端数据的影响,即一个数据离平均数越远,对平均数的影响越大。例如:全班有30名学生,某次测试成绩如下:5个90分、22个80分、1个2分、1个10分、甲同学78分,则平均值为
301x(5x90+22x80+2+10+78)=76、67分,甲同学78分,高于平均值却就是全班倒数第三名。因此,多数比赛算选手的平均分,需要去掉一个最高分与一个最低分。最后,所有的数据在平均数上下波动,它们的偏差之与等于0,也就就是说,平均数不能衡量偏差;为了衡量偏差,也就就是数据的集中程度,统计学中又引入方差与标准差。
不同平均数适合不同的场合。算术平均数受所有数据的影响, 且要求数据与单位要一一对应。调与平均数在经济分析中常作为算术平均数的变形使用, 二者应用于不同形式的资料上。几何平均数应用在比率的平均数的求解上, 并要求各比率乘积有意义。中位数就是居中的数值,能够反映总体标志值的一般水平,具有较好的代表性。当总体各单位的标志值有明显的集中趋势时,众数可作为最为合理的代表值。
平均数可以反映社会与经济发展一般水平,显示国民经济运行过程均衡状态,表明事件现象共性特征,比如,人均居住面积、职工平均工资、平均发展速度等。但由于人们对平均数特别就是算术平均数的计算方法、计算范围与指标含义理解不够,常出现计算不准确与不科学,引起对平均数的质疑与不信任。例如,多年以来我国一直用“人均居住面积”来反映居民居住的一般水平,这个指标就是根据所有人居住面积计算的算术平均数,如果我们不对居住面积的分布进行分析而得出这个值就得出我国居民居住的水平的结论,就是不科学的。有报道说,我国居民的居住水平有很大提高,中国房地产协会会长扬慎(2001)说:“人均居住面积反映居民的住房的水平很不科学,当官的、有钱的住的就是大房子,甚至几处,可职工的住房大部分就是几十平米,把官人与富人阶层的住房面积平均到普通百姓的头上,怎么能算住房水平的提高?”这样的平均数受到质疑,人们认为平均数掩盖了居民居住的真实水平。
平均数就是反映总体集中性, 反映一般水平即大部分单位的水平的指标,但此时确实掩盖了事物的真实,人均居住面积、职工平均工资分别掩盖了绝大多数职工的居住水平与真实收入。这说明了算术平均数的使用在这种情况下就是不合适的,不科学的,算术平均数应用上有其局限性。
从严格意义上说,算术平均数就是同一总体的标志总量与单位总量之比,即要求计算平均数时要求分子分母一一对应。而我们平时说的人均收入、人均GDP 等值,并不就是严格意义上的平均值,而就是反映经济发展、人民富裕的强度指标,计算时它们的分子分母不就是一一对应的,这个时候就需要我们分清什么就是强度相对数,什么就是算术平均数。算术平均数就是所有数据即标志值之与除以单位数,受所有数据的影响,要应用在数据分布比较均匀的情况下,在有极值的时候使用这样的值不能真实反映一般水平。算术平均数受极值影响,而且极大值比极小值对算术平均数的影响还要大,有极大值时呈正偏,算术平均数大于众数与中位数,有人为了表现其业绩、政绩,主观夸大其成绩,使用算术平均数就不难理解,把个别突出的极大数据平均到全体单位上来, 使一般水平的数值加大,表现某些人的功绩。
统计平均数,在统计学上也称为平均指标,就是统计指标中非常重要的一种指标,也就是国家统计局公布的常见一种统计数据,其重要性在于平均指标的“平均”涵义:它反映了现象分布的集中趋势,代表了社会与经济发展的一般水平。既然平均数就是若干个体数据的一个代表值,因而与个体数据存在一定差异,就是再正常不过的了。对于反映我国职工工资一般水平的平均工资,也就必然会
出现有一部分人的工资高于平均工资,而另外有一部分人的工资低于平均工资,尤其在地区收入、行业收入、城乡收入差距悬殊的今天,出现这种现象就更加普遍了。这样一来,无论就是高于平均工资水平的人,还就是低于平均工资水平的人,都会认为国家统计局公布的平均工资不能真实反映她们的实际工资水平。所以,我们必须清楚:平均数只就是反映了一种共性,尽管平均数来自于众多的个体数据,但它决不等于个体数据,“平均”决不等于“平等”,与“公平”更有不小的距离。
瞧到了算术平均数在使用中存在的问题,就是由于应用这样的数值时没有满足条件与前提,所以受到质疑,但我们不能据此否定算术平均数,这个指标在经济分析中,在反映总体一般水平问题上,起着重要作用。我们只能说,在经济分析中应该更好地应用算术平均数,更准确恰当地反映事物的本质。我们需要正确理解统计平均数的科学涵义及其局限性,加大我国统计制度的改革的力度,积极与国际接轨掌握平均数的使用场合与条件,准确恰当运用结合偏态指标,合理应用各种平均指标。我们既不能一味迷信算术平均数,也不能因为有了对这个数值的质疑而否定这个指标,在实际的经济分析中应该具体问题具体分析,更好地应用平均数这个指标来反映总体本质特征,更好地使用统计信息,更好地运用统计这种手段。
平均数的应用时多方面的,美国人达莱尔・哈夫在她的名著《统计陷阱》中写到:为了让顾客购买加利福尼亚的一处房产,我巧舌如簧,费尽心思地让她相信,附近居民的年收入平均有15000美元,这就是个富人区,因为人有那么一点势利,在与朋友聊天时,总会瞧似不经意告诉她们现在您住那儿。但当我为了降低税率,降低财产估价,或降低公共交通费用而呼吁时,我的理由就是:我们支付不起各种
上涨的费用,因为附近的居民的平均年收入只有3500美元。这两个平均数都就是合法的平均数,有着合法的计算方法。我的诡计就是每次使用了不同的平均数。因为这里的居民收入就是显著偏斜的,大多数居民就是小农工薪阶层或靠养老金为生的退休老人,但有3家却就是来度周末的百万富翁。这3家百万富翁的收入提高了总收入,相应提高了算术平均数。这里居民有一半家庭就是收入低于3500美元,另一半超过3500美元。于就是,当希望数据较大时,我便使用算术平均数,
当希望数据较小时,我便使用中位数。
从上例中,我们可瞧出,由于平均数计算方法的多样性,使用者存在多种选择。前者就是按算术平均数计算的,后面就是中位数,计算方法本身没错,那为什么给