从数据分析角度看为什么要去掉最高分和最低分

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

从数据分析角度看

为什么要去掉最高分和最低分

在歌手电视大奖赛或跳水等比赛中,我们经常看到,评委亮完分后,往往采用去掉最高

分与最低分再计算平均值的办法来计算选手的参赛成绩,这是为什么呢?

这类问题是日常生活中经常遇到的数学问题,在我们的教材里分别介绍了统计学中的三

个重要概念-------- 平均数、中位数和众数•同学们仅知道平均数的概念,会机械地用公式

计算•而对平均数的价值、平均数的优缺点了解甚少,这是相当遗憾的!阅读了下文,你就可以补上这一课了.

我们假设10个评委对某位歌手的打分情况如下:

9.3, 9.2, 9.2, 9.1 , 9.0, 8.9, 8.5, 8.0, 8.0 和7.8,

那么,其平均分是(9.3+9.2+9.2+9.1+9.0+8.9+8.5+8.0+8.0+7.8)- 10=8.7, 如果去掉一个最高分和最低分后,其平均分就变成8.8,明显大于8.7 了.

由此可见,个别评委的打分高低在很大程度上影响选手的参赛成绩,为了避免个别评委的个人好恶影响选手的成绩,常常要去掉最高分和最低分,有的甚至还要去掉两个最高分和最低分,以略去评委评分中可能出现的异常值,使得比赛尽可能客观公正•因此,易受异常值影响是平均数的缺点之一.

平均数的第二个缺点是不一定能代表“中等水平”

我们举个极端的例子说明,假设全班有30个学生,某次测验成绩如下:

2分、10分各一人,90分5人,80分22人.

某同学甲78分,全班的平均分是(2+10+90 X 5+80X 22+78)- 30=76.67 .

显然,甲同学的成绩78高于全班平均成绩76.67,给人的影响是“中上”水平,其实,他的成绩已排在倒数第三位了,可见,平均数有时不能反映“中等水平”

要正确反映“中等水平”,就要用统计学上的“中位数”概念,所谓“中位数”就是将所有数据从小到大(或从大到小)依次排列起来,位于中间的那个数•这时,比它大的数据个数与比它小的数据一样多,中位数大小就正确反映“中等水平”• 一般地,若有n个数据, n为偶数时,中位数就是第-个和第-1个数据的平均数;若n为奇数时,中位数就是第

2 2

口个数据•显然,第二例中反映全班学生测验成绩“中等水平”的中位数应该是80分,

2

而平均数是76.67;在第一例中歌手成绩的中位数是8.95,而平均数是8.7,两者都存在一定

的距离.

在第一个例子中,如果我们去掉一个最高分和最低分,其平均数就变为8.8 ;去掉两个最高分和最低分,其平均数就变为8.88.可见,去掉若干对最高分和最低分,能够使得平均

数接近中位数,从而更好地反映“中等水平”•虽然中位数能很好标志“中间”水平,但抹

煞了更多评委个人细微的评审意图. 在实际中既需要考虑异常值对平均数的影响,又要考虑绝大多数评委个人细微的评审意图,所以往往采用去掉一个或两个最高分和最低分再计算平

均数的办法来统计选手的总成绩的.

相关文档
最新文档