清晰认识概念 理解数学本质
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
——对“方差”概念的分析与思考
【专题名称】中学数学教与学(高中读本)
【专题号】G35
【复印期号】2009年06期
【原文出处】《中学数学教学参考》(西安)2009年3中期第21~23页
【作者简介】万荣庆,江苏常州市新北区教研室。
在中学统计内容教学中有两类描述数据特征的概念:一类是描述数据集中程度的,如平均数、中位数、众数;另一类是描述数据离散程度的,如极差、方差、标准差。教师在讲授这些概念时,常常由于自己对概念认识较浅,导致学生学习这些概念时不明不白。甚至有时因教师自己对概念的错误理解,而直接影响学生的后续学习或实际应用。现以统计中“方差”概念的教学为例作些分析与思考,以便教师在概念教学中引导学生清晰地认识数学概念,从而真正理解概念,正确应用概念。
一、清晰地引入“方差”概念
当我们描述一批数据时,有时考虑它们的集中程度,有时还要考虑它们的离散程度。如某次数学单元检测,A组成绩:95,85,75,65,55,45;B组成绩:73,72,71,69,68,67。这两组成绩中,A组数据给人的感觉波动范围较大,较“散”,B组数据给人的感觉波动范围较小,没A组“散”。如果将上述两组成绩用图形(如图1)描述的话,将更直观地看出A 组数据比B组数据“散”。
图1
那么我们接着要考虑的是,这里的“散”是对于谁而言的呢?我们需要找到一个可以进行比较的参照对象,这个比照对象就是反映数据集中程度的平均数。为什么找平均数,不找别的呢?一是平均数本身是这批数据最集中的“地方”,视觉中的“散”与“不散”就是围绕这个集中“地方”作比较的;二是如果以别的作比较的话,如图1,若A、B两组数据均以0分作比较对象,感觉A、B两组数据对0来说都较“散”,很难对两组数据的离散作判断。
当把比照对象“平均数”确定以后,我们更重要的任务是如何用具体的量来描述这批数据对于“平均数”这个比照对象来说的离散程度,这是我们最本质的问题,因为数学很重要的任务就是如何用数量或数量关系描述我们所面对的问题。在寻找能描述这批数据对于“平均数”的离散程度的量时,当然首先想到的是这些数据与平均数的差,并将这些差的和作为这些数据与平均数的离散程度的累计,如前面所提的A组测试成绩,其平均数x=70,每个数据与70作差后得25,15,5,-5,-15,-25。但若把这些偏离值相加,出现正负抵消,这样这批数据的离散程度会由于差值中的正负抵消而不能真正表述数据的离散程度。
如何解决上面的问题呢?我们自然会想到要消除每个数据与平均数差后的负值。这里的方法很多,其中最常见的两种方法是对差值作绝对值或平方。我们常常采用加平方的方式来描述这批数据离开“平均数”的离散程度,即设一批数据
,通过计算来描述这批数据离开平均数的离散程度的和。
但问题又来了,这种用和来描述这批数据的离散度会不会受到数据个数的影响呢?当然会,数据个数多时,其和值会相对大,特别是在比较两组数据的离散度时,就会因为个数不同而不科学了。为了避免由于个数产生的影响,我们很自然地会想到计算这些数据与平均数作差后平方所得到的新数据的平均数,即
,用它来表示这批数的平均离散程度。这个值彻底解决了上面所遇到的问题,即这个结果能用数量来刻画出一批数据对平均数偏离的平均程度,描述出这批数据相
对于平均数而言的波动程度。回到开头,对于A组:
“方差”概念是我们要解决怎样用数量去刻画一批数据的离散程度时而引入的。上述的引入是通过不断探索合理的方法,逐步解决出现的新问题,直至最后把问题解决。在这过程中,我们一方面帮助学生理清为什么要引入方差、怎样引入方差、在引入方差过程中为什么要与平均数作差、为什么对差作平方、又为什么对平方后的和要除以n……帮助学生理清了概念的来龙去脉,更重要的是在这个过程中,不断让学生面临问题,然后积极探索寻找解决问题的方法,不断完善方法,使学生经历了一次充满探究、解决问题的过程。数学本身也正是在这样不断遇到问题,不断寻找解决问题的方法中得到发展和完善,这是学生在数学学习过程中最本质的。
二、进一步理解“方差”概念
(1)方差与极差有何区别?在中学统计内容的教学中,反映一批数据离散程度的还有一个概念——极差。极差是一批数据中最大值与最小值的差,它很简洁明了地描述了这批数据的波动范围。很多教材都说明了极差也能反映一批数据的离散程度或波动大小。但在教学中学生往往会有疑问:既然形式简单的极差能反映一批数据的离散程度,那为什么还要引入复杂的方差呢?其实教学中我们要帮助学生理清:教材中的说法是含糊不清的,极差仅反映这批数据中两个极端值的离散程度,并不能真正反映这批数据离散的整体情况,从某种意义上讲它仅能说明这批数据的离散范围,而不能表示这批数据的整体离散程度。而“方差”充分利用每个数据的作用,削弱极端数据的作用,整体反映这批数据的离散程度,更科学、更完整地反映这批数据的离散程度(或波动程度),教学中,我们要强调这一点。
(2)方差单位有何意义?在方差公式的引入过程中,由于将每个数据与平均数作差后进行了平方,因此方差的结果单位
均以平方形式出现,如表示以cm为长度单位的一批数据,其方差单位为,表示以kg为重量单位的一批数据,其方差单位
为……教学中,学生很难理解这些方差单位。事实上,方差单位是没有意义的,因为我们计算方差的目的就是想用纯数量来刻画这批数据的离散程度,关心的不是单位,而是离散程度的大小。因此对方差的单位,教师在教学中应适当解释说明,但不作过分强调,在教学中去设计判断方差的单位是否正确一类题完全没有必要。但我们可引导学生如何去解决这个问题,即为了使
得描述数据的离散程度方差更有实际意义,我们可引入标准差s的概念,即。标准差的结果,既能从量上反映这批数据的离散程度,又能使单位与实际相一致,同时也避免了方差中由于平方后可能夸大离散的程度。
(3)为什么不用绝对值方式?在“方差”概念引入过程中,我们发现要消除每个数据与平均数作差后相加,结果会因为
每项相抵消的问题,解决这个问题有很多种方式,其中有一种对差取绝对值法,即设一批数,与平
均数作差后取绝对值得,将这些数据相加就能消除正负相抵的问题,接着采用
像方差引入一样得出来描述这批数据的离散程度,这种方式叫“平均差”。从“平均差”法的引入过程可以看到,它同样能刻画一批数据的离散程度,“平均差”值越大,说明这批数据的离散度大;“平均差”值越小,这批数据的离散度小。那为什么我们平时不采用这种较简洁的“平均差”法,而用计算较复杂的方差(或标准差)来刻画数据的离散程度呢?原因有:一是“平均差”法在遇及具体数据时较方便,教学中应充分肯定这种方法的优越性,但当遇到用字母来表示数时,绝对值就不如平方简捷了;二是用标准差来刻画一批数据的离散程度要比简单的“平均差”更能精确地反映一批数据的离散度。在中学里选择方差(标准差)的学习更是今后学习复杂统计内容的需要。
(4)一定要平均数相同吗?在比较两批数据的离散程度时,教材上例题、习题中所列出的两批数据,它们平均数都相同,即都是在两批数据平均数相同情况下利用方差(标准差)来判断其离散程度的。那么到底要不要平均数相同这个条件才能比较呢?平均数不等情况下能否比较两批数据的离散程度呢?事实上,每批数据的离散程度都是相对这批数据的平均数而言的,在比较两组数据的离散程度时,仅仅判断两组数据的波动大小,完全没必要一定要平均数相同,如判断下表中A、B两组数的离散程度。