中职数学中的一元线性回归教学技巧探讨
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中职数学中的一元线性回归教学技巧探讨
摘要:回归分析在中职数学中属于难度较大的内容,理解回归分析的思想、回归方程与函数的联系与区别、回归与相关的联系与区别、回归方程的估计与解释等问题,是进一步学习统计学等相关课程的必备基础。本文对一元线性回归的教学内容、形式、技巧作探讨。使用案例教学、启发式教学、实践教学等教学方法,使得中职学生能够深入理解回归分析并学以致用。
关键词:中职数学教学一元线性回归教学技巧
正如哲学所言,事物是变化的,于是有了变量。而一切自然现象和社会现象都不是孤立存在和变化的,事物与事物之间,变量与变量之间,都存在着某种关系。这类关系大体可分为两类:一类是确定性的,可以用函数关系表述。另一类是非确定性的,可以用统计关系表述。而回归分析是度量统计关系的方法中很常见和重要的一种。回归分析在中职数学中属于难度较大的内容,理解回归分析的思想、回归方程与函数的联系与区别、回归与相关的联系与区别、回归方程的估计与解释等问题,是进一步学习统计学等相关课程的必备基础。本文对一元线性回归的教学内容、形式、技巧作探讨。在教学中使用案例教学、启发式教学、实践教学等教学方法与技巧,使得中职学生能够深入理解回归分析并学以致用。
一、回归方程与函数的联系与区别。
学生会发现回归方程和函数公式法表达式非常像,比如一元线性回归方程的样本回归方程就是一条直线,也如函数表达式一样由y
和x表达,也可以叫因变量和自变量,也能代入x解出y的点估计值,斜率系数也可以和微积分中一样解释为导数,截距系数的解释也一样表示x=0时y的取值。所以学生容易把两者混淆,认为既然两者那么类似,为什么要那么辛苦地学习回归分析呢?所以笔者认为讲解回归分析,首先要让学生理解回归分析与函数的联系与区别。
一切自然现象和社会现象都不是孤立存在和变化的,事物与事物之间,变量与变量之间,都存在着某种关系。这类关系大体可分为两类:一类是确定性的,可以用函数关系表述。另一类是非确定性的,可以用统计关系表述。而回归分析是度量统计关系的方法中很常见和重要的一种。可以举一些函数关系的例子:某种商品的销售额y与销售量x之间的关系可表示为y=px(p为单价);圆的面积s 与半
函数关系统计关系
图1 函数关系与统计关系图形表述的联系与区别
函数关系与统计关系的联系与区别可以借用哲学语言,函数关系只关注必然性,认为x与y的关系是必然的,没有偶然性的。而统计关系(包含回归分析)是兼顾必然性与偶然性,试图在偶然性中找到必然性,这种必然性的表达就会类似于函数表达式,但是统计关系总是保留偶然性,不会忽视偶然性,正所谓偶然性与必然性的对立统一。
二、先讲解相关分析再讲解回归分析。
相关分析和回归分析具有非常密切的联系,首先,变量间有相关关系才可以做回归分析,学生发现只要把两个变量放在一起做回归就能够得到回归方程,就容易以为是数学游戏,不管变量间是否具有理论与常识中的关系,都使用回归分析,造成误用,得到的结果也无法解释或者缺乏现实意义,这就是伪相关和伪回归。可以举以下例子:g.乌迪内·尤乐在1926年发现用英格兰和威尔士1866—1911年间人口死亡率的年数据与英格兰所有结婚中到教堂举行仪式所占比例的相关系数是+0.95,然而没有一个英国政客为了赐予选民长生不老而提议关闭英格兰的教堂。韩德瑞发现,在英国,通货膨胀率与年累计降雨量有很强的正向关系,那么,如果英国能够降低其通货膨胀率,作为奖励,就可以享受改善气候之无法估计的意外效果,那该多好啊。但是,这种绝妙的结合是不会发生的。最简单的相关分析,就是做出皮尔逊简单相关系数r,但是r有很大的缺陷,比如图2中ab两条直线的相关系数r是一样的,但是x与y的关系明显不同,斜率与截距都不同,那么怎么表达出来呢?回归分析可以区分两条直线,这就导入了回归分析。
图2 两组样本具有相同的相关系数不同的回归方程
三、应用启发式教学方法从图形视角理解最小二乘法。
面对图2这样的样本点,怎样得到回归方程的估计呢?根据数形合一,即怎样在图形里面画直线最好,最能够提炼挖掘样本点的信息呢?这里我们使用启发式教学方法,或者类似于苏格拉底问答法。首先提问:面对这些样本点,怎样作一条最好的直线,最能代
表样本点所蕴含的信息呢?有学生说:让直线穿过所有的点,我问:你能够找到这样的直线吗?学生发现不能。又有人提出:两点决定一条直线,可以用两点。我反问:用哪两个点,为什么?丢弃信息的方法是最优的吗?如果可以这样,为什么说抽取样本越多越精确呢?学生发现无法回答,只得出不能只看两个点,应该考虑全部的样本,而且得出直线离这些样本点最近就可以了。怎么表示最近呢?点离直线的距离的度量有几种,比如欧式距离、水平距离、垂直距离,其中垂直距离容易处理,而且现实意义丰富,因为就是样本点真实值与样本回归直线估计值的差距,即为残差。有学生说:残差之和最小就可以了。我问:残差有正负数,如果相互抵消是否会误导?学生回答:那就用绝对值去掉负号。我又问:我们在学中学数学的解不等式和方程时,遇到绝对值都觉得不方便处理,这里用绝对值就会导致连加号不方便运算,怎么办?有学生回答:取平方。于是得到残差平方和最小表示样本回归直线是最好的。从而把问题变成求最小值的问题了,而这就是最小二乘法的来由。
此时引入孔子在《中庸》所说的“道不远人”,子曰:”道不远人,人之为道而远人,不可以为道。”即中庸之道是离人不远的,假使有人遵行中庸之道而远离人群,那就不可以称之为道了。物理学家名言:电场、磁场就像我身边的桌子和椅子一样真实地存在。数学难道离我们远吗?你不也会有这种直觉吗?只是数学形成一个逻
辑体系,对我们的直觉证实或证伪而已,于是更为严谨、简练、精确。同时数学形式上更为抽象、深奥、晦涩。
四、鼓励学生自己搜集数据,操作软件解决实践中的问题,培养学生学以致用的能力。
可以举实际生活中一些有趣的例子,比如:假设你接受了一份暑期工作,在当地的游乐园给游客猜体重。如果你对他们体重的猜测误差不超过3公斤,游客将付给你5元,而当误差超过3公斤时,你就要给游客一个小奖品,而每个奖品都是你花1元买来的。幸运的是,游乐园的经理在游客背后的墙壁上做了一些高度标记,使你能够准确地测量出游客的身高。除了身高和(通常还有)性别外,你无法得到游客更多的信息。怎样让你盈利尽可能多呢?你决定搜集数据进行回归,用于估计身高和体重之间的关系。因为大部分的参与者都是男性(女性那么喜欢减肥,才不愿意和你猜体重),你决定将你的样本局限于男性。这样的实践案例,既能够让学生在趣味实践中巩固知识,加深理解,增强解决实际问题的能力,又能够提高学习的积极性和学习兴趣,有利于进一步学习,形成良性循环。参考文献:
[1]王少平,杨继生,欧阳志刚.计量经济学[m].北京:高等教育出版社,2011.
[2]金兰.回归分析与方差分析教学的几点思考[j].统计教育,2006(11).
[3]曾丽娟.浅谈非统计专业学生回归分析的教学方法[j].知识
经济,2013(1).