广东省汕头市高中数学 第二章 统计 2.3 变量间的相关关系教案 新人教A版必修3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《变量间的相关关系》
一、教学目标
1、知识与技能:
利用散点图判断线性相关关系,了解最小二乘法的思想及2回归方程系数公式的推导过程,利用电子表格求出回归直线的方程并对实际问题进行分析和预测,通过实例加强对回归直线方程含义的理解
2 、过程与方法:
①通过自主探究体会数形结合、类比、及最小二乘法的数学思想方法。
②通过动手操作培养学生观察、分析、比较和归纳能力,引出利用计算机等现代化教学工具的必要性。
3、情感、态度与价值观:
类比函数的表示方法,使学生理解变量间的相关关系,增强应用回归直线方程对实际问题进行分析和预测的意识。
利用计算机让学生动手操作,合作交流激发学生的学习兴趣。
二、教学重点、难点
重点:利用散点图直观认识两个变量之间的线性相关关系,了解最小二乘法的思想并利用此思想借助电子表格求出回归方程。
教学内容的难点:对最小二乘法的数学思想和回归方程的理解
教学实施过程中的难点:根据给出的线性回归方程的系数公式建立线性回归方程。
三、教学过程
(一)、创设情境导入新课
1、相关关系的理解
师:我们曾经研究过两个变量之间的函数关系:一个自变量对应着唯一的一个函数值,这两者之间是一种确定关系。
生活中的任何两个变量之间是不是只有确定关系呢?让学生举例,教师总结如:
生:不是。
师:能否举出反例?比如,年龄与身高。
生:身高与体重
生:教师水平与学生成绩。
生:网速与下载文件所需时间
师:不妨以教师水平与学生成绩为例,学生成绩与教师水平有关吗?
生:有,一般来说,教师水平越高,学生成绩越好
师:即“名师出高徒”,名师一定出高徒吗?生:不一定。
师:即学生成绩与教师水平之间存在着某种联系,但又不是必然联系,对于学生成绩与教师水平之间的这种不确定关系,我们称之为相关关系。
这就是我们这节课要共同探讨的内容变量间的相关关系。
(板书)
生活中还有很多描述相关关系的成语,如:“虎父无犬子”,“瑞雪兆丰年”
设计意图:通过学生熟悉的函数关系,引导学生关注生活中两个变量之间还存在的相关关系。
让学生体会研究变量之间相关关系的重要性。
感受数学来源于生活。
(二)、初步探索,直观感知
1、根据样本数据利用电子表格作出散点图,直观感知变量之间的相关关系
师:在研究相关关系前,同学们先回忆一下:函数的表示方法有哪些?
生:列表,画图象,求解析式。
师:下面我们就用这些方法来研究相关关系。
请同学们看这样一组数据:
探究: 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据: 根据上述数据,人体的脂肪含量与年龄之间有怎样的关系?
生:随着年龄增长,脂肪含量在增加师:有没有更直观的方式?生:画图
师生:用x轴表示年龄,y轴表示脂肪。
一组样本数据就对应着一个点。
由于数据比较多,我们借用电子表格来作图,请大家注意观察。
教师演示作图方法,学生观察
散点图
师:这个图跟我们所学过的函数图象有区别,它叫作散点图。
2、判断正、负相关、线性相关 学生观察,比较,讨论,
师:请同学们观察这4幅图,看有什么特点?
生:图1呈上升趋势,图2呈下降趋势。
师生:这就像函数中的增函数和减函数。
即一个变量从小到大,另一个变量也从小到大,或从大到小。
对于图1中的两个变量的相关关系,我们称它为正相关。
图2中的两个变量的相关关系,称为
负相关。
师:我们还可以判断出:年龄与身高是正相关,网速与下载文件所需时间是负相关。
生:后面两个图很乱,前面两个图中点的分布呈条状。
25.9
图
1
2
图图
3图4
师:从数学的角度来解释:即图1、2中的点的分布从整体上看大致在一条直线附近。
我们称图1、2中的两个变量具有线性相关关系。
这条直线叫做回归直线。
图3、4中的两个变量是非线性相关关系
师:这节课我们重点研究线性相关关系。
(板书) 设计意图 (三)、循序渐进、延伸拓展 1、找回归直线
师:下面我们再来看一下年龄与脂肪的 如果可以求出回归直线的方程,我们就可以清楚地了解年龄与体内脂肪含量的相关性。
这条直线可以作为两个变量具有线性相关关系的代表。
同学们能否画出这条直线?请完成数学实验1、画出回归直线。
(学生在计算机上用电子表格画回归直线) 数学实验1: 画出回归直线
学生方案一 学生方案二
生总结: 第二种方法好,因为所有的点离这条直线最近。
学生方案三
师:即,从整体上看,各点与此直线的距离和最小。
2、 利用最小二乘法推导回归系数公式。
师:我们现在来求距离和。
怎么求? 生:利用点到直线的距离公式
师生共同:只要求出使距离和最小的a 、b 即可。
但是,我们知道点到直线的距离公式计算复杂。
怎么办呢?以样本数据点A 为例, 可以看出: 在RT △ABC 中,(教师动画演示)
按照一对一的关系,直角边AC 越小,斜边AB
当AC 无限小时,AB 跟AC 可近似看作相等。
求AC 麻烦,不妨求AB 生:B A AB y y =-师:它表示自变量x 的一组数据:11(,)x y 22(,)x y ……(,)n n x y 。
当自变量x 取i x (i =1,2,……,n )时,可以得到
ˆi y
bx a =+(i =1,2,……,n ),它与实际收集到的i y 之间的偏差是 ˆ()i i i i y y
y bx a -=-+(i =1,2,……,n ) 这样用n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。
总的偏差为
1
ˆ()n
i
i
i y y
=-∑,偏差有正有负,易抵消,所以采用绝对值
1
ˆn
i
i i y
y
=-∑,由于带绝对值计算不方便所以换成平方,2
22221122331
ˆ()()()()()n
i i n n i Q y y
y bx a y bx a y bx a y bx a ==-=--+--+--+⋅⋅⋅+--∑现在的问题就归结为:当a ,b 取什么值时Q 最小。
将上式展开、再合并,就可以得到可以求出Q 取最小值时
2
2
2
1221221
111()()()()()()()()()n
n
i i i i n n i i i i n n i i i i i i x x y y x x y y Q n a y bx x x b y y x x x x ======⎡⎤⎡⎤----⎢⎥⎢⎥⎣⎦⎡⎤⎢⎥=--+---+-⎣⎦⎢⎥--⎢⎥⎣⎦
∑∑∑∑∑∑
1
122
21
1
()()()
n n
i
i
i i
i i n
n
i
i i i x x y y x y nx y
b x x x nx a y bx
====---=
=
--=-∑∑∑∑(其中11n i i x x n ==∑,1
1n i i y y n ==∑)
推导过程用到偏差的平方,由于平方又叫二乘方,所以这种使“偏差的和”最小的方法叫 “最小二乘法”。
设计意图:培养学生的动手操作能力,最小二乘法的思想是本节课的教学难点,先让学生动手操作画回归直线,教师动画演示,进一步演绎推理来分解难点、突破难点 3、利用电子表格的计算功能求出回归直线方程,并分析它的意义
师:利用最小二乘法就可以求出回归系数,进一步求出回归方程。
下面我们具体操作一下。
我们先明确几个符号的含义:i x 表示年龄,1x 是23,2x 是27,直到14x 是61。
i 从1到14 , i y 表示脂肪,1y 是9.5,2y 是17.8 。
i i x y 表示年龄与脂肪的成绩,2
i x 表示 年龄的平方
x
i
x y i i
2x i
218.5 529
480.6 729
826.8 1521
1061.9 1681
1237.5 2025
1288.7 2401
1410 2500
1568.8 2809
1630.8 2916
1758.4 3136
1755.6 3249
1943 3364
2112 3600
2110.6 3721 48.071 27.264286 19403.2 34181
y
14
1
x y
i i
i
∑
=
2
14
1
x
i
i
∑
=
11n i i x x n ==∑表示自变量年龄的平均数,11n
i i y y n ==∑表示因变量脂肪的平均数,2
1
n
i i x =∑表示自变量的
平方和,
1
n
i i
i x y =∑表示自变量与因变量乘积的和。
要求出 a ,b ,必须先求出这些量。
由于计算量大,
我们用EXCEL 来计算。
请大家注意观察
教师利用电子表格完成数学实验2、学生观察 数学实验2:求出下列各式的值(n=14)
11n i i x x n ==
∑= 1
1
n
i i y y n ==∑= 1
n i i
i x y =∑= 21
n
i
i x
=∑=
12
21
n
i i
i n
i i x y nx y
b x nx
==-=
=-∑∑ a y bx =-=
ˆy
bx a =+ 师: 通过计算,求出了0.448,0.5765a b =-= ˆ0.57650.448y
x =-(板书) 求出回归直线方程有什么用呢?
生:知道x 的值可以求ˆy
的值, 师:请同学们从表格中选取年龄x 的一个值代入上述回归直线的方程,看看得出的数据与真实数值之间的关系。
学生代入检验
ˆ0.5765500.44829.272
y
=⨯-=
生;估计值是29.272,与实际值28.2有偏差, 师;为什么会出现这样的结果? 生:回归直线是估计出的,把a 带入肯定有误差。
师:试预测某人37岁时,他体内的脂肪含量。
并说明结果的含义。
学生代入计算
ˆ0.5765370.44820.882
y
=⨯-=
师:我们能不能说他的体内脂肪含量的百分比一定是20.882%,? 生:不能。
只能说他体内的脂肪含量在20.90%,附近的可能性比较大
设计意图:回归方程的求法是本节课的教学重点,利用电子表格计算繁杂数据,激发学生的兴趣,通过教师演示,学生动手操作突出重点,引出利用现代技术工具解决问题的必要性。
(四)、线性回归分析思想在实际中的应用
总结:我们利用回归直线对年龄与脂肪的关系做了上述分析,这种分析方法叫做线性回归分析。
利用这种分析方法可以对生活中的很多问题进行分析与预测。
下面请同学们自己动手解决这样一个问题
例2有一个同学家开了一个小卖部,他为了研究气温对销售热饮的影响,经过统计,
得到一个卖出的热饮杯数与当天气温的对比表,
(1)画出散点图
(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律 (3)求回归方程
(4)如果某天的气温是2℃,预测这天卖出的热饮杯数
采用分组合作方式,学生分机操作,(一个学生操作,一个记录)展示学生操作情况 数学实验2:求出下列各式的值(n=11)
11n i
i x x n ==
∑= 1
1
n
i i y y n ==∑= 1
n i i
i x y =∑= 21
n
i
i x
=∑=
12
2
1
n
i i
i n
i
i x y nx y
b x
nx
==-=
=-∑∑ a y bx =-= ˆy bx a =+
设计意图:发展学生的应用意识,是高中数学课程标准所倡导的重要理念之一。
在教学中以具体问题为载体,加深学生对回归方程的理解,体验数学在实际生活中的应用
(五)利用相关系数判断线性相关程度
师:利用最小二乘法求出回归直线的方程后,可以对上面两个变量的关系进行分析与预测。
是不是所有的相关关系都可以求出回归直线的方程?请大家观察这4幅图
生;前两个是线性相关,可以求回归方程,后两个是非线性相关,直线不能很好地反映图中两个变量之间的关系。
显然求回归直线的方程是没有意义的。
有些变量线性相关,有些非线性相关,怎样衡量变量的线性相关程度呢?
这时我们引入一个量:相关系数
()()
n
i
i
x x y y r --=
∑
注意它的符号:当0r >时,x ,y 正相关,当0r <时,x ,y 负相关,统计学认为:
对于r ,若[]1,0.75r ∈--,那么负相关很强,若[]0.75,1r ∈,那么正相关很强, 若
(][)0.75,0.30r ∈--∈或r 0.30,0.75,那么相关性一般, 若[]0.25,0.25r ∈-,那么相关性较弱,
师:不同的相关性可以从散点图上直观地反应出来。
请同学们再观察这几幅散点图,判断图中的两个变量的相关关系的强弱。
生:图1、2正线性相关,图1中的点密集,相关性比图2好
师:利用相关系数也可以看出相关性,图1中r=0.97接近1。
图2中r=-0.85 所以可以总结出相关系数的绝对值越大,线性相关关系就越强。
0.97
r =图1
20.84
r =-图0.27
r =图30.05
r =-图4
设计意图:通过观察比较:使学生体会:相关系数的绝对值越大,用线性回归模型拟合样本数据的效果就越好
(五)、归纳总结,内化知识
师生:1、回归直线方程的求法
①先判断变量是否线性相关
②若线性相关,利用公式计算出a、b
③利用回归方程对生活实际问题进行分析与预测
2、思想方法:数形结合、归纳、类比、最小二乘法
(六)作业布置与板书设计:
1、创新应用:预测人口
师:我国是一个人口大国,估计人口数量及发展趋势是我们制定经济发展计划等一系列相关政策的基础,人口数量预测是一个复杂的问题,不仅是人口与时间两个变量之间的关系,还与国家经济状况,科技发展,自然灾害和战争等其他因素有关。
我们看下面的统计表1949至1994年人口数据资
料如下
试估计我国2010年的人口数
设计意图:目的是通过对未来人口的预测,让学生进一步体会线性回归思想在实际中的应用。
引导学生关注,社会关注生活。
2、实习作业:收集本班男生的身高和体重的数据,并利用统计知识对收集到的数据进行分析与预测。
设计意图:作业是学生信息的反馈,能在作业中发现和弥补教学中的不足,
(附)板书设计
数学实验。