高中数学第三章统计案例3.1回归分析的基本思想及其初步应用课堂探究学案新人教A版选修2_3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.1 回归分析的基本思想及其初步应用
课堂探究
探究一 求线性回归直线方程
(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.
(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.
【典型例题1】某商场经营一批进价是30元/件的小商品,在市场试验中发现,此商品的销售单价x (x 取整数)元与日销售量y 台之间有如下关系
(1)y 与x (方程的斜率保留一个有效数字)
(2)设经营此商品的日销售利润为P 元,根据(1)写出P 关于x 的函数关系式,并预测当销售单价x 为多少元时,才能获得最大日销售利润.
解:(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.
设回归直线为y ^
=b ^
x +a ^
,由题知x =42.5,y =34, 则求得
b ^
=
∑i =1
4
x i -x
y i -y
∑i =1
4
x i -x 2
=
-370
125
≈-3.
a ^=y -
b ^
x =34-(-3)×42.5=161.5.
∴y ^
=-3x +161.5. (2)依题意有
P =(-3x +161.5)(x -30)
=-3x 2
+251.5x -4 845
=-3⎝
⎛⎭⎪⎫x -251.562+251.52
12-4 845. ∴当x =251.56
≈42时,P 有最大值,约为426.
即预测当销售单价为42元时,才能获得最大日销售利润.
规律总结 先根据所给数据画出散点图,判断y 与x 是否具有线性相关关系,在此基础上利用回归方程系数的有关公式,求出相应的系数,然后结合函数知识求出日销售利润最大时的销售单价.
探究二 线性回归分析
解答本类题目应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R 2
来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.
【典型例题2】在一段时间内,某种商品的价格x 元和需求量y 件之间的一组数据为:
且知x 与y 解:x =1
5
×(14+16+18+20+22)=18,
y =15
×(12+10+7+5+3)=7.4,
∑i =1
5
x 2
i =142+162+182+202+222
=1 660, ∑i =1
5
y 2
i =122+102+72+52+32
=327, ∑i =1
5
x i y i =14×12+16×10+18×7+20×5+22×3=620,
∴b ^
=
∑i =1
5
x i y i -5x y
∑i =1
5
x 2
i -5x 2
=
620-5×18×7.41 660-5×182=
-46
40
=-1.15. ∴a ^
=7.4+1.15×18=28.1,
∴回归直线方程为y ^
=-1.15x +28.1. 列出残差表为
∴∑i =1
5
(y i -y i ^
)2
=0.3,∑i =1
5
(y i -y )2
=53.2,
R 2
=1-
∑i =1
5 y i -y i ^
2
∑i =15
y i -y
2
≈0.994.
故R 2
≈0.994,说明拟合效果较好.
规律总结 “相关指数R 2
、残差图”在回归分析中的作用:
(1)相关指数R 2是用来刻画回归效果的,由R 2
=1-
∑i =1
n
y i -y i ^
2
∑i =1
n
y i -y
2
可知R 2
越大,意味
着残差平方和越小,也就是说模型的拟合效果就越好.
(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高, 回归方程预报精度越高.
探究三 求非线性回归方程
非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图.把它与必修模块数学1中学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决.
【典型例题3】假设关于某设备的使用年限x 和支出的维修费用y (万元),有如下表的统计资料:
若由资料知y (1)线性回归方程y ^
=b ^
x +a ^
.
(2)估计使用年限为10年时,维修费用是多少? (3)计算总偏差平方和、残差平方和及回归平方和. (4)求R 2
并说明模型的拟合效果. 解:(1)将已知条件制成下表
设回归方程为y =b x +a ,
于是有b ^
=
∑i =1
5
x i y i -5x y
∑i =1
5
x 2
i -5x 2
=112.3-5×4×590-5×4
2
=1.23,a ^=y -b ^
x =5-1.23×4=0.08,
所以线性回归方程是y ^
=1.23x +0.08.
(2)当x =10时,y ^
=1.23×10+0.08=12.38, 即估计使用10年时维修费用是12.38万元.
(3)总偏差平方和:∑i =1
5
(y i -y )2
=15.78,
残差平方和:y 1^=2.46+0.08=2.54,y 2^=3.77,y 3^=5,y 4^=6.23,y 5^=7.46,∑i =1
5
(y i
-y i ^
)2
=0.651,
回归平方和:15.78-0.651=15.129.
(4)R 2
=1-
∑i =1
5 y i -y i ^
2
∑i =1
5
y i -y
2
=1-0.65115.78≈0.958 7,
模型的拟合效果较好,使用年限解释了95.87%的维修费用支出. 规律总结 把非线性回归问题转化为线性回归问题,拓展了解题思路. 探究四 易错辨析
易错点 残差平方和与相关指数的理解不清致误
【典型例题4】对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,
y 2),…,(x n ,y n ),则下列说法中不正确的是( )
A .由样本数据得到的回归方程y ^
=b ^
x +a ^
必过样本点的中心(x ,y ) B .残差平方和越小的模型,拟合的效果越好
C .用相关指数R 2
来刻画回归效果,R 2
的值越小,说明模型的拟合效果越好
D .若变量y 和x 之间的相关系数r =-0.936 2,则变量y 和x 之间具有线性相关关系 错解:B
错因分析:对残差平方和和相关指数R 2
理解错误.
正解:R 2
的值越大,说明残差平方和越小,也就是说模型的拟合效果越好. 答案:C。