2020_2021新教材高中数学成对数据的统计分析8.2一元线性回归模型及其应用课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i=1
附: =
,=y - x .
n
(xi- x )2
i=1
【解析】(1) x =87+76+753+66+63 =73,
y =78+66+751+64+61 =68,
xi- x
14 3 0 -7 -10 合计
(xi- x )2
196 9 0 49 100 354
yi- y
10 -2 3 -4 -7 —
结论:经验回归直线方程 我们将 = x+ 称为Y关于x的经验回归方程,也称经验回归函数或经验回归公
式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,
n
(xi- x )(yi- y )
i=1
求得的 , 叫做 b,a 的最小二乘估计, =
=
n
(xi- x )2
i=1
n
xiyi-n x y
而变化,如表为抽样试验结果:
转速x(转/秒)
16 14 12 8
每小时生产有缺陷的零件数
Y(件)
11 9 8 5
(1)画出散点图; (2)如果 Y 与 x 有线性相关的关系,求经验回归方程. 【思维导引】(1)根据表中数据作图. (2)根据经验回归方程公式求 , ,即可写出经验回归方程.
【解析】(1)画出散点图,如图所示:
有5名学生的数学和化学成绩如表所示:
学生学科
A B CDE
数学成绩(x) 87 76 73 66 63
化学成绩(Y) 78 66 71 64 61
(1)如果Y与x具有相关关系,求经验回归方程 = x+ ;
(2)预测如果某学生数学成绩为79分,他的化学成绩为多少?(结果取整数)
n
(xi- x )(yi- y )
【跟踪训练】 某山区为研究居民家庭月人均生活费支出和月人均收入的相关关系,随机
抽取10户进行调查,其结果如表:
试预测月人均收入为1 100元和月人均收入为1 200元的两个家庭的月人均生活 费,并进行残差分析.
所以
=
x iy i 6 x y
i1
6
x
2 i
6
x
2
1 076.2-6×17.5×9.487 ≈ 2 275-6×17.52
≈0.183,
i1
所以 = y - x ≈9.487-0.183×17.5≈6.285, 故所求经验回归方程为 =0.183x+6.285.
(2)由题意及(1)中的经验回归方程可得表:
yi- i
0.05 0.005 -0.08 -0.045 0.04 0.025
yi- y
-2.24 -1.37 -0.54 0.41
1.41 2.31
6
所以 (yi- i) 2=0.052+0.0052+(-0.08)2 i 1
+(-0.045)2+0.042+0.0252≈0.013 18,
6
4
4
(2) x =12.5, y =8.25, xiyi=438, xi2 =660,
4
x iy i 4 x y
所以 = i 1
4
x
2 i
4x
2
i 1
i 1
=4386-604-×41×21.52×.582.25 ≈0.728 6,
i1
= y - x =8.25-0.728 6×12.5=-0.857 5. 故经验回归方程为 =0.728 6x-0.857 5.
i=1
, =y - x .
n x2i -n x 2
i=1
1.某学生四次模拟考试时,其英语作文的减分情况如表:
考试次数 1
x
234
所减分数 4.5 4 3 2.5
Y
显然所减分数Y与模拟考试次数x之间有较好的线性相关关系,则其经验回归方程 为( ) A. =0.7x+5.25 B. =-0.6x+5.25 C. =-0.7x+6.25 D. =-0.7x+5.25
为研究质量x(单位:克)对弹簧长度Y(单位:厘米)的影响,对不同质量的6个物 体进行测量,数据如表所示:
x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图并求经验回归方程; (2)求出 R2; (3)进行残差分析.
【解析】(1)根据所给数据,作出散点图如图所示:
yi-
y
2=(-2.24)2+(-1.37)2+(-0.54)2+0.412+1.412+2.312=14.678 4,
i 1
6
(y i y i)2
所以
R2=1-
i= 1 6
(y i y )2
≈1-01.40.61738148
≈0.999 1.
i= 1
(3)①由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这 个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模 型; ②由表中数据可以看出残差点比较均匀地落在狭窄的水平带状区域中,说明选用 的线性回归模型的精度较高. 由以上分析可知,弹簧长度与质量具有线性关系.
=1-(-2.8)2+(-01..625)1 2+0.52+1.52+22 =1-01.56.5718 ≈0.9587. (4)经验回归方程 =1.23x+0.08,所以当 x=10 年时, =1.23×10+0.08=12.38(万 元), 即估计使用 10 年时维修费是 12.38 万元.
【类题通法】建立线性回归模型的基本步骤: (1)确定研究对象,明确解释变量和响应变量; (2)画出解释变量和响应变量的散点图,观察它们之间的关系(如是否存在线性关 系等); (3)由经验确定回归方程的类型; (4)按一定的规则估计回归方程的参数; (5)对所建立的模型进行残差分析,判断拟合效果.
由表中的数据可得 x =16 ×(5+10+15+20+25+30)
=17.5,
y =61 ×(7.25+8.12+8.95+9.90+10.9+11.8) ≈9.487,
6
xi2 =52+102+152+202+252+302=2 275,
i 1
6
i 1
xiyi=65×7.25+10×8.12+15×8.95+20×9.90+25×10.9+30×11.8=1 076.2,
【解析】由题意e为随机变量,e称为随机误差.根据随机误差的意义,可得E(e) =0. 答案:0
主题2 经验回归方程的求解 如何对具有线性相关关系的两个变量进行分析?
提示:对具有线性相关关系的变量,利用回归分析的方法进行研究.其步骤为 画散点图,求经验回归直线方程,并利用经验回归方程对模型刻画数据的效果 进行分析,借助残差分析对模型进行改造,使我们能够根据改进模型作出符合 实际的预测和决策.
【延伸探究】 本题条件不变,求:若实际生产中,允许每小时生产的产品中有缺陷的零
件最多为10个,那么机器的运转速度应控制在什么范围内?
【解析】要使y≤101 9. 故机器的转速应控制在14.9转/秒以下.
【类题通法】求回归直线方程的步骤 (1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系. (2)求回归系数:若存在线性相关关系,则求回归系数. (3)写方程:写出回归直线方程,并利用回归直线方程进行预测.
2=3.8-3.77=0.03; 3=5.5-5=0.5; 4=6.5-6.23=0.27; 5=7.0-7.46=-0.46; 所以残差的平方和为:(-0.34)2+0.032+0.52+0.272+(-0.46)2=0.651.
(3)R2=1- 5 0 . 6 5 1
(y i y)2
i1
(xi- x )(yi- y )
140 -6 0 28 70 232
5
=
(x i x )(yi y)
i1
5
(x i x )2
=233524 ≈0.655,
= y -i1 x =68-0.655×73=20.185,
所以 Y 对 x 的经验回归方程为 =0.655x+20.185.
(2)当x=79时, =0.655×79+20.185=71.93≈72, 所以预测该学生的化学成绩为72分.
【解析】选D. x =3, y =94+5 m ,
由回归直线
=1.9x+17.9经过样本中心
x
,
y
,可得94+5 m
=1.9×3+17.9,
解得m=24.
核心互动探究
探究点一 求经验回归方程
【典例1】一台还可以用的机器由于使用的时间较长,它按不同的转速生产出来 的某机械零件有一些会有缺陷,每小时生产有缺陷零件的多少随机器运转的速度
【解析】(1)由已知条件制成表:
于是有 =1129.03--55××442×5 =1120.3 =1.23, = y - x =5-1.23×4=0.08, 所以 =1.23x+0.08.
(2)由公式得 1=1.23×2+0.08=2.54; 2=1.23×3+0.08=3.77; 3=1.23×4+0.08=5; 4=1.23×5+0.08=6.23; 5=1.23×6+0.08=7.46. 所以 1=2.2-2.54=-0.34;
统计资料:
使用年限 23456
x
维修费用 2.2 3.8 5.5 6.5 7.0
Y
若由资料知,Y与x呈线性相关关系,试求: (1)经验回归方程 = x+ 的回归系数 , ; (2)求残差平方和; (3)求R2; (4)估计使用年限为10年时,维修费用是多少?
【思维导引】(1)利用回归系数计算公式求解; (2)先求残差,再求平方和; (3)代入公式求解; (4)将x=10代入经验回归方程求 的值.
8.2 一元线性回归模型及其应用
基础预习初探
主题1 一元线性回归模型 某商场近5个月的销售额和利润额如表所示:
(1)两变量x与Y是否具有函数关系? 提示:销售额x与利润额Y之间不是函数关系.
(2)两变量x与Y是否具有相关关系?
提示:作出散点图如图所示:
由图可知两个变量具有线性相关关系.
结论:一元线性回归模型:
【跟踪训练】 随着西部大开发的深入,西南地区的大学越来越受到广大考生的青睐,如
表是西南地区某大学近五年的录取平均分高于省一本线分值对比表:
(1)根据表中数据可知,Y 与 t 之间存在线性相关关系,求 Y 关于 t 的经验回归方程;
(2)假设 2021 年该省一本线为 520 分,利用(1)中求出的回归方程预测 2021 年该大
Ybxae,
Ee0,De2
为Y关于x的一元线性回归模型.其中Y称为因变量或响应变
量;x称为自变量或解释变量;a称为截距参数,b称为斜率参数;e是Y与bx+a
之间的随机误差.
1.在线性回归模型Y=bx+a+e中,下列说法正确的是( ) A.Y=bx+a+e是一次函数 B.因变量Y是由自变量x唯一确定的 C.因变量Y除了受自变量x的影响外,可能还受到其他因素的影响,这些因素 会导致随机误差e的产生 D.随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生
【解析】选D. x =1+2+4 3+4 =25 , y =4.5+4+4 3+2.5 =72 , 即样本中心点为52,72 ,代入满足 =-0.7x+5.25.
2.相关变量x,Y的样本数据如下表: x1 2 34 5 Y 20 21 m 26 27
经回归分析可得Y与x呈线性相关,并由最小二乘法求得相应的经验回归方程为 =1.9x+17.9,则表中的m=( ) A.23.6 B.23 C.24.6 D.24
学录取平均分. n
(ti t)(yi y)
参考公式: = i1 5
(ti t)2
i1
, = y - ·t
【解析】(1)由题知: t =51 (1+2+3+4+5) =3,
y
=51
(28+34+41+47+50) 5
=40,
(ti t)(yi y)
所以得: = i1 5
=5.7,
(ti t)2
【解析】选C.线性回归模型Y=bx+a+e中,方程表示的不是确定性关系,因此 不是一次函数,A错误.选项B中,因变量Y不是由自变量x唯一确定的,B 错.选项D中,随机误差是不能避免的,只能将误差缩小,但是不能没有误差, 因此D错.
2.具有线性相关的两个随机变量x,Y可用线性回归模型Y=bx+a+e表示,通 常e是随机变量,称为随机误差,它的均值E(e)=________.
i1
= y - ·t =40-3×5.7=22.9,
故所求经验回归方程为 =5.7t+22.9.
(2)由(1)知:当t=6时, =57.1,故预测该大学2021年的录取平均分为520+57.1 =577.1.
探究点二 建立线性回归模型求解问题
【典例2】假设关于某设备的使用年限x和所支出的维修费用Y(万元),有如表的