2025高考数学一轮复习-9.1.2-线性回归方程【课件】
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出). 根据市场调研数据,若该产品单价定为100元,则签订9千件订单的概 率为0.8,签订10千件订单的概率为0.2;若单价定为90元,则签订10千 件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料 成本为10元,根据(2)的结果,企业要想获得更高利润,产品单价应选 择100元还是90元,请说明理由.
因为 y =3860=45,
8
uiyi-8 u y
i=1
所以b^ =
8
u2i -8 u 2
i=1
=1831..45- 3-8×8×0.03.411×545=06.611=100,
则a^ = y -b^ u =45-100×0.34=11, 所以y^ =11+100u, 所以 y 关于 x 的回归方程为y^=11+10x0.
三、非线性回归问题
知识梳理
解非线性回归分析问题的一般步骤 有些非线性回归分析问题并不给出函数,这时我们可以根据已知数据 画出散点图,与学过的各种函数(幂函数、指数函数、对数函数等)的图 象进行比较,挑选一种跟这些散点拟合得最好的函数,用适当的变量 进行变换,把问题转化为线性回归分析问题,使之得到解决.
n
v2i -n
v
2
i=1
i=1
解 ①当产品单价为100元,设订单数为m千件,因为签订9千件订单的 概率为0.8,签订10千件订单的概率为0.2, 所以E(m)=9×0.8+10×0.2=9.2, 所以企业利润为 100×9.2-9.2×190.20+21=626.8(千元). ②当产品单价为90元,设订单数为n千件, 因为签订10千件订单的概率为0.3,签订11千件订单的概率为0.7, 所以E(n)=10×0.3+11×0.7=10.7,
解 ∵ x =2+3+45+5+6=4,
y =2.2+3.8+55.5+6.5+7.0=5.
5
xiyi-5 x y =112.3-5×4×5=12.3,
i=1
5
x2i -5 x 2=90-5×42=10,
i=1
5
y2i -5 y 2=140.8-125=15.8,
i=1
所以 r= 101×2.315.8= 1125.38= 21×2.379≈1.41×2.38.9≈0.987.
x1 2 3 4 5 678 y 112 61 44.5 35 30.5 28 25 24
根据以上数据,绘制了散点图.
观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型 y= a+bx和指数函数模型 y=cedx 分别对两个变量的关系进行拟合.已求得用指数 函数模型拟合的回归方程为y^=96.54e-0.2x,ln y 与 x 的相关系数 r1=-0.94.
5
x2i =882+762+732+662+632=27 174.
i=1
5
xiyi-5 x y
i=1
所以b^ =
5
=25
054-5×73.2×67.8 27 174-5×73.22
x2i -5 x 2
i=1
≈0.625,
a^ = y -b^ x ≈67.8-0.625×73.2=22.05.
所以所求线性回归方程是y^ =0.625x+22.05.
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并 用其估计产量为10千件时每件产品的非原料成本;
解 y 与1x的相关系数为
8
uiyi-8 u y
r2=
i=1
8
u2i -8
u
2
8
y2i -8
y
2
i=1
i=1
=
61 0.61×6
≈0.99. 185.5
因为|r1|<|r2|,所以用反比例函数模型拟合效果更好, 当 x=10 时,y=11000+11=21(元), 所以当产量为10千件时,每件产品的非原料成本为21元.
内容索引
一、线性回归模型 二、利用线性回归方程对总体进行估计 三、非线性回归问题
随堂练习
对点练习
一、线性回归模型
问题 如果散点图中的样本点大体分布在一条直线附近,怎样选择恰当 的直线反映两个变量之间的线性相关关系? 提示 可以用y=a+bx+ε来反映两个变量之间的线性关系.
知识梳理
1.随机误差 具有线性相关关系的两个变量的取值x,y,y的值不能由x完全确定,它 们之间是统计相关关系,可将x,y之间的关系表示为y=a+bx+ε,其 中 a+bx 是确定性函数, ε 称为随机误差. 2.随机误差产生的主要原因 (1)所用的 确定性函数 不恰当引起的误差; (2)忽略了 某些因素的影响 ; (3)存在 观测 误差.
参考数据其中ui=x1i:
8
uiyi u
i=1
8
8
u 2 u2i yi
i=1
i=1
8
y2i
i=1
0.61×6 185.5 e-2
183.4 0.34 0.115 1.53 360 22 385.5
61.4
0.135
(1)用反比例函数模型求y关于x的回归方程;
解 令 u=1x,
则 y=a+bx可转化为 y=a+bu,
5
xiyi-5 x y
i=1
则b^ =
5
=1 318405--55××55×2 50=6.5,
x2i -5 x 2
i=1
a^ = y -b^ x =50-6.5×5=17.5.
故所求的线性回归方程是y^ =6.5x+17.5.
跟踪训练1 某班5名学生的数学和物理成绩如表:
学科
学生
A
B
C
D
E
数学成绩(x)
88
76
73
66
63
物理成绩(y)
78
65
71
64
61
求物理成绩y对数学成绩x的线性回归方程.
解 x =15×(88+76+73+66+63)=73.2,
y =15×(78+65+71+64+61)=67.8.
5
xiyi=88×78+76×65+73×71+66×64+63×61
i=1
=25 054.
一般步骤为:
说明:由于涉及的数据比较多,考虑到可操作性,考试时往往会给出 散点图,或将画散点图这一步骤省略,只需要选一些数据,画一下草 图,作出判断即可,并且相关数据都会直接给出.
例3 某企业为确定下一年投入某种产品的研发费用,需了解年研发费 用x(单位:千万元)对年销售量y(单位:千万件)的影响,统计了近10年 投入的年研发费用xi与年销售量yi(i=1,2,…,10)的数据,得到散点图 如图所示.
二、利用线性回归方程对总体进行估计
例2 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得如 表数据:
x 6 8 10 12 y23 5 6 (1)请画出上表数据的散点图;
解 散点图如图所示.
x 6 8 10 12 y23 5 6
(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 y^=b^ x+a^ ;
n
ui- u vi- v
i=1
的斜率和截距的最小二乘估计分别为β^ =
,α^ = v -β^ u .
n
ui- u 2
i=1
解 对y=c·xd两边取对数,得ln y=ln c+dln x,
即v=ln c+du.
10
ui
由表中数据求得
u
=
v
i=1
= 10
=1150=32,
n
ui- u vi- v
跟踪训练2 假设关于某种设备的使用年限x(单位:年)与所支出的维 修费用y(单位:万元)有如下统计资料:
x2 3 4 5 6
y 2.2 3.8 5.5 6.5 7.0
5
5
5
已知x2i =90,y2i ≈140.8,xiyi=112.3, 79≈8.9, 2≈1.4.
i=1
i=1
i=1
(1)计算y与x之间的相关系数(精确到0.001),并求出线性回归方程;
3.线性回归模型中 a,b 值的求法 y= a+bx+ε 称为线性回归模型. a,b 的估计值为a^ ,b^ ,则
n
n
xi- x yi- y xiyi-n x y
b^ =i=1
i=1
=
,
n
n
xi- x 2
x2i -n x 2
i=1
i=1
a^ =___y_-__b_^ _x___.
4.回归直线和线性回归方程 直线y^=a^ +b^ x 称为回归直线,此直线方程即为线性回归方程,a^ 称为_回__归__
截距 ,b^ 称为 回归系数 ,y^称为 回归值 . 注意点:
n
xi- x yi- y
i=1
(1)线性回归方程的系数b^ 的计算,有时利用公式b^ =
;
n
xi- x 2
i=1
(2)线性回归方程y^=b^ x+a^ 必经过样本点的中心( x , y ).
例1 某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元) 之间有如下对应数据:
第9章 9.1 线性回归分析
学习目标
1.能结合实例,根据散点图,判断两个变量是否具有相关关系. 2.了解最小二乘法原理,会求线性回归方程,并能根据线性回归
方程进行预测.
导语
恩格尔系数(Engel’s Coefficient)是根据恩格 尔定律得出的比例数,指居民家庭中食物支 出占消费总支出的比重,是衡量生活水平高 低的一个指标.其计算公式:恩格尔系数=食 物支出金额÷总支出金额. 一个家庭收入越少,家庭收入中或者家庭总支出中用来购买食物的支出所占 的比例就越大,随着家庭收入的增加,家庭收入中或者家庭支出中用来购买 食物的支出所占比例将会下降. 恩格尔系数是预测生活水平高低的一个模型,那么当两个变量线性相关时, 我们如何对样本数据建立一个模型进行预测?
x2 4 5 6 8 y 30 40 60 50 70 求线性回归方程.
解 列出下表,并用科学计算器进行有关计算.
i
1
2
3
4
5
xi
2
4
5
6
8
yi
30
40
60
50
70
xiyi
60
160
300
300
560
x2i
4
16
25
36
64
5
5
x =5, y =50,x2i =145,xiyi=1 380
i=1
i=1
10
vii=1Fra bibliotek1010
ui (ui- u )(vi- v )
i=1
i=1
10
(ui- u )2
i=1
15 15
28.25
56.5
根据第(1)问的判断结果及表中数据,求 y 关于 x 的回归方程. 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v^ =α^ +β^ u
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线
n
uivi-n u v
i=1
v^ =α^ +β^ u 的斜率和截距的最小二乘估计分别为:β^ =
,α^ =
n
u2i -n u 2
i=1
v -β^ u ,相关系数 r=
n
uivi-n u v
i=1
n
u2i -n
u
2
5
xiyi-5 x y
i=1
又b^ =
5
=112.3-150×4×5=1.23.
x2i -5 x 2
i=1
a^ = y -b^ x =5-1.23×4=0.08. 所以线性回归方程为y^ =1.23x+0.08.
(2)根据线性回归方程,预测假设使用年限为10年时,维修费用约是多 少万元?
解 当 x=10 时,y^=1.23×10+0.08=12.38(万元), 即假设使用10年时,维修费用约为12.38万元.
解 x =6+8+410+12=9, y =2+3+4 5+6=4,
4
x2i =62+82+102+122=344,
i=1
4
xiyi=6×2+8×3+10×5+12×6=158,
i=1
b^ =15384-4-4×4×9×924=2104=0.7,
a^ = y -b^ x =4-0.7×9=-2.3,
②处理方法:设x′=ln x,原方程可化为y=bx′+a, 再根据线性回归模型的方法求出a,b. (3)y=bx2+a型 处理方法:设x′=x2,原方程可化为y=bx′+a,再根据线性回归模 型的方法求出a,b.
跟踪训练3 某企业新研发了一种产品,产品的成本由原料成本及非原 料成本组成.每件产品的非原料成本y(元)与生产该产品的数量x(千件)有 关,经统计得到如下数据:
i=1
d^ = n ui- u 2
=2586..255=12.
i=1
令 ln c=m,则m^ = v -d^ u =32-12×32=34,
3
即c= e 4 .
3
所以年销售量y与年研发费用x的回归方程为y= e4 x.
(2)对数函数型y=bln x+a ①函数y=bln x+a的图象,如图所示.
故线性回归方程为y^ =0.7x-2.3.
(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.
n
xiyi-n x y
i=1
参考公式:b^ =
,a^ = y -b^ x .
n
x2i -n x 2
i=1
解 由(2)中线性回归方程可知,当 x=9 时,y^=0.7×9-2.3=4,即预测 记忆力为 9 的同学的判断力为 4.
(1)利用散点图判断y=a+bx和y=c·xd(其中c,d均为大于0的常数)哪一 个更适合作为年销售量y和年研发费用x的回归方程类型(只要给出判断 即可,不必说明理由);
解 由散点图可知,选择回归类型y=c·xd更适合.
(2)对数据作出如下处理,令μ1=ln xi,vi=ln yi,得到相关统计量的值如下表: