8.2.2一元线性回归模型参数的最小二乘估计第2课时课件-高二下学期数学人教A版(2019)选择性(
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3 1921 3.26 10.40
4 1930 3.56 10.30
5 1936 3.71 10.20
6 1956 4.11 10.10
7 1960 4.17 10.00
8 1968 4.29 9.95
学习目标
新课讲授
得到散点图如下:
课堂总结
由表中的数据得到经验回归方程为:
yˆ2 0.4264398x 11.8012653
8.2.2 一元线性回归模 型参数的最小二乘估计
第2课时
学习目标
新课讲授
课堂总结
1.针对实际问题,会用一元线性回归模型进行预测. 2.通过对具体问题的进一步分析,能将某些非线性回归问题 转化为线性回归问题并加以解决. 3.通过具体实例,了解决定系数R2的意义和作用.
学习目标
新课讲授
课堂总结
知识点一:线性回归分析
学习目标
新课讲授
课堂总结
总结提升
常见非线性模型及其线性化的方法
(1)指数函数y=αeβx(α>0)
β>0
β<0
处理方法:两边取自然对数,得lny=lnα+βx,令y´=lny,x´=lnx,则y´=lnα+βx´
学习目标
新课讲授
(2)幂函数y=αxβ(α>0)
β>1
0<β<1
课堂总结
β<-1 -1<β<0
学习目标
新课讲授
课堂总结
归纳总结
一元线性回归模型解决问题的过程: 1.分析实际问题确定响应变量,通过散点图观察成对样本数据是否线性相关, 进而选择合适的统计模型;
2.通过统计软件得到模型参数的估计; 3.通过经验回归方程得到预测值、残差,分析残差图的特点,确定是否需要 改进模型等; 4.根据经验回归方程,可以预测结果.
这说明散点并不是随机分布在经验回归直线的周围, 而是围绕着经验回 归直线有一定的变化规律, 即成对样本数据呈现出明显的非线性相关的特征.
学习目标
新课讲授
课堂总结
问题:你能对模型进行修改,以使其更好地反映散点的分布特征吗?
散点更趋向于落在中间下凸且 递减的某条曲线附近.
函数y=-lnx的图象具有类似的形状特征. 注意到100m短跑的第一个世界纪录产生于1896年, 因此可以认为散点是集 中在曲线y=f(t)=c1+c2ln(t-1895)的周围,其中c1、c2为未知参数,且c2<0.
根据最小二乘法,由表中的数据得到经验回归方程为:
yˆ1 0.02033743t 49.76913031 将经验回归直线叠加到散点图,得到下图:
从图中可以看到,经验回 归方程较好地刻画了散点的变 化趋势,请再仔细观察图形, 你能看出其中存在的问题吗
学习目标
新课讲授
课堂总结
第一个世界纪录所对应的散点远 离经验回归直线, 并且前后两时间段 中的散点都在经验回归直线的上方, 中间时间段的散点都在经验回归直线 的下方.
①和②的R2分别为0.7325和0.9983.因此经验回归方程②的刻画效果比①好.
学习目标
新课讲授
课堂总结
归纳总结
1.建立非线性经验回归模型的基本步骤: (1)确定研究对象,明确哪个是解释变量,哪个是响应变量; (2)由经验确定非线性经验回归方程的模型; (3)通过变换,将非线性经验回归模型转化为线性经验回归模型; (4)按照公式计算经验回归方程中的参数,得到经验回归方程; (5)消去新元,得到非线性经验回归方程; (6)得出结果后分析残差图是否有异常 .
学习目标
新课讲授
课堂总结
2.在使用经验回归方程进行预测时,需注意的问题: (1)回归方程只适用于我们所研究的样本的总体; (2)我们所建立的回归方程一般都有时间性; (3)样本采集的范围会影响回归方程的适用范围; (4)不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是 预报变量的可取值的平均值.
学习目标
新课讲授
课堂总结
(2)残差分析:残差平方和越小,模型拟合效果越好.
n
2
Q ( yi yi )
i1
Q1 0.669,
Q2 0.004
Q2明显小于Q1,说明非线性回归方程的拟合效果要优于线性回归方程.
学习目标
新课讲授
课堂总结
(3)利用决定系数R2刻画回归效果.
由于
令
n
n
n
( yi y)2 ( yˆ y)2 ( yi yˆi )2,
以及相应的残差,如下表所示.
编号
胸径/cm
树高观测值/m 树高预测值/m
残差/m
1
18.1
18.8
19.4
-0.6
2
20.1
19.2
19.9
-0.7
3
22.2
21.0
20.4
0.6
4
24.4
21.0
20.9
0.1
5
26.0
22.1
21.3
0.8
6
28.3
22.1
21.9
0.2
7
29.6
22.4
22.2
学习目标
新课讲授
课堂总结
知识点二:非线性回归分析
问题:人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了 1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成 对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程.
编号 年份 记录/s
1 1896 11.80
2 1912 10.60
3 1921 10.40
4 1930 10.30
5 1936 10.20
6 1956 10.10
7 1960 10.00
8 1968 9.95
以世界纪录产生年份为横坐标,世界纪录为纵坐标作散点图,得下图:
散点看上去大致分 布在一条直线附近
学习目标
新课讲授
课堂总结
用Y表示男子短跑100m的世界纪录,t表示纪录产生的年份利用一元线性 回归模型来刻画世界纪录和世界纪录产生年份之间的关系
例1 经验表明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大, 树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高. 在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据如下表所 示,试根据这些数据建立树高关于胸径的经验回归方程.
编号
1
2
3
4
5
6
胸径/cm 18.1
处理方法:两边取自然对数,得lny=lnα+βlnx,令y´=lny,x´=lnx,则y´=lnα+βx´.
(3)对数函数y=α+βlogax
β>0
β<0
处理方法:令x´=logax,则y´=α+βx´.
学习目标
新课讲授
课堂总结
根据今天所学,回答下列问题: 1.使用经验回归方程进行预测时,需要注意哪些问题? 2.如何将一些非线性回归问题转化为线性回归问题? 3.在回归分析中,分析残差能帮助我们解决哪些问题? 4.如何判断回归模型的有效性?
课堂总结
思考:对于通过创纪录时间预报世界纪录的问题,我们建立了两个回归 模型,得到了两个回归方程,你能判断哪个回归方程拟合的精度更好吗?
(1)直接观察法 yˆ2 0.4264398t 11.8012653 yˆ2 0.4264398ln(t 1895) 11.8012653
① ②
① ②
散点图中各散点都非常靠近②的图象, 表明非线性经验回归方程②对于原始 数据的拟合效果远远好于经验回归方 程①.
i 1
Hale Waihona Puke Baidu
i 1
i 1
n
n
( yˆ y)2
( yi yˆi )2
R2
i 1 n
1
i 1 n
( yi y)2
( yi y)2
i 1
i 1
剔除量纲的影响
R2越大,表示
,即模型的拟合效果越好;
R2越小,表示残差平方和越大,即模型的拟合效果越差.
显然0≤R2≤1,R2越接近1,则线性回归刻画的效果越好.在一元线性回归模型 中 R2=r2,即决定系数R2等于响应变量与解释变量的样本相关系数r的平方.
h 0.2493d 14.84
散点大致分布在一条从左下角到右上角的直线附近,表明两个变量线性相 关,并且是正相关,因此可以用一元线性回归模型刻画树高与胸径之间的关系.
用d表示胸径,h表示树高,根据据最小二乘法,计算可得经验回归方程为 h 0.2493d 14.84.
学习目标
新课讲授
课堂总结
根据经验回归方程,由胸径的数据可以计算出树高的预测值(精确到0.1)
20.1
22.2
24.4
26.0
28.3
树高/m 18.8
19.2
21.0
21.0
22.1
22.1
编号
7
8
9
10
11
12
胸径/cm 29.6
32.4
33.7
35.7
38.3
40.2
树高/m 22.4
22.6
23.0
24.3
23.9
24.7
学习目标
新课讲授
课堂总结
解: 以胸径为横坐标,树高为纵坐标作散点图如下:
(*)
学习目标
新课讲授
课堂总结
将经验回归直线叠加到散点图,得到下图:
上图表明,经验回归方程对于成对数据具有非常好的拟合精度. 将x=ln(t-1895)代入 yˆ2 0.4264398x 11.8012653 得
yˆ2 0.4264398ln( t 1895) 11.8012653
学习目标
新课讲授
学习目标
新课讲授
课堂总结
y=f(t)=c1+c2ln(t-1895) 这是一个非线性经验回归函数,如何利用成对数据估计参数c1、c2
令x=ln(t-1895),则Y=c2x+c1 对数据进行变化可得下表:
编号 年份/t
x 记录/s
1 1896 0.00 11.80
2 1912 2.83 10.60
0.2
8
32.4
22.6
22.9
-0.3
9
33.7
23.0
23.2
-0.2
10
35.7
24.3
23.7
0.6
11
38.3
23.9
24.4
-0.5
12
40.2
24.7
24.9
-0.2
学习目标
新课讲授
课堂总结
以胸径为横坐标,残差为纵坐标,作残差图,如图:
观察残差表和残差图,可得残差的绝对值最大是 0.8,所有残差分布在 以横轴为对称轴、宽度小于2的带状区域内 .可见经验回归方程较好地刻画了 树高与胸径的关系,可以根据经验回归方程由胸径预测树高.