数学高考总复习重点精品课件:_《1.1回归分析的基本思想及其初步应用》课件_新人教A版选修1-2-PPT精选文档5

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4.非线性回归分析 (1)非线性相关关系:样本点分布在某一条曲线的周围,而不是 一条直线附近.我们就称这两个变量之间不具有线性相关关系 而是非线性相关关系. (2)非线性回归方程线性化 ①y=axn(其中a,x,y均为正值)(幂函数型函数) lg y=lg a+n lg x,令u=lg y,v=lg x,b=lg a, 则u=nv+b,图象为一直线. ②y=cax(a>0,c>0)(指数型函数) lg y=x lg a+lg c,令u=lg y,b=lg c,d=lg a, 则u=dx+b,图象为一直线.
=1350780≈0.196 2,
i=1
a^= y -b^ x =0.181 42. 故所求回归直线方程为y^=0.196 2x+1.814 2. 回归直线如上图所示.
(3)据(2),当 x=150 m2 时,销售价格的估计值为 y^=0.196 2×150+1.814 2=31.244 2(万元).
n
差.
(yi-y^ i)2
称为残差平方和
i=1
利用图形来分析残差特性,作图时纵坐标为 残差 ,横 残差图 坐标可以选为样本编号 ,或 身高数据 ,或体重估计值
等,这样作出的图形称为残差图
残差 图法
残差点比较均匀地落在水平的带状区域内,说明选 用的模型比较适合,这样的带状区域的宽度越窄, 说明模型拟合精度越高
解 (1)数据对应的散点图如下图所示:
(2) x =15i=51xi=109,i=51 (xi- x )2=1 570,
5
y =23.2, (xi- x )(yi- y )=308.
i=1
设所求回归直线方程为y^=b^ x+a^ ,
5
xi- x yi- y
i=1
则b^ =
5
xi- x 2
【变式1】 以下是某地搜集到的新房屋的销售价格y和房屋的面积x 的数据:
房屋面积/m2 115 110 80 135 105 销售价格/万元 24.8 21.6 18.4 29.2 22 (1)画出数据对应的散点图; (2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
【变式2】 已知某种商品的价格x(元)与需求量y(件)之间的关系有如 下一组数据:
x 14 16 18 20 22 y 12 10 7 5 3
求y对x的回归直线方程,并说明回归模型拟合效果的好坏.
解 x =15(14+16+18+20+22)=18, y =15(12+10+7+5+3)=7.4,
题型二 线性回归分析 【例2】 为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,
对不同重量的6个物体进行测量,数据如下表所示:
x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图并求线性回归方程; (2)求出R2; (3)进行残差分析.
6
6
x2i =2 275,xiyi=1 076.2
i=1
i=1
计算得,b^ ≈0.183,a^ ≈6.285,
所求回归直线方程为y^=0.183x+6.285.
(2)列表如下: yi-y^i 0.05 0.005 -0.08 -0.045 0.04 0.025 yi- y -2.24 -1.37 -0.54 0.41 1.41 2.31
试一试:下表是x和y之间的一组数据,则y关于x的线性回归方程必 过( ).
x1234 y1357
A.点(2,3)
B.点(1.5,4)
C.点(2.5,4)
D.点(2.5,5)
提示 选 C.线性回归方程必过样本点的中心( x , y ),即(2.5,4).
3.刻画回归效果的方式
残差
数据点和它在回归直线上相应位置的差异(yi-y^i)是随机 误差.称e^i=yi-y^i 为残差,e^i 称为相应于点(xi,yi)的残
题型一 求线性回归方程 【例1】 某班5名学生的数学和物理成绩如下表:
学生
学科
A B CDE
数学成绩(x) 88 76 73 66 63
物理成绩(y) 78 65 71 64 61
(1)画出散点图; (2)求物理成绩y对数学成绩x的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩. [思路探索] 先利用散点图分析物理成绩与数学成绩是否线性相关, 若相关再利用线性回归模型求解.
题型三 非线性回归分析 【例3】 下表为收集到的一组数据:
x 21 23 25 27 29 32 35 y 7 11 21 24 66 115 325 (1)作出x与y的散点图,并猜测x与y之间的关系; (2)建立x与y的关系,预报回归模型并计算残差; (3)利用所得模型,预报x=40时y的值.
(1)画出散点图或进行相关性检验,确定两变量x、y是 否线性相关.由散点图得x、y之间的回归模型. (2)进行拟合,预报回归模型,求回归方程.
(3)求线性回归方程的步骤: ①先把数据制成表,从表中计算出 x , y , x12+x22+…+x2n,x1y1+x2y2+…+xnyn 的值; ②计算未知参数a^,b^; ③写出线性回归方程^y=b^x+a^.
2.线性回归分析 (1)由线性回归方程给出的是一个预报值而非精确值. (2)随机误差的主要来源 ①线性回归模型与真实情况引起的误差; ②省略了一些因素的影响产生的误差; ③观测与计算产生的误差. (3)残差分析是回归分析的一种方法. (4)用相关指数R2来刻画回归效果. R2越大,意味着残差平方和越小,即模型的拟合效果越好;R2 越小,残差平方和越大,即模型的拟合效果越差.
1.1 回归分析的基本思想及其初步应用
【课标要求】 1.了解随机误差、残差、残差分析的概念; 2.会用残差分析判断线性回归模型的拟合效果; 3.掌握建立回归模型的步骤; 4.通过对典型案例的探究,了解回归分析的基本思想方法
和初步应用.
【核心扫描】 1.利用散点图分析两个变量是否存在相关关系,求线性回归方
6
所以
(yi-y^ i)2≈0.013
6
18,
(yi- y )2=14.678 4.
i=1
i=1
所以,R2=1-01.40.16378184≈0.999 1, 回归模型的拟合效果较好.
(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确 认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠 正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀 地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归 模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系. 规律方法 当资料点较少时,也可以利用残差表进行残差分析,注 意计算数据要认真细心,残差分析要全面.
i=1
i=1
其中 x =1ni=n1xi, y =1ni=n1yi,( x , y )称为样本点的中心.
(3)解释变量和预报变量 线性回归模型与一次函数模型的不同之处是增加了随机误差项e, 因变量y由 自变量x 和 随机误差e 共同确定,即自变量x只解 释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变 量y称为预报变量.
解 (1)散点图如图.
(2) x =15×(88+76+73+66+63)=73.2, y =15×(78+65+71+64+61)=67.8.
5
xiyi=88×78+76×65+73×71+66×64+63×61=25 054.
i=1
5
x2i =882+762+732+662+632=27 174.
i=1
5
xiyi-5 x y
i=1
所以b^ =
5
=25
054-5×73.2×67.8 27 174-5×73.22
x2i -5 x 2
i=1
≈0.625.
a^= y -b^ x ≈67.8-0.625×73.2=22.05. 所以 y 对 x 的回归直线方程是 y^=0.625x+22.05. (3)x=96,则y^=0.625×96+22.05≈82, 即可以预测他的物理成绩是 82.
e为
随机误.差
(2)对参数 a 和 b 的估计,由《数学必修 3》可知:最小二乘法估 计a^和b^就是未知参数 a、b 的最好估计,其计算公式为
n
n
xi- x yi- y xiyi-n x y
i=1
b^ =
i=1

,a^ = y -b^ x ,
n
xi- x 2
n
x2i -n x 2
[思路探索] 作残差分析时,一般从以下几个方面予以说明:(1)散 点图;(2)相关指数;(3)残差图中的异常点和样本点的带状分布区 域的宽窄.
解 (1)散点图如图
x =16(5+10+15+20+25+30)=17.5, y =16(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,
5
x2i =142+162+182+202+222=1 660,
i=1
5
xiyi=14×12+16×10+18×7+20×5+22×3=620,
i=1
5
xiyi-5 x y
i=1
所以b^ =
5
Байду номын сангаас
=62106-605-×51×8×1872.4=-1.15.
x2i -5 x 2
i=1
a^ =7.4+1.15×18=28.1, 所以所求回归直线方程是:y^=-1.15x+28.1. 列出残差表:
3.建立回归模型的基本步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报 变量. (2)画出确定好的解释变量和预报变量的散点图,观察它们之间 的关系(如是否存在线性关系等). (3)由经验确定回归方程的类型(如我们观察到数据呈线性关系, 则选用线性回归方程). (4)按一定规则(如最小二乘法)估计回归方程中的参数. (5)得出结果后分析残差图是否有异常(如个别数据对应残差过大 或残差呈现不随机的规律性等).若存在异常,则检查数据是否 有误,或模型是否合适等.
残差平
残差平方和为
n

(yi-y^ )2,残差平方和
越小
,模型
i=1
方和
拟合效果越好
n

yi-y^ i2
i=1
相关指 R2=1-
,R2 表示 解释 变量对 预报 变量变
数 R2
n
yi- y 2
i=1
化的贡献率,R2 越接近于 1,表示回归的效果越好
想一想:回归分析中,利用线性回归方程求出的函数值一定是真实 值吗?为什么? 提示 不一定是真实值,利用线性回归方程求的值,在很多时候是 个预报值,例如,人的体重与身高存在一定的线性关系,但体重除 了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动 等.
程.(重点) 2.回归模型的选择,特别是非线性回归模型.(难点、易错点)
自学导引
1.回归分析
回归分析是对具有 相关关系 的两个变量进行统计分析的一种常
用方法.
2.线性回归模型
(1)由散点图易发现,样本点散布在某一条直线附近,而不是一
条直线上,不能用一次函数y=bx+a描述它们之间的关系,因
此用线性回归模型y=bx+a+e来表示,其中a、b为未知参数,
名师点睛 1.线性回归方程
(1)在分析两个变量的相关关系时,可根据样本数据散点图确定 两个变量之间是否存在相关关系,然后利用最小二乘法求出回 归直线方程. (2)求线性回归方程^y=b^x+a^的关键是求未知参数a^和b^,其中b^ 可借助于计算器求出,因为a^= y -b^ x ,即 y =b^ x +a^,所以点 ( x ,y )一定满足线性回归方程,即回归直线一定过点( x ,y ).
yi-y^i 0 0.3 -0.4 -0.1 0.2 yi- y 4.6 2.6 -0.4 -2.4 -4.4
5
所以,
(yi-y^ i)2=0.3,
5

(yi- y )2=53.2,
i=1
i=1
5

yi-y^ i2
i=1
R2=1-
≈0.994,
5
yi- y 2
i=1
所以回归模型的拟合效果很好.
[规范解答] (1)作出散点图如下图,从散点图可以看出x与y不具有 线性相关关系,根据已有知识可以发现样本点分布在某一条指数 函数曲线y=c1ec2x的周围,其中c1、c2为待定的参数.(4分)
规律方法 (1)散点图是定义在具有相关关系的两个变量基础上的, 对于性质不明确的两组数据,可先作散点图,在图上看它们有无关 系,关系的密切程度,然后再进行相关回归分析. (2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时, 求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫 无意义.
相关文档
最新文档