【原创】人教A版选修2-3:第三章 3.1 回归分析的基本思想及其初步应用
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
首页
上一页
下一页
末页
结束
题点二:非线性回归分析 2.为了研究某种细菌随时间 x 变化繁殖个数 y 的变化,收集数据
如下 时间 x/天 1 2 3 4 5 6 繁殖个数 y 6 12 25 49 95 190
(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的 散点图; (2)求 y 与 x 之间的回归方程.
在 y 轴上.
(× )
(3)R2 越小, 线性回归模型的拟合效果越好.
(× )
首页
上一页
下一页
末页
结束
2.从散点图上看,点散布在从左下角到右上角的区域内, 两个变量的这种相关关系称为________. 答案:正相关
3.在残差分析中, 残差图的纵坐标为________. 答案:残差
首页
上一页
下一页
末页
结束
首页
上一页
下一页
末页
结束
预习课本 P80~89,思考并完成以下问题
1.什么是回归分析?
2.什么是线性回归模型?
3.求线性回归方程的步骤是什么?
首页
上一页
下一页
末页
结束
[新知初探]
1.回归分析 (1)回归分析 回归分析是对具有 相关关系 的两个变量进行统计分析的一 种常用方法.
首页
上一页
下一页
首页
上一页
下一页
末页
结束
用已知向量表示未知向量 题点一:线性回归分析 1.为研究质量 x(单位:g)对弹簧长度 y(单位:cm)的影响,
对不同质量的 6 个物体进行测量,数据如表所示: x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图并求回归直线方程; (2)求出 R2 并说明回归模型拟合的程度; (3)进行残差分析.
结束
4.甲、乙、丙、丁四位同学各自对 A,B 两变量的线性相关性做 试验,并用回归分析方法分别求得相关系数 r 与残差平方和 m 如表: 甲乙丙丁 r 0.82 0.78 0.69 0.85 m 106 115 124 103
则_____同学的试验结果体现 A,B 两变量更强的线性相关性. 答案:丁
上一页
下一页
末页
结束
(2)列出残差表为 yi-^yi 0.05 0.005 -0.08 -0.045 0.04 0.025 yi- y -2.237 -1.367 -0.537 0.413 1.413 2.313
6
6
所以 (yi-^yi)2≈0.013 18, (yi- y )2=14.678 3.
i=1
i=1
^a= y -^b x .
首页
上一页
下一页
末页
结束
(3)线性回归模型 线性回归模型的完整表达式为yE=eb=x+0,a+Dee,=σ2, 其中 a, b 为模型的未知参数,通常 e 为 随机变量 ,称为 随机误差 .x 称 为 解释 变量,y 称为 预报 变量.
首页
上一页
下一页
末页
结束
[点睛] (1)非确定性关系:线性回归模型 y=bx+a+e 与确定性 函数 y=a+bx 相比,它表示 y 与 x 之间是统计相关关系(非确 定性关系),其中的随机误差 e 提供了选择模型的准则以及在 模型合理的情况下探求最佳估计值 a,b 的工具. (2)线性回归方程^y=^bx+^a中^a,^b的意义是:以^a为基数, x 每增加 1 个单位,y 相应地平均增加^b个单位.
首页
上一页
下一页
末页
结束
求线性回归方程 [典例] 某研究机构对高三学生的记忆力 x 和判断力 y 进行 统计分析,得下表数据
x 6 8 10 12 y23 5 6
(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线 性回归方程 ^y=^bx+^a; (3)试根据求出的线性回归方程,预测记忆力为 7 的同学的判 断力.
首页
上一页
下一页
末页
结束
解:(1) x =16×(8+8.2+8.4+8.6+8.8+9)=8.5. y =16×(90+84+83+80+75+68)=80. ^a= y +20 x =80+20×8.5=250, 所以回归直线方程为^y=-20x+250. (2)工厂获得的利润 z=(x-4)y=-20x2+330x-1 000, 由二次函数知识可知当 x=343时,zmax=361.25(元). 故该产品的单价应定为 8.25 元.
n
yi-^yi2
i=1
(3)R2=1-
越接近 1,表示回归的效果越好.
n
yi- y 2
i=1
首页
上一页
下一页
末页
[小试身手]
结束
1.判断下列命题是否正确.(正确的打“√”,错误的打“×”)
(1)残差平方和越小, 线性回归模型的拟合效果越好. ( √ )
(2)在画两个变量的散点图时, 预报变量在 x 轴上,解释变量
首页
上一页
下一页
末页
结束
2.线性回归分析 (1)残差:对于样本点(xi,yi)(i=1,2,n…,n)的随机误差的估计值
^ei=yi-^yi 称为相应于点(xi,yi)的残差,i=1 (yi-^yi)2称为残差平方和.
(2)残差图:利用图形来分析残差特性,作图时纵坐标为 残差 , 横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作 出的图形称为残差图.
单价 x(元) 8 8.2 8.4 8.6 8.8 9
销量 y(件) 90 84 83 80 75 68
(1)求回归直线方程^y=^bx+^a,其中^b=-20,^a= y -^b x ; (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且 该产品的成本是 4 元/件,为使工厂获得最大利润,该产品的单 价应定为多少元?(利润=销售收入-成本)
首页
上一页
下一页
末页
首页
上一页
下一页
末页
结束
(1)当两个变量已明显呈线性相关关系时,则无需作散点 图,就可直接求回归直线方程,否则要先判定相关性再求回归 方程.判断拟合效果的好坏需要利用 R2 确定,R2 越接近 1, 说明拟合效果越好.
(2)非线性回归方程的求法 ①根据原始数据(x,y)作出散点图; ②根据散点图,选择恰当的拟合函数; ③作恰当的变换,将其转化成线性函数,求线性回归方程; ④在③的基础上通过相应的变换,即可得非线性回归方 程.
首页
上一页
下一页
末页
解:(1)散点图如图所示:
结束
(2)由散点图看出样本点分布在一条指数函数 y1=c1ec2x 的周围,于 是令 z=ln y,则
x1 2 3 4 5 6 z 1.79 2.48 3.22 3.89 4.55 5.25
由计算器算得,^z =0.69x+1.115,则有^y=e0.69x+1.115.
末页
(2)回归方程的相关计算
结束
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,
yn).设其回归直线方程为^y=^bx+^a,其中^a,^b是待定参数,由最
小二乘法得
n
n
xi- x yi- y xiyi-nx y
i=1
i=1
^b=
=
,
n
xi- x 2
n
x2i -n x 2
首页
上一页
下一页
末页
解:(1)散点图如图.
结束
x =16×(5+10+15+20+25+30)=17.5, y =16×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487, 计算得^b≈0.183,^a≈6.285. 故所求回归直线方程为^y=6.285+0.183x.
首页
首页
上一页
下一页
结束
末页
结束
求线性回归方程的三个步骤 (1)画散点图:由样本点是否呈条状分布来判断两个量是 否具有线性相关关系. (2)求回归系数:若存在线性相关关系,则求回归系数. (3)写方程:写出线性回归方程,并利用线性回归方程进 行预测说明.
首页
上一页
下一页
末页
结束
[活学活用]
某工厂为了对新研发的一种产品进行合理定价,将该产品按事 先拟定的价格进行试销,得到如表数据:
首页
上一页
下一页
末页
[解] (1)散点图如图所示.
结束
首页
上一页
下一页
末页
(2) x =6+8+410+12=9, y =2+3+4 5+6=4,
4
xi- x yi- y
i=1
^b=
4
xi- x 2
=1240=0.7,
i=1
^a= y -^b x =4-0.7×9=-2.3, 故线性回归方程为^y =0.7x-2.3. (3)由(2)中线性回归方程知,当 x=7 时, ^y=0.7×7-2.3=2.6, 故预测记忆力为 7 的同学的判断力约为 2.6.
i=1
i=1
所以,R2=1-01.40.16378138≈0.999 1,回归模型的拟合效果较好.
首页
上一页
下一页
末页
结束
(3)由残差表中的数值可以看出第 3 个样本点的残差比 较大,需要确认在采集这个样本点的时候是否有人为的 错误,如果有的话,需要纠正,重新建立回归模型;由 表中数据可以看出残差点比较均匀地落在狭窄的水平 带状区域中,说明选用的线性回归模型的精度较高,由 以上分析可知,弹簧长度与所挂物体的质量成线性关 系.