2018年高中数学人教版选修2-3课件:3.1回归分析的基本思想及其初步应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


首 页
上一页
下一页
末 页


预习课本 P80~89,思考并完成以下问题
1.什么是回归分析?
2.什么是线性回归模型?
3.求线性回归方程的步骤是什么?
首 页
上一页
下一页
末 页


[新知初探] 1.回归分析 (1)回归分析 回归分析是对具有 相关关系 的两个变量进行统计分析的一种 常用方法. (2)回归方程的相关计算 对于两个具有线性相关关系的变量的一组数据 (x1,y1),(x2, y2),„,(xn,yn).设其回归直线方程为^ y =^ b x+^ a ,其中^ a ,^ b 是待 定参数,由最小二乘法得
下一页
末 页


(2)从上图可看出,这些点基本上散布在一条直线附近,可以认 为 x 和 y 线性相关关系显著,下面求其回归方程,首先列出下表.
xi 1 2 3 4 5 6 7 8 ∑ 5.6 6.0 6.1 6.4 7.0 7.5 8.0 8.2 54.8
yi 130 136 143 149 157 172 183 188 1 258
首 页 上一页 下一页
末 页


^ b=
i=1
xi- x yi- y xiyi-nx y
i=1 n
n
n
i=1
xi- x
n

2

i=1
xi2-n x 2
^ a = y -^ bx. (3)线性回归模型
y=bx+a+e, 线性回归模型 2 E e = 0 , D e = σ
,其中 a,b 为模型的未知
参数,通常 e 为随机变量 ,称为 随机误差.x 称为解释 变量,y 称为 预报 变量.
首 页 上一页 下一页
末 页


[点睛]
对线性回归模型的三点说明
(1)非确定性关系:线性回归模型 y=bx+a+e 与确定性函 数 y=a+bx 相比,它表示 y 与 x 之间是统计相关关系(非确定 性关系), 其中的随机误差 e 提供了选择模型的准则以及在模型 合理的情况下探求最佳估计值 a,b 的工具. (2)线性回归方程^ y =^ b x+^ a 中^ a ,^ b 的意义是:以^ a 为基数, x 每增加 1 个单位,y 相应地平均增加^ b 个单位.
首 页
上一页
下一页
末 页


2.线性回归分析 (1)残差:对于样本点(xi,yi)(i=1,2,„,n)的随机误差的估计值
n
^ e i=yi-^ y I 称为相应于点(xi,yi)的残差, y i)2 称为残差平方和. (yi-^
i=1
(2)残差图: 利用图形来分析残差特性, 作图时纵坐标为残差 , 横 坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出 的图形称为残差图. y i2 yi-^
答案:0 1 或-1
首 页 上一页 下一页
末 页


求线性回归方程
[典例] 某研究机构对高三学生的记忆力 x 和判断力 y 进行 x y 6 2 8 3 10 5 12 6 统计分析,得下表数据
(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的 线性回归方程 ^ y =^ b x+^ a; (3)试根据求出的线性回归方程,预测记忆力为 9 的同学的 判断力.
首 页 上一页 下一页
末 页


[解]
(1)散点图如图:
首 页
上一页
下一页
末 页


(2) xiyi=6×2+8×3+10×5+12×6=158,
i=1
n
6+8+10+12 2+3+5+6 x= = 9, y = =4, 4 4
i=1
xi2=62+82+102+122=344.
n
158-4×9×4 14 ^ ^ b= =0. 7, a = y -^ b x =4-0. 7×9=-2. 3, 2 = 20 344-4×9 故线性回归方程为^ y =0.7x-2.3. (3)由(2)中线性回归方程知,当 x=9 时,^ y =0.7×9-2.3=4, 故预测记忆力为 9 的同学的判断力约为 4.
n
i=1
(3)R2=1-
i=1
yi- y 2
首 页 上一页 下一页
n
越接近 1,表示回归的效果越好.
末 页


[小试身手] 1.判断下列命题是否正确.(正确的打“√”,错误的打“×”) (1)残差平方和越小, 线性回归方程的拟合效果越好.( √ ) (2)在画两个变量的散点图时, 预报变量在 x 轴上,解释变 量在 y 轴上. (3)R2 越小, 线性回归方程的拟合效果越好. ( ×) ( × )
首 页
x 31.36 36.00 37.21 40.96 49.00 56.25 64.00 67.24 382.02
上一页
xiyi 728.0 816.0 872.3 953.6 1 099.0 1 290.0 1 464.0 1 541.6 8 764.5
下一页
末 页


计算得 x =6.85, y =157.25.
5.6 6.0 6.1 6.4 7.0 7.5 8.0 8.2
130
136
143
149
157
172
183
188
以产量为 x,成本为 y. (1)画出散点图; (2)y 与 x 是否具有线性相关关系?若有,求出其回归方程.
首 页 上一页 下一页
末 页


解:(1)由表画出散点图,如图所示.
首 页
上一页
首 页 上一页 下一页
末 页


求线性回归方程的三个步骤 (1)画散点图: 由样本点是否呈条状分布来判断两个量是否 具有线性相关关系. (2)求回归系数:若存在线性相关关系,则求回归系数. (3)写方程:写出线性回归方程,并利用线性回归方程进行 预测说明.Fra bibliotek首 页
上一页
下一页
末 页


[活学活用] 某工厂 1~8 月份某种产品的产量与成本的统计数据见下表: 月份 产量 (吨) 成本 (万元) 1 2 3 4 5 6 7 8
首 页
上一页
下一页
末 页


2.从散点图上看,点散布在从左下角到右上角的区域内, 两个变 量的这种相关关系称为________.
答案:正相关
3.在残差分析中, 残差图的纵坐标为________.
答案:残差
4.如果发现散点图中所有的样本点都在一条直线上, 则残差 平方和等于________, 解释变量和预报变量之间的相关系 数等于________.
相关文档
最新文档