人教版高中数学选修《回归分析》课件ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)残差的平方和法:一般情况下,比较两个模型的残 差比较困难(某些样本点上一个模型的残差的绝对值 比另一个模型的小,而另一些样本点的情况则相反), 故通过比较两个模型的残差的平方和的大小来判断模 型的拟合效果.残差平方和越小的模型,拟合的效果越 好. (3)R2法:R2的值越大,说明残差平方和越小,也就是说 模型拟合的效果越好.
称它为随机误差,它是随机变量。且 Ee 0,De 2
线性回归模型完整表达式为
y E
bx a e,
e 0,De
2
,
x称为_解__释__变量,y称为_预__报__变量.
线性回归模型中随机误差的主要来源
①线性回归模型中的预报值 $y与真实情况y
引起的误差;
具有较好的线性相关关系
2.根据线性回归的系数公式, 求回归直线方程 $y =0.849x-85.712
3.由线性回归方程可以估计其位 置值为 $y =60.316(千克)左右。
$b
n i1
xi x yi y
n
2
xi x
i1
$a y $bx.
对于样本点 xi, yi i 1,2,3,L ,n
它们的随机误差为 ei yi bxi a i 1, 2,3,L , n 估计值为 eµi yi yµi yi $bxi $a n 1, 2,3,L n
eµi 称相应于点 xi , yi 的残差
3.相关系数与R2 (1)R2是相关系数的平方,其变化范围为[0,1],而相 关系数的变化范围为[-1,1]. (2)相关系数可较好地反映变量的相关性及正相关或 负相关,而R2反映了回归模型拟合数据的效果. (3)当|r|接近于1时说明两变量的相关性较强,当|r| 接近于0时说明两变量的相关性较弱,而当R2接近于1 时,说明线性回归方程的拟合效果较好.
本节内容学生内容不易掌握,通过知识整理与比 较引导学生进行区分、理解。通过对典型案例的探究, 练习进行巩固了解回归分析的基本思想方法和初步应 用.
从某大学中随机选取8名女大学生,其身高和体重数 据如下表所示:
编号
12345678
身高/cm 165 165 157 170 175 165 155 170
4
6
8
10
12
-4000
通过残差 eˆ1,eˆ2,eˆ3,.....eˆn,来判断模型拟合的效果这种
分析工作称为残差分析
通过残差表或残差图判断模型拟合的效果是直观判 断,如何精确判断模型拟合的效果?
n yi $yi 2
引入参数R2R2
1
i1 n
来精确该画模型拟合效果
2
yi y
3.从实际问题中发现已有知识的不足,激发好奇心,求知 欲,通过寻求有效的数据处理方法,开拓学生的思路,培养学生 的探索精神和转化能力,通过案例的分析使学生了解回归分析在 实际生活中的应用,增强数学取之生活,用于生活的意识,提高 学习兴趣.
本节课通过必修3熟悉有例题回顾线性相关关系知 识,通过实际问题中发现已有知识的不足,引出随机 误差、残差、残差分析的概念,进而运用残差来进行 数据分析,通过例题讲解掌握用残差分析判断线性回 归模型的拟合效果。掌握建立回归模型的步骤。
3.1回归分析的基本 思想
及其初步应用
(第一课时)
1.通过典型案例的探究,进一步了解回归分析的基本思想、 方法及其初步应用.
2.让学生经历数据处理的过程,培养他们对数据的直观感 觉,体会统计方法的特点,认识统计方法的应用,通过使用转化 后的数据,求相关指数,运用相关指数进行数据分析、处理的方 法.
体重/kg 48 57 50 54 64 61 43 59
怎样根据一名女大学生的身高预报她的体重,并预 报一名身高为172 cm的女大学生的体重?
根据必修3 2.3变量相关关系解决这个问题的方法: 1.先判断是两个变量是否具有线性相关关系 (1)作散点图,如图所示(见课本P82:图3.1-1)
(2)计算相关系数
(2)线性回归方程 $y $bx $a 中 $a ,$b 的意义是:以$a为基
数,x每增加1个单位,y相应地平均增加$b 个单位. (3)线性回归模型中随机误差的主要来源 ①线性回归模型与真实情况引起的误差; ②观测与计算产生的误差; ③省略了一些因素的影响产生的误差.
2.线性回归模型的模拟效果 (1)残差图法:观察残差图,如果残差点比较均匀 地落在水平的带状区域中,说明选用的模型比较 合适,这样的带状区域的宽度越窄,说明模型拟合 精度越高,回归方程的预报精度越高.
i1
对于己获取的样本数据,在上式子中 n yi y 2 是定
值,n yi $yi 2 越小,即残差平方和越小,i1 R2越大,说
明模i型1 拟合效果越好。
引入例中参数R2计算得约为0.64说明女大学生体重差 异有百分之六十四是由身高引起的.
知识点 线性回归分析 1.对线性回归模型的三点说明 (1) 非 确 定 性 关 系 : 线 性 回 归 模 型 y=bx+a+e 与 确 定性函数y=bx+a相比,它表示y与x之间是统计相 关关系(非确定性关系),其中的随机误差e提供了 选择模型的准则以及在模型合理的情况下探求最 佳估计值a,b的工具.
②观测与计算(用 $b $a 代替b a)产生的误差;
③省略了一些因素的影响(如生活习惯等) 产生的误差.
在线性回归模型中,e为用bx+a的预报真实值y的随机 误差,它是一个不可观测的量,那么应该怎样研究随 机误差?
在实际应用中,我们用 $y $bx $a 估计 bx+a
所以 e y-bx a 的估计量为 $e y $y
性质:回归直线一定过样本中心点
这些点并不都在同一条直线上,上述直线并不能精确
地反映x与y之间的关系,y 的值不能完全由x 确定, 它们之间是统计相关关系,y 的实际值与估计值之间
存在着误差.
因此,在统计学中设它们的线性回归模型为:
y bx a e
其中a,b为模型的未知参数,e为y与bx+a之间的误差,
残差的作用
1.通过残差表或残差图发现原始数据中的可疑数据 坐标纵轴为残差变量,横轴可以有不同的选择;
若模型选择的正确,残差图中的点应该分布在以横轴 为中心的带形区域;
对于远离横轴的点,要特别注意。
身
高
异
与
常
体
点
重
残 差 图
•错误数据 •模型问题
残差
6000
4000
2000 0
残差
-Baidu Nhomakorabea000 0
2