多彩课堂20192019学年高中数学人教A版选修12课件:11回归分析-课时1
合集下载
2019年人教版选修1-2高中数学1.1回归分析的基本思想及其初步应用优质课课件
回顾复 习
必修3(第二章 统计)知识结构
整理、分析数据 估计、推断 用样本估计总体 变量间的相关关系
收集数据
(随机抽样)
简 单 随 机 抽 样
分 层 抽 样
系 统 抽 样
用样本 的频率 分布估 计总体 分布
用样本 数字特 征估计 总体数 字特征
线 性 回 归 分 析
回顾复 习 问题1:现实生活中两个变量间的关系有哪些呢?
法一:我们可以通过残差分析发现原始数据中的可疑数据, 判断建立模型的拟合效果。
(1)计算 ei yi b xi a (i=1,2,...n) 残差分析( 2)画残差图 ①查找异常样本数据 3)分析残差图 ( ②残差点分布在以x轴为中心的水平带状区域,并沿 水平方向散点的分布规律相同。
3.
7.
y=bx+a
4.
用回归直线方程 解决应用问题
8. 9.
自学指 导
阅读课本1页—6页思考回答下列问题
(注意:时间12分钟)
1:结合例1得出线性回归模型及随机误差,并且区分 函数模型和回归模型。
2:在线性回归模型中,e是用bx+a预报真实值y的随 机误差,它是一个不可观测的量,那么应如何研究随机 误差呢? 3:如何发现数据中的错误?如何衡量随机模型的拟合效 果? 4:结合例1思考:用回归方程预报体重时应注意什 么? 5:归纳建立回归模型的基本步骤。
残差图的制作和作用: 制作:坐标纵轴为残差变量, 横轴可以有不同的选择.可以为编号;可以为解释变 量 作用:判断模型的适用性若模型选择的正确,残差图中 的点应该分布在以横轴为中心的水平带状区域.
下面表格列出了女大学生身高和体重的原始数据以及相应的残差数
必修3(第二章 统计)知识结构
整理、分析数据 估计、推断 用样本估计总体 变量间的相关关系
收集数据
(随机抽样)
简 单 随 机 抽 样
分 层 抽 样
系 统 抽 样
用样本 的频率 分布估 计总体 分布
用样本 数字特 征估计 总体数 字特征
线 性 回 归 分 析
回顾复 习 问题1:现实生活中两个变量间的关系有哪些呢?
法一:我们可以通过残差分析发现原始数据中的可疑数据, 判断建立模型的拟合效果。
(1)计算 ei yi b xi a (i=1,2,...n) 残差分析( 2)画残差图 ①查找异常样本数据 3)分析残差图 ( ②残差点分布在以x轴为中心的水平带状区域,并沿 水平方向散点的分布规律相同。
3.
7.
y=bx+a
4.
用回归直线方程 解决应用问题
8. 9.
自学指 导
阅读课本1页—6页思考回答下列问题
(注意:时间12分钟)
1:结合例1得出线性回归模型及随机误差,并且区分 函数模型和回归模型。
2:在线性回归模型中,e是用bx+a预报真实值y的随 机误差,它是一个不可观测的量,那么应如何研究随机 误差呢? 3:如何发现数据中的错误?如何衡量随机模型的拟合效 果? 4:结合例1思考:用回归方程预报体重时应注意什 么? 5:归纳建立回归模型的基本步骤。
残差图的制作和作用: 制作:坐标纵轴为残差变量, 横轴可以有不同的选择.可以为编号;可以为解释变 量 作用:判断模型的适用性若模型选择的正确,残差图中 的点应该分布在以横轴为中心的水平带状区域.
下面表格列出了女大学生身高和体重的原始数据以及相应的残差数
2019-2020学年高二数学人教A版选修1-2课件:1.1 回归分析的基本思想及其初步应用
质量的6个物体进行测量,数据如下表所示:
x/g 5 10 15 20 25 30
y/cm 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图,并求线性回归方程;
(2)求出R2;
(3)进行残差分析.
分析:作出散点图→求回归方程→计算R2→进行残差分析
-17-
第十七页,编辑于星期日:点 十五分。
i=1
的贡献率, 2 越接近于 1, 表示回归的效果越好
第八页,编辑于星期日:点 十五分。
-8-
目标导航
【做一做3】 下列四个命题中正确的是(
知识梳理
知识梳理
重难聚焦
典例透析
)
①在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观
测的量;
②残差平方和越小的模型,拟合的效果越好;
③用R2来刻画回归方程,R2越小,拟合的效果越好;
-2-
目标导航
知识梳理
知识梳理
重难聚焦
典例透析
1.回归分析
(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.当自
变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关
系叫做相关关系.
(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方
法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用
答案:B
第九页,编辑于星期日:点 十五分。
-9-
目标导航
知识梳理
重难聚焦
典例透析
1.相关关系与函数关系的区别与联系是什么?
剖析:(1)两者之间的区别.
①相关关系是一种非确定性关系.如人的身高与年龄、商品的销售额
x/g 5 10 15 20 25 30
y/cm 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图,并求线性回归方程;
(2)求出R2;
(3)进行残差分析.
分析:作出散点图→求回归方程→计算R2→进行残差分析
-17-
第十七页,编辑于星期日:点 十五分。
i=1
的贡献率, 2 越接近于 1, 表示回归的效果越好
第八页,编辑于星期日:点 十五分。
-8-
目标导航
【做一做3】 下列四个命题中正确的是(
知识梳理
知识梳理
重难聚焦
典例透析
)
①在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观
测的量;
②残差平方和越小的模型,拟合的效果越好;
③用R2来刻画回归方程,R2越小,拟合的效果越好;
-2-
目标导航
知识梳理
知识梳理
重难聚焦
典例透析
1.回归分析
(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.当自
变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关
系叫做相关关系.
(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方
法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用
答案:B
第九页,编辑于星期日:点 十五分。
-9-
目标导航
知识梳理
重难聚焦
典例透析
1.相关关系与函数关系的区别与联系是什么?
剖析:(1)两者之间的区别.
①相关关系是一种非确定性关系.如人的身高与年龄、商品的销售额
高中数学11回归分析的基本思想及初步应用(2课时)新人教A版选修12PPT课件
线的附,所 近以身高和体重的 可关 用系 下面的线
回归模型来表 : y示bxae,
3
线性回归模型:
y=bx+a+e,其中a和b为模型的未知参数,e称为随
机误差。
思考:产生随机误差项e的原因是什么?
随机误差e的来源(可以推广到一般):
1、忽略了其它因素的影响:影响身高 y 的因素不只 是体重 x,可能还包括遗传基因、饮食习惯、生 长环境等因素;
回顾复习
回归分析方法研究问题的步骤:
(1)根据抽样的数据(xi,yi),画出散点图。
(2)求回归直线方程。yˆ bˆxaˆ
(3)用回归直线方程进行预报 yˆ bˆx aˆ
n
(xi x)( yi y)
bˆ i1 n
(xi x)2
i 1
aˆ y bˆx
( x , y ) 样本点中心
解 由于问题中要求根
70 y
65
据身高预报体重 ,因此选 60
取身高为自变量 x , 真实 体重为因变量 y .作散点
55
50
45
40
x
150 155 160 165 170 175 180
图 (图1 .1 1) :
图1.11
从图 1 .1 1中可以看出 ,
y
70
样本点呈条状分布
,身
65
60
高和体 重有比 较好的
线
单层 统 随抽 抽 机样 样 抽
的频率 分布估 计总体
数字特 征估计 总体数
性 回 归 分
样
分布
字特征
析
回顾复习
两个变量x,y的关系:函数关系 相关关系
脂肪含量 40 35 30 25 20 15 10 5 0
最新-2021学年高中数学人教A版选修12课件:11回归分析的基本思想及其初步应用 精品
解析:散点图能直观形象地反映两个变量间的关系,可以粗略地
判断两个变量间是否存在线性关系.故选D.
答案:D
【做一做1-2】 在下列各组量中:①正方体的体积V与棱长a;②一块
农田的水稻产量与施肥量;③人的身高与年龄;④家庭的支出与收
入;⑤某户家庭的用电量与电价.其中量与量之间的关系是相关关
系的是(
)
A.①②
来刻画回归方程,R2越小,拟合的效果越好;④在残差图中,残差点比
较均匀地落在水平的带状区域中,说明选用的模型比较合适.带状
区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越
高.
A.①③ B.②④
C.①④ D.②③
解析:e是一个不可观测的量,故①不正确;R2越小,残差平方和越大,
即模型的拟合效果越差,故③不正确;②④是正确的.故选B.
1.1
回归分析的基本思想及其初步应用
1.了解随机误差、残差、残差图的概念.
2.会用残差分析判断线性回归模型的拟合效果.
3.掌握建立回归模型的步骤.
4.通过对典型案例的探究,了解回归分析的基本思想方法和初步
应用.
1.回归分析
(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系,
即自变量取值一定时,因变量的取值带有一定的随机性的两个变量
B.①④
C.③④
D.②③④
解析:①是函数关系V=a3;⑤电价是统一规定的,与用电量的关系
是确定的关系.②③④中的两个量之间的关系都是相关关系,因为
水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不
确定;人的身高一开始随着年龄的增大而增加,之后则不变化或降
低,在身高增加时,也不是均匀增加的;家庭的支出与收入有一定的
判断两个变量间是否存在线性关系.故选D.
答案:D
【做一做1-2】 在下列各组量中:①正方体的体积V与棱长a;②一块
农田的水稻产量与施肥量;③人的身高与年龄;④家庭的支出与收
入;⑤某户家庭的用电量与电价.其中量与量之间的关系是相关关
系的是(
)
A.①②
来刻画回归方程,R2越小,拟合的效果越好;④在残差图中,残差点比
较均匀地落在水平的带状区域中,说明选用的模型比较合适.带状
区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越
高.
A.①③ B.②④
C.①④ D.②③
解析:e是一个不可观测的量,故①不正确;R2越小,残差平方和越大,
即模型的拟合效果越差,故③不正确;②④是正确的.故选B.
1.1
回归分析的基本思想及其初步应用
1.了解随机误差、残差、残差图的概念.
2.会用残差分析判断线性回归模型的拟合效果.
3.掌握建立回归模型的步骤.
4.通过对典型案例的探究,了解回归分析的基本思想方法和初步
应用.
1.回归分析
(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系,
即自变量取值一定时,因变量的取值带有一定的随机性的两个变量
B.①④
C.③④
D.②③④
解析:①是函数关系V=a3;⑤电价是统一规定的,与用电量的关系
是确定的关系.②③④中的两个量之间的关系都是相关关系,因为
水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不
确定;人的身高一开始随着年龄的增大而增加,之后则不变化或降
低,在身高增加时,也不是均匀增加的;家庭的支出与收入有一定的
高中数学 2、11回归分析的基本思想及其初步应用课件 新人教A版选修12
由残差图也可以观察到,第4个样本点和第5个样本点 的残差比较大,需要确认在采集在这两个样本点的过程中 是否有人为的错误.
[点评] 本题涉及公式多且复杂,计算量也很大,需 首先了解公式,明白原理.
(1)求解两个变量的回归直线方程、相关指数 R2 的计算量 较大,需要细心、谨慎地计算.如果会使用有统计功能的科学 计算器,能很容易得到∑n i=1xi,∑n i=1yi,∑n i=1x2i ,∑n i=1y2i ,∑n i=1 xiyi 这些量的值,也就无需有制表这一步,直接代入公式算出 结果就可以了.
[答案] D [解析] 只有对两个变量具有线性相关性作出判断时, 利用最小乘法求出线性方程才有意义.
[例2] 某种产品的广告费支出x(单位:百万元)与销售 额y(单位:百万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图; (2)求y关于x的回归直线方程.
[解析] (1)散点图如图所示.
i
1
2
3
4
xiห้องสมุดไป่ตู้个)
10
20
30
40
yi(min) 62
68
75
81
xiyi
620 1360 2250 3240
x xi(个) yi(min)
xiyi
6 60 95 5700
7 70 102 7140
8 80 108 8640
9 90 115 10350
5 50 89 4450 续表 10 100 122 12200
下列有关线性回归的说法,不正确的是 ( ) A.变量取值一定时,因变量的取值带有一定随机性 的两个变量之间的关系叫做相关关系 B.在平面直角坐标系中用描点的方法得到表示具有 相关关系的两个量的一组数据的图形叫做散点图 C.线性回归方程最能代表具有线性相关关系的x,y 之间的关系 D.任何一组观测值都能得到具有代表意义的线性回 归方程
[点评] 本题涉及公式多且复杂,计算量也很大,需 首先了解公式,明白原理.
(1)求解两个变量的回归直线方程、相关指数 R2 的计算量 较大,需要细心、谨慎地计算.如果会使用有统计功能的科学 计算器,能很容易得到∑n i=1xi,∑n i=1yi,∑n i=1x2i ,∑n i=1y2i ,∑n i=1 xiyi 这些量的值,也就无需有制表这一步,直接代入公式算出 结果就可以了.
[答案] D [解析] 只有对两个变量具有线性相关性作出判断时, 利用最小乘法求出线性方程才有意义.
[例2] 某种产品的广告费支出x(单位:百万元)与销售 额y(单位:百万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图; (2)求y关于x的回归直线方程.
[解析] (1)散点图如图所示.
i
1
2
3
4
xiห้องสมุดไป่ตู้个)
10
20
30
40
yi(min) 62
68
75
81
xiyi
620 1360 2250 3240
x xi(个) yi(min)
xiyi
6 60 95 5700
7 70 102 7140
8 80 108 8640
9 90 115 10350
5 50 89 4450 续表 10 100 122 12200
下列有关线性回归的说法,不正确的是 ( ) A.变量取值一定时,因变量的取值带有一定随机性 的两个变量之间的关系叫做相关关系 B.在平面直角坐标系中用描点的方法得到表示具有 相关关系的两个量的一组数据的图形叫做散点图 C.线性回归方程最能代表具有线性相关关系的x,y 之间的关系 D.任何一组观测值都能得到具有代表意义的线性回 归方程
多彩课堂20192019学年高中数学人教A版选修12课件:11回归分析-课时1
yi2ny2)
i1
i1
i1
i1
建立回归模型的基本步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量 是预报变量. (2)画出确定好的解释变量和预报变量的散点图,观察它 们之间的关系(如是否存在线性关系等). (3)由经验确定回归方程的类型(如我们观察到数据呈线 性关系,则选用线性回归方程). (4)按一定规则(如最小二乘法)估计回归方程中的参数. (5)得出结果后分析残差图是否有异常(如个别数据对应 残差过大,或残差呈现不随机的规律性等).若存在异 常,则检查数据是否有误,或模型是否合适等.
从某大学中随机选取8名女大学生,其身高和体重数 据如下表所示:
编号
12345678
身高/cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
怎样根据一名女大学生的身高预报她的体重,并预 报一名身高为172 cm的女大学生的体重?
提示:它们都是刻画两个变量之间的的相关关系的,区
别是R2表示解释变量对预报变量变化的贡献率,其表
n
2
yi yi
达式为R2=1-i
1 n
yi
y
;2
i1
相关系数r是检验两个变量相关性的强弱程度,
n
xixyiy
n
xiyinxy
其表达式为 r
i1
n
2n
xix
i1
.
2
yiy
n
(
xi2nx2)(n
为研究重量x(单位:克)对弹簧长度y(单位:
厘米)的影响,对不同重量的6个物体进行测量,数 据如下表所示:
x
5
10
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
提示:它们都是刻画两个变量之间的的相关关系的,区
别是R2表示解释变量对预报变量变化的贡献率,其表
n
2
yi yi
达式为R2=1-i
1 n
yi
y
;2
i1
相关系数r是检验两个变量相关性的强弱程度,
n
xixyiy
n
xiyinxy
其表达式为 r
i1
n
2n
xix
i1
.
2
yiy
n
(
xi2nx2)(n
yi-^y i 0.05
0.005 -0.08 -0.045 0.04 0.025
yi--y -2.24 -1.37 -0.54
0.41
1.41 2.31
所以
18,
6
(yi--y )2=14.678
4.
i=1
i=1
所以,R2=1-01.40.61378148≈0.999 1, 回归模型的拟合效果较好.
1.判一判(正确的打“√”,错误的打“×”) (1)残差平方和越小,线性回归方程拟合效果越好.( √ ) (2)在画两个变量的散点图时,预报变量在x轴上,解释变 量在y轴上. ( × ) (3)R2越接近于1,线性回归方程的拟合效果越好.( √ )
2.做一做(请把正确的答案写在横线上)
(1)从散点图上看,点散布在从左下角到右上角的 区域内,两个变量的这种相关关系为 正相关 . (2)在残差分析中,残差图的纵坐标为 残差 .
本节内容学生内容不易掌握,通过知识整理与比较 引导学生进行区分、理解。通过对典型案例的探究, 练习进行巩固了解回归分析的基本思想方法和初步应 用.
从某大学中随机选取8名女大学生,其身高和体重数 据如下表所示:
编号
12345678
身高/cm 165 165 157 170 175 165 155 170
4
6
8
10
12
-4000
通过残差 eˆ1,eˆ2,eˆ3,.来...判.eˆn断, 模型拟合的效果这种分析工
作称为残差分析
通过残差表或残差图判断模型拟合的效果是直观判断, 如何精确判断模型拟合的效果?
n
2
yi yi
引入参数R2R 2
1
i 1 n
2 来精确该画模型拟合效果
yi y
i 1
(2)残差的平方和法:一般情况下,比较两个模型的残差 比较困难(某些样本点上一个模型的残差的绝对值比 另一个模型的小,而另一些样本点的情况则相反),故通 过比较两个模型的残差的平方和的大小来判断模型的 拟合效果.残差平方和越小的模型,拟合的效果越好. (3)R2法:R2的值越大,说明残差平方和越小,也就是说 模型拟合的效果越好.
(3)由残差表中的数值可以看出第3个样本点的残差比较 大,需要确认在采集这个数据的时候是否有人为的错 误,如果有的话,需要纠正数据,重新建立回归模型; 由表中数据可以看出残差点比较均匀地落在不超过0.15 的狭窄的水平带状区域中,说明选用的线性回归模型的 精度较高,由以上分析可知,弹簧长度与拉力成线性关 系. 规律方法 当资料点较少时,也可以利用残差表进行残 差分析,注意计算数据要认真细心,残差分析要全面.
①线性回归模型中的预报值 y 与真实情况y
引起的误差;
②观测与计算(用 b a 代替b a)产生的误差;
③省略了一些因素的影响(如生活习惯等) 产生的误差.
在线性回归模型中,e为用bx+a的预报真实值y的随机 误差,它是一个不可观测的量,那么应该怎样研究随机 误差?
在实际应用中,我们用 y bx a 估计 bx+a
yi2ny2)
i1
i1
i1
i1
建立回归模型的基本步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量 是预报变量. (2)画出确定好的解释变量和预报变量的散点图,观察它 们之间的关系(如是否存在线性关系等). (3)由经验确定回归方程的类型(如我们观察到数据呈线 性关系,则选用线性回归方程). (4)按一定规则(如最小二乘法)估计回归方程中的参数. (5)得出结果后分析残差图是否有异常(如个别数据对应 残差过大,或残差呈现不随机的规律性等).若存在异 常,则检查数据是否有误,或模型是否合适等.
为研究重量x(单位:克)对弹簧长度y(单位:
厘米)的影响,对不同重量的6个物体进行测量,数 据如下表所示:
x
5
10
15
20
25
30
y 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图并求线性回归方程;
(2)求出R2;
(3)进行残差分析. 作残差分析时,一般从以下几个方面予以说明: (1)散点图;(2)相关指数;(3)残差图中的异常点 和样本点的带状分布区域的宽窄.
-y =15(12+10+7+5+3)=7.4,
5
x2i =142+162+182+202+222=1 660,
i=1
5
xiyi=14×12+16×10+18×7+20×5+22×3=620,
i=1
5 xiyi-5-x -y
i=1
所以^b=
5 x2i -5-x 2
=62106-605-×51×8×1872.4=-1.15.
具有较好的线性相关关系
2.根据线性回归的系数公式, 求回归直线方程
y =0.849x-85.712
3.由线性回归方程可以估计其位
置值为 y =60.316(千克)左右。
n
xi x yi y
b
i1
n i1
xi x
2
a y bx.
性质:回归直线一定过样本中心点
这些点并不都在同一条直线上,上述直线并不能精确 地反映x与y之间的关系,y 的值不能完全由x 确定, 它们之间是统计相关关系,y 的实际值与估计值之间 存在着误差.
3.相关系数与R2 (1)R2是相关系数的平方,其变化范围为[0,1],而相关 系数的变化范围为[-1,1]. (2)相关系数可较好地反映变量的相关性及正相关或 负相关,而R2反映了回归模型拟合数据的效果. (3)当|r|接近于1时说明两变量的相关性较强,当|r|接 近于0时说明两变量的相关性较弱,而当R2接近于1时, 说明线性回归方程的拟合效果较好.
所以 ey-bxa的估计量为 e y y
对于样本点 x i,y i i 1 ,2 ,3 , ,n
它们的随机误差为 e i y i b x i a i 1 ,2 , 3 ,,n 估计值为 e i y i y i y i b x i an 1 ,2 ,3 ,n
ei称相应于点 xi,yi的残差
多彩课堂20192019学年高中数学人教A版选修12课件:11回归分析-课时1
点击此处可添加副标题
3.1 回归分析的基本思 及其初步应用
(第一课时)
1.通过典型案例的探究,进一步了解回归分析的基本思想、 方法及其初步应用.
2.让学生经历数据处理的过程,培养他们对数据的直观感 觉,体会统计方法的特点,认识统计方法的应用,通过使用转化 后的数据,求相关指数,运用相关指数进行数据分析、处理的方 法.
残差的作用
1.通过残差表或残差图发现原始数据中的可疑数据 坐标纵轴为残差变量,横轴可以有不同的选择;
若模型选择的正确,残差图中的点应该分布在以横轴 为中心的带形区域;
对于远离横轴的点,要特别注意。
身
高
异
与
常
体
点
重
残 差 图
•错误数据 •模型问题
残差
6000
4000
2000 0
残差
-2000 0
2
(2)线性回归方程 y bx中a , 的a 意b 义是:以 为基数a ,x
每增加1个单位,y相应地平均增加 个单位b . (3)线性回归模型中随机误差的主要来源 ①线性回归模型与真实情况引起的误差; ②观测与计算产生的误差; ③省略了一些因素的影响产生的误差.
2.线性回归模型的模拟效果 (1)残差图法:观察残差图,如果残差点比较均匀地 落在水平的带状区域中,说明选用的模型比较合适, 这样的带状区域的宽度越窄,说明模型拟合精度越 高,回归方程的预报精度越高.
(3)如果发现散点图中所有的样本点都在一条直线
上,则残差平方和等于
0,解释变量和预报变
量之间的相关系数R等于 1或-1 .
3.已知某种商品的价格x(元)与需求量y(件)之间的 关系有如下一组数据:
x
14
16
18
20
22
y
12
10
7
5
3
求y对x的回归直线方程,并说明回归模型拟合效果 的好坏.
解 -x =15(14+16+18+20+22)=18,
因此,在统计学中设它们的线性回归模型为:
ybxae
其中a,b为模型的未知参数,e为y与bx+a之间的误差,
称它为随机误差,它是随机变量。且 E e0,D e 2
线性回归模型完整表达式为
ybxae,
Ee 0,De 2,
x称为_解__释__变量,y称为_预__报__变量.
线性回归模型中随机误差的主要来源
i=1
^a=7.4+1.15×18=28.1, 所以所求回归直线方程是:^y =-1.15x+28.1. 列出残差表:
yi-^y i yi--y
0
0.3
4.6
2.6
-0.4 -0.4
-0.1 -2.4
0.2 -4.4
所以,
5
(yi-^y
i)2=0.3,
5
(yi--y )2=53.2,
i=1
i=1
5
【微思考】 (1)残差与我们平时说的误差是一回事儿吗? 提示:这两个概念在某程度上具有很大的相似性,都是 衡量不确定性的指标,二者的区别是:误差与测量有关, 误差可以衡量测量的准确性,误差越大表示测量越不 准确;残差与预测有关,残差大小可以衡量预测的准确 性,残差越大表示预测越不准确.