人教版高中数学选修1-2《回归分析的基本思想及其初步应用》
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
通过残差,能发现什么信息?
建构新知
残差
4 3 2 1 0 -1 -2 -3 -4 0 2
残差图
4
6
8
10
作用: 1、发现观测数据中的可疑数据; 从残差图中得出哪些信息?残差图有什么作用? 2、判断回归模型的拟合效果. 残差点比较均匀地落在水平的带状区域中,说明 选用的模型比较适合.这样的带状区域宽度越窄,说明 拟合精度越高,回归方程的预报精度越高.
在实际应用中,随机误差e是一个不可观测的量, 那么应该怎样研究呢?
y bx a e
e y bx a
线性回归方程 ˆ a ˆ bx ˆ y
ˆ ˆ y y e
建构新知
对于样本点 xn , yn (其中n N )的随机误差 ei yi bxi a , i 1, 2,L n ˆ a ˆi yi bx ˆ , i 1, 2,L n, 其估计值为 e i ˆi 称为相应点 xi , yi 的残差. e
ˆ a ˆ 是待定参数) ˆ bx ˆ 其中a y 4、求回归直线方程:____________( ˆ, b 由最小二乘法公式得:
n n ( xi x)( yi y ) xi yi nx y ˆ i 1 i 1n , b n 2 ( xi x) 2 xi2 nx i 1 i 1 ˆ ˆ _________________________ y bx a
②在线性回归模型中,R 2 0,1,R 2 表示解释变量对于 预报变量变化的贡献率.R 越接近于1,表示回归的 效果越好.
2
编号
1 166 50
2
3
4 157 45
5
6
7 159 47
8 167 55
x y ˆ y
167 178 58 70
165 170 52 55
53.862 54.999 67.506 43.629 52.725 58.410 45.903 54.999 -3.862 3.001 2.494 1.371 -0.725 -3.410 1.097 0.001
1.1回归分析的基本思想 及其初步应用
知识回顾
函数关系 、相关关系 无关系 1、两个变量间的关系分为:________ _______、______. 2、如果两个变量中一个变量的取值一定时,另一个变量的取值 带有一定的______ 随机性 ,那么这两个变量之间的关系叫做相关关系. 3、回归分析的步骤: 求回归直线方程 ③__________ 画散点图 ②_______________ 预报或决策 ①_________
能不能用一次函数模型y=bx+a准确描述身高与 体重的关系?
建构新知
线性回归模型:y=bx+a+e, (其中a和b为模型的未知参数,e称为随机误差) 函数模型:y bx a 二者有什么区别? 回归模型:y bx a e
自变量x x 解释变量 因变量y y 预报变量
随机误差e
问题探究
-5
建构新知
相关指数 R
n
2
R2 1
2 ˆ ( y y ) i 2 ( y y ) i i 1 i 1 n
残差平方和
2
ˆi 越小,即模型的 ①R 2越大,说明残差平方和 怎样用相关指数 R 2 来刻画回归的效果? yi y
i 1
n
拟合效果越好;反之,R 2越小,拟合效果越差.
求 根 据 女 生 的 身 高 预 报 体 重 的 回 归 方 程 ,并 预 报 一 名 身 高 为 160 cm的 女 生 的 体 重 .
问题探究
身高为160cm的女生的体重一定是47.04kg吗? 为什么?
80
70 60
y = 1. 137x - 134. 88
50
40 30
20
10 0 155 160 165 170 175 180
甲 乙
0.78
A
ˆ 0.3x 4.4 D. y
2、甲、乙、丙、丁4位同学建立变量x, y的回归模型时,分别选择了4种
丙
0.50
丁
0.85
R2
0.98
哪位同学建立的回归模型的拟合效果最好? A. 甲 B.乙 C.丙 D.丁
A
1 x +1上,则这组样 2
3、在一组样本数据( x1 , y1 ), ( x2 , y2 ), L , ( xn , yn )(n 2, x1 , x2 , L , xn 不全相等)的 散点图中, 若所有样本点( xi , yi )(i 1, 2, L n)都在直线y 本的相关指数为______.
ˆ e
x 166.125
n
y 54
R2 1
2 ˆ ( y y ) i 2 ( y y ) i i 1 i 1 n
0.893
学以致用
关于x与y有如下数据: x 2 4 5 6 8
y
30
40
60
50
70
为了对x、y两个变量进行统计分析,现有以下两种 ˆ 6.5x 17.5 , y ˆ 7 x 17 ,试比较哪一个 线性模型: y 模型拟合的效果更好.
( x, y ) 5、回归直线方程恒过点________.
情境引入
情境引入
从 高 二 9 、 1 0 班 的 所 有 女 生 中 随 机 选 取 8名 , 其 身 高 和 体 重 数据如下表 .
编号
1
2 58
3 70
4 45
5
6
7
8 55
身 高 / cm 166 167 178 157 165 170 159 167 体 重 / kg 50 52 55 47
问题探究
8名女生体重的残差是多少?
编号
ห้องสมุดไป่ตู้
1 166 50
2
3
4 157 45
5
6
7 159 47
8 167 55
x y
167 178 58 70
165 170 52 55
ˆ y ˆ e
53.862 54.999 67.506 43.629 52.725 58.410 45.903 54.999 -3.862 3.001 2.494 1.371 -0.725 -3.410 1.097 0.001
课堂小结
通过这节课的学习, 你有哪些收获、心得、体会?
自我检测
1、已知变量x与y正相关,且由观测数据算得样本平均数 x 3, y 3.5, 则由该观测数据算得的线性回归方程可能为( ) ˆ 0.4 x 2.3 ˆ 2 x 2.4 ˆ 2 x 9.5 A. y B. y C. y 不同模型,计算可得它们的相关指数R 2分别如下表: