《回归分析》课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
系. (2)计算,代入公式求出 y=bx+a 中参数 b,a 的值.
(3)写出回归方程并对实际问题作出估计.
课内巩固
编号
1
2
3
4
5
股骨长度x/cm 38 56 59 64 74
肱骨长度y/cm 41 63 70 72 84
求根据股骨估计肱骨的回归方程;并预测股骨的长度为50cm,则 它的肱骨长为多少?
(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的 线性相关系数,r2表示变量V与U之间的线性相关系数,则(
)
A.r2<r1<0 C.r2<0<r1
B.0<r2<r1 D.r2=r1
解析: 对于变量Y与X而言,Y随X的增大而增大,故Y与X
正相关,即r1>0;对于变量V与U而言,V随U的增大而减小 ,故V与U负相关,即r2<0,所以有r2<0<r1.故选C. 答案: C
[答案] D [解析] 本题考查线性回归方程. D 项中身高为 170cm 时,体重“约为”58.79,而不是“确 定”,回归方程只能作出“估计”,而非确定“线性”关系.
3.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3)
,(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),
b=Baidu Nhomakorabea
=
,a= y -b x
n
xi- x 2
n
x2i -n x 2
i=1
i=1
①必过样本中心
②线性回归方程求出来的是预测值(估计值)
例题精讲
例 1 弹簧长度 y(cm)随所挂物体的重量 x(g)不同而变化的 情况如下:
x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.96 11.80 (1)画出散点图; (2)求 y 对 x 的回归直线方程; (3)预测所挂物体重量为 27 g 时的弹簧长度(精确到 0.01 cm).
相关系数r
r=
n
xi- x yi- y
i=1
n
xi- x 2
i=1
n
yi- y 2
i=1
n
xiyi-n x y
i=1
=
.
n
x2i -n x 2
n
y2i -n y 2
i=1
i=1
新课探究
变量之间线性相关系数r具有如下性质: (1)r2≤1,故变量之间线性相关系数r的取值范围为[- 1,1]. (2)|r|值越大,变量之间的_线__性__相__关__程__度__越__高___;|r|值越接 近0,变量之间的_线__性__相__关__程__度__越__低__. (3)当r>0时,两个变量的值总体上呈现出同时增减的趋 势,此时称两个变量_正__相__关___;当r<0时,一个变量增加,另 一个变量有减少的趋势,称两个变量__负__相__关___;当r=0时, 称两个__变__量__线__性__不__相__关___.
新课探究
可线性化的回归分析:
1.在实际问题中,有时两个变量之间的关系并不是线性 关系,这就需要根据散点图选择适当的函数模型来拟合观测数 据,然后通过适当的变量代换,把非线性问题转化为线性问 题,从而确定未知参数,建立相应的线性回归方程.
新课探究
2.常见的非线性回归模型转化为线性回归模型如下: (1)幂函数曲线y=axb 作变换u=lny,v=lnx,c=lna,得线性函数u=c+bv. (2)指数曲线 y=aebx 作变换 u=lny,c=lna,得线性函数 u=c+bx. (3)对数曲线 y=a+blnx 作变换 u=y,v=lnx,得线性函数 u=a+bv.
291 330 17633 20040
课内巩固
计算: x 291 58.2, y 330 66.
5
5
b
20040 558.2 66 17633 5 58.22
1.197
a
66
20040 5 17633
58.2 66 5 58.22
58.2
3.660
y对x的线性回归方程为: y 3.660 1.197x
例题精讲
-x =16×(50+10+…+30)=17.5, -y =16×(7.25+8.12+…+11.80)≈9.50, ∑x2i =25+100+…+900=2 275, ∑xiyi=36.25+81.2+…+354=1 077.7, b=1 0727.277-5-6×6×171.57×.529.50≈0.183,
例题精讲
[解析] (1)散点图如图所示:
例题精讲
(2)采用列表的方法计算 a 与回归系数 b. 序号 x y x2 xy 1 5 7.25 25 36.25 2 10 8.12 100 81.2 3 15 8.95 225 134.25 4 20 9.90 400 198 5 25 10.96 625 274 6 30 11.80 900 354
i=1
i=1
=
25 054-5×73.2×67.8 27 174-5×73.2223 167-5×67.82
=0.904 3
由于 r 的值接近于 1,故可判断两变量 x 与 y 具有线性相关
关系.
例题精讲
(2)由(1)知,求回归直线方程是有意义的. 回归系数:
5
xiyi-n x y
i=1
b=
5
x2i -5 x 2
例题精讲
例2 某班5名学生的数学和物理成绩如下表:
学科
学生 A B CDE
数学成绩(x) 物理成绩(y)
88 76 73 66 63 78 65 71 64 61
(1)求物理成绩y关于数学成绩x的相关系数;
(2)求物理成绩y对数学成绩x的线性回归方程.
例题精讲
[边听边记] (1) x = 15×(88+76+73+66+63)=73.2, y = 15×(78+65+71+64+61)=67.8.
144
3
1
5
5
1
25
4 0.5 2
1
0.25
4
5 0.25 1
0.25
0.62 5
1
∑ 7.75 36 94.25 21.312 5
430
例题精讲
所以 t =1.55, y =7.2.
5
tiyi-5 t y
i=1
所以 b=
t5
2 i
-5
t
2
=4.134 4.
i=1
a= y -b t =0.8, 所以 y=4.134 4t+0.8. 所以 y 对 x 的回归方程是 y=4.13x4 4+0.8.
例题精讲
a=9.50-0.183×17.5≈6.30. y 对 x 的回归直线方程为 y=a+bx=6.30+0.183x. (3)当质量为 27 g 时,有 y=6.30+0.183×27≈11.24(cm). 故当挂物体质量为 27 g 时,弹筑的长度大约为 11.24 cm.
方法小结
求线性回归方程的步骤: (1)列出散点图.从直观上分析数据间是否存在线性相关关
统计案例
文科选修1-2第一章 理科选修2-3第三章
湖北加油!中国加油!
湖北加油!中国加油!
武汉迁出人口数与累计确诊人数
省市
河南 湖南 广东 安徽 江西 重庆 北京 上海
1月14日至1月23日 武汉迁出人口数(万)
12.1
7.1
4.1
3.8
3.6
3.6
3.3
2.4
1月30日累计确诊人数 352 332 367 237 240 182 121 128
8分 9分 10 分 12 分
课内巩固
1.下列属于相关关系的是( ) A.利息和利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 解析: 相关关系指的是自变量一定时,因变量的取值带有 一定的随机性的两个变量间的关系,既不是确定的函数关系 ,也不是没有关系.这里选项A、D是确定的函数关系;C 中两个变量没有关系. 答案: B
(xi, a+bxi)
O
x
[yi - (a+bxi)]2 刻画这个样本点与这条直线的
“距离”,表示了两者的接近程度.
[ y1 (a bx1 )]2 [ yn (a bxn )]2
知识回顾
4.线性回归方程 y bx a
n
n
xi- x yi- y xiyi-n x y
i=1
i=1
课内巩固
(2)由上面最小二乘法得到的线性回归 方程知,当股骨的长度为50cm时,肱骨 长度的估计值为:
-3.660+1.19750=56.19 56(cm)
新课探究
散点图只是形象地描述点的分布情况,要想把握其特征, 必须进行定量的研究. 问题:如何对一组数据之间的线性相关程度作出定量分析?
新课探究
知识回顾
2.散点图与曲线拟合
曲线拟合:若变量之间存在某种关系,散点图 有一个大致的趋势,这种趋势通常可以用一条 光滑的曲线来近似,这过程称“曲线拟合”
知识回顾
3.最小二乘法的原理
知识回顾
3.最小二乘法的原理 问题:怎么定义“与所有点都近”?
y
·(xi, yi) y=a+bx
答:设直线 y=a+bx, 任意给定的一个样本点(xi,yi).
2.设某大学的女生体重 y(单位:kg)与身高 x(单位:cm) 具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n), 用最小二乘法建立的回归方程为^y=0.85x-85.71,则下列结论 中不.正.确.的是( )
A.y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心(-x ,-y ) C.若该大学某女生身高增加 1cm,则其体重约增加 0.85kg D.若该大学某女生身高为 170cm,则可断定其体重必为 58.79kg
()
A.a与r符号相同 C.b与r符号相同
B.a与r符号相反 D.b与r符号相反
[答案] C [解析] 根据b与r的计算公式可知,b与r符号相同.
课内巩固
2.如图是x和y的一组样本数据的散点图,去掉一组数据 ____________后,剩下的4组数据的相关系数最大.
课内巩固
解析: 经计算,去掉D(3,10)这一组数据后,其他4组数据 对应的点都集中在某一条直线附近,即两变量的线性相关性 最强,此时相关指数最大. 答案: D(3,10)
课内巩固
解:(1)画散点图,如下图:
y/cm
90
•
80
•
70
•
60
•
50
40 •
30 30 40 50 60 70 80
x/cm
课内巩固
(2)列表计算:
i
xi yi xi2 xi yi
1 38 41 1444 1558 2 56 63 3136 3528 3 59 70 3481 4130 4 64 72 4096 4608 5 74 84 5476 6216
例题精讲
例3 在一次抽样调查中测得样本的5个样本点,数值如下表
:x
0.25
0.5
124
y
16
12
521
试建立y与x之间的回归方程.
[思路导引] 先由数值表作出散点图,然后根据散点的形状
模拟出近似函数,进而转化为线性函数,由数值表求出回归
函数.
例题精讲
[规范解答] 由数值表可作散点图如下
2分
例题精讲
5
xiyi=88×78+76×65+73×71+66×64+63×61
i=1
=25 054.
例题精讲
5
x2i =882+762+732+662+632=27 174.
i=1 5
y2i =782+652+712+642+612=23 674
i=1
例题精讲
∴r=
5
xiyi-n x y
i=1
5
5
x2i -n x 2y2i -n y 2
累计确诊
武汉疫情
450
400
350
300
250
200
150
100
50
0
0
2
4
6
8
10
12
14
武汉迁出(万)
第1节 回归分析
知识回顾
知识回顾
1.相关关系的概念
两个变量间的关系可分为确定性关系和_非__确__定__性___关 系,前者又称为___函__数___关系,后者又称为相关关系.
问题:举一两个现实生活中的问题,问题所涉及的变量之间 存在一定的相关关系。
根据散点图可知 y 与 x 近似地呈反比例函数关系,设 y=kx,
令 t=1x,则 y=kt,原数据变为:
t
4
2
1
0.5
0.25
y
16
12
5
2
1
4分
例题精讲
6分
例题精讲
由散点图可以看出 y 与 t 呈近似的线性相关关系.列表如
下:
i
ti
yi
tiyi
t2i
y2i
1
4
16
64
16
256
2
2
12
24
4
i=1
例题精讲
=
25 054-5×73.2×67.8 27 174-5×73.22
=0.625,
a= y -b x =67.8-0.625×73.2=22.05,
所以 y 对 x 的线性回归方程是:
y=0.625x+22.05
课内巩固
1.设两个变量x和y之间具有线性相关关系,它们的相关 系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有
(3)写出回归方程并对实际问题作出估计.
课内巩固
编号
1
2
3
4
5
股骨长度x/cm 38 56 59 64 74
肱骨长度y/cm 41 63 70 72 84
求根据股骨估计肱骨的回归方程;并预测股骨的长度为50cm,则 它的肱骨长为多少?
(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的 线性相关系数,r2表示变量V与U之间的线性相关系数,则(
)
A.r2<r1<0 C.r2<0<r1
B.0<r2<r1 D.r2=r1
解析: 对于变量Y与X而言,Y随X的增大而增大,故Y与X
正相关,即r1>0;对于变量V与U而言,V随U的增大而减小 ,故V与U负相关,即r2<0,所以有r2<0<r1.故选C. 答案: C
[答案] D [解析] 本题考查线性回归方程. D 项中身高为 170cm 时,体重“约为”58.79,而不是“确 定”,回归方程只能作出“估计”,而非确定“线性”关系.
3.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3)
,(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),
b=Baidu Nhomakorabea
=
,a= y -b x
n
xi- x 2
n
x2i -n x 2
i=1
i=1
①必过样本中心
②线性回归方程求出来的是预测值(估计值)
例题精讲
例 1 弹簧长度 y(cm)随所挂物体的重量 x(g)不同而变化的 情况如下:
x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.96 11.80 (1)画出散点图; (2)求 y 对 x 的回归直线方程; (3)预测所挂物体重量为 27 g 时的弹簧长度(精确到 0.01 cm).
相关系数r
r=
n
xi- x yi- y
i=1
n
xi- x 2
i=1
n
yi- y 2
i=1
n
xiyi-n x y
i=1
=
.
n
x2i -n x 2
n
y2i -n y 2
i=1
i=1
新课探究
变量之间线性相关系数r具有如下性质: (1)r2≤1,故变量之间线性相关系数r的取值范围为[- 1,1]. (2)|r|值越大,变量之间的_线__性__相__关__程__度__越__高___;|r|值越接 近0,变量之间的_线__性__相__关__程__度__越__低__. (3)当r>0时,两个变量的值总体上呈现出同时增减的趋 势,此时称两个变量_正__相__关___;当r<0时,一个变量增加,另 一个变量有减少的趋势,称两个变量__负__相__关___;当r=0时, 称两个__变__量__线__性__不__相__关___.
新课探究
可线性化的回归分析:
1.在实际问题中,有时两个变量之间的关系并不是线性 关系,这就需要根据散点图选择适当的函数模型来拟合观测数 据,然后通过适当的变量代换,把非线性问题转化为线性问 题,从而确定未知参数,建立相应的线性回归方程.
新课探究
2.常见的非线性回归模型转化为线性回归模型如下: (1)幂函数曲线y=axb 作变换u=lny,v=lnx,c=lna,得线性函数u=c+bv. (2)指数曲线 y=aebx 作变换 u=lny,c=lna,得线性函数 u=c+bx. (3)对数曲线 y=a+blnx 作变换 u=y,v=lnx,得线性函数 u=a+bv.
291 330 17633 20040
课内巩固
计算: x 291 58.2, y 330 66.
5
5
b
20040 558.2 66 17633 5 58.22
1.197
a
66
20040 5 17633
58.2 66 5 58.22
58.2
3.660
y对x的线性回归方程为: y 3.660 1.197x
例题精讲
-x =16×(50+10+…+30)=17.5, -y =16×(7.25+8.12+…+11.80)≈9.50, ∑x2i =25+100+…+900=2 275, ∑xiyi=36.25+81.2+…+354=1 077.7, b=1 0727.277-5-6×6×171.57×.529.50≈0.183,
例题精讲
[解析] (1)散点图如图所示:
例题精讲
(2)采用列表的方法计算 a 与回归系数 b. 序号 x y x2 xy 1 5 7.25 25 36.25 2 10 8.12 100 81.2 3 15 8.95 225 134.25 4 20 9.90 400 198 5 25 10.96 625 274 6 30 11.80 900 354
i=1
i=1
=
25 054-5×73.2×67.8 27 174-5×73.2223 167-5×67.82
=0.904 3
由于 r 的值接近于 1,故可判断两变量 x 与 y 具有线性相关
关系.
例题精讲
(2)由(1)知,求回归直线方程是有意义的. 回归系数:
5
xiyi-n x y
i=1
b=
5
x2i -5 x 2
例题精讲
例2 某班5名学生的数学和物理成绩如下表:
学科
学生 A B CDE
数学成绩(x) 物理成绩(y)
88 76 73 66 63 78 65 71 64 61
(1)求物理成绩y关于数学成绩x的相关系数;
(2)求物理成绩y对数学成绩x的线性回归方程.
例题精讲
[边听边记] (1) x = 15×(88+76+73+66+63)=73.2, y = 15×(78+65+71+64+61)=67.8.
144
3
1
5
5
1
25
4 0.5 2
1
0.25
4
5 0.25 1
0.25
0.62 5
1
∑ 7.75 36 94.25 21.312 5
430
例题精讲
所以 t =1.55, y =7.2.
5
tiyi-5 t y
i=1
所以 b=
t5
2 i
-5
t
2
=4.134 4.
i=1
a= y -b t =0.8, 所以 y=4.134 4t+0.8. 所以 y 对 x 的回归方程是 y=4.13x4 4+0.8.
例题精讲
a=9.50-0.183×17.5≈6.30. y 对 x 的回归直线方程为 y=a+bx=6.30+0.183x. (3)当质量为 27 g 时,有 y=6.30+0.183×27≈11.24(cm). 故当挂物体质量为 27 g 时,弹筑的长度大约为 11.24 cm.
方法小结
求线性回归方程的步骤: (1)列出散点图.从直观上分析数据间是否存在线性相关关
统计案例
文科选修1-2第一章 理科选修2-3第三章
湖北加油!中国加油!
湖北加油!中国加油!
武汉迁出人口数与累计确诊人数
省市
河南 湖南 广东 安徽 江西 重庆 北京 上海
1月14日至1月23日 武汉迁出人口数(万)
12.1
7.1
4.1
3.8
3.6
3.6
3.3
2.4
1月30日累计确诊人数 352 332 367 237 240 182 121 128
8分 9分 10 分 12 分
课内巩固
1.下列属于相关关系的是( ) A.利息和利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 解析: 相关关系指的是自变量一定时,因变量的取值带有 一定的随机性的两个变量间的关系,既不是确定的函数关系 ,也不是没有关系.这里选项A、D是确定的函数关系;C 中两个变量没有关系. 答案: B
(xi, a+bxi)
O
x
[yi - (a+bxi)]2 刻画这个样本点与这条直线的
“距离”,表示了两者的接近程度.
[ y1 (a bx1 )]2 [ yn (a bxn )]2
知识回顾
4.线性回归方程 y bx a
n
n
xi- x yi- y xiyi-n x y
i=1
i=1
课内巩固
(2)由上面最小二乘法得到的线性回归 方程知,当股骨的长度为50cm时,肱骨 长度的估计值为:
-3.660+1.19750=56.19 56(cm)
新课探究
散点图只是形象地描述点的分布情况,要想把握其特征, 必须进行定量的研究. 问题:如何对一组数据之间的线性相关程度作出定量分析?
新课探究
知识回顾
2.散点图与曲线拟合
曲线拟合:若变量之间存在某种关系,散点图 有一个大致的趋势,这种趋势通常可以用一条 光滑的曲线来近似,这过程称“曲线拟合”
知识回顾
3.最小二乘法的原理
知识回顾
3.最小二乘法的原理 问题:怎么定义“与所有点都近”?
y
·(xi, yi) y=a+bx
答:设直线 y=a+bx, 任意给定的一个样本点(xi,yi).
2.设某大学的女生体重 y(单位:kg)与身高 x(单位:cm) 具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n), 用最小二乘法建立的回归方程为^y=0.85x-85.71,则下列结论 中不.正.确.的是( )
A.y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心(-x ,-y ) C.若该大学某女生身高增加 1cm,则其体重约增加 0.85kg D.若该大学某女生身高为 170cm,则可断定其体重必为 58.79kg
()
A.a与r符号相同 C.b与r符号相同
B.a与r符号相反 D.b与r符号相反
[答案] C [解析] 根据b与r的计算公式可知,b与r符号相同.
课内巩固
2.如图是x和y的一组样本数据的散点图,去掉一组数据 ____________后,剩下的4组数据的相关系数最大.
课内巩固
解析: 经计算,去掉D(3,10)这一组数据后,其他4组数据 对应的点都集中在某一条直线附近,即两变量的线性相关性 最强,此时相关指数最大. 答案: D(3,10)
课内巩固
解:(1)画散点图,如下图:
y/cm
90
•
80
•
70
•
60
•
50
40 •
30 30 40 50 60 70 80
x/cm
课内巩固
(2)列表计算:
i
xi yi xi2 xi yi
1 38 41 1444 1558 2 56 63 3136 3528 3 59 70 3481 4130 4 64 72 4096 4608 5 74 84 5476 6216
例题精讲
例3 在一次抽样调查中测得样本的5个样本点,数值如下表
:x
0.25
0.5
124
y
16
12
521
试建立y与x之间的回归方程.
[思路导引] 先由数值表作出散点图,然后根据散点的形状
模拟出近似函数,进而转化为线性函数,由数值表求出回归
函数.
例题精讲
[规范解答] 由数值表可作散点图如下
2分
例题精讲
5
xiyi=88×78+76×65+73×71+66×64+63×61
i=1
=25 054.
例题精讲
5
x2i =882+762+732+662+632=27 174.
i=1 5
y2i =782+652+712+642+612=23 674
i=1
例题精讲
∴r=
5
xiyi-n x y
i=1
5
5
x2i -n x 2y2i -n y 2
累计确诊
武汉疫情
450
400
350
300
250
200
150
100
50
0
0
2
4
6
8
10
12
14
武汉迁出(万)
第1节 回归分析
知识回顾
知识回顾
1.相关关系的概念
两个变量间的关系可分为确定性关系和_非__确__定__性___关 系,前者又称为___函__数___关系,后者又称为相关关系.
问题:举一两个现实生活中的问题,问题所涉及的变量之间 存在一定的相关关系。
根据散点图可知 y 与 x 近似地呈反比例函数关系,设 y=kx,
令 t=1x,则 y=kt,原数据变为:
t
4
2
1
0.5
0.25
y
16
12
5
2
1
4分
例题精讲
6分
例题精讲
由散点图可以看出 y 与 t 呈近似的线性相关关系.列表如
下:
i
ti
yi
tiyi
t2i
y2i
1
4
16
64
16
256
2
2
12
24
4
i=1
例题精讲
=
25 054-5×73.2×67.8 27 174-5×73.22
=0.625,
a= y -b x =67.8-0.625×73.2=22.05,
所以 y 对 x 的线性回归方程是:
y=0.625x+22.05
课内巩固
1.设两个变量x和y之间具有线性相关关系,它们的相关 系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有