两个变量的线性相关_优秀课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
年降雨 748 542 507 813 574 701 432 量(mm)
分析:利用散点图进行判别.
解:以x轴为年平均气温,y轴为年降雨量,可得相应的散点图 如下图所示:
因为图中各点并不在一条直线的附近,所以两者不具有相关关系,没必要 用回归直线进行拟合,如果用公式求得回归直线也是没有意义的. 规律技巧:用回归直线进行拟合两变量关系的一般步骤为: (1)作出散点图,判断散点是否在一条直线附近; (2)如果散点在一条直线附近,用公式求出a,b并写出线性回归方程.
变式训练1:5个学生的数学和物理成绩如下表:
学生
A
B
C
D
E
学科
数学 80
75
70
65
60
物理 70
66
68
64
62
画出散点图,并判断它们是否有相关关系.
分析:解答本题可以以数学成绩为自变量,考察因变量物理成绩的变化趋 势,从而作出判断. 解:以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如图所示: 由散点图可见,图中的点大致在一条直线附近,故两者之间具有相关关系.
基础强化 1.下列两个变量具有相关关系且不是函数关系的是( ) A.正方形的边长与面积 B.匀速行驶的车辆的行驶距离与时间 C.人的身高与体重 D.人的身高与视力 解析:A、B都是函数关系,C是相关关系,D中人的视力与身高 没有关系. 答案:C
2.下列关系是函数关系的是( ) A.产生样本与生产数量 B.球的表面积与体积 C.家庭的支出与收入 D.人的年龄与学习成绩 解析:球的表面积与体积存在函数关系,应选B. 答案:B
n
xi yi nx y
i 1
n
(xi x )( yi y)
bˆ
__i_n1_x_i2 __nx_2__
,
i 1
n
____i1_(_xi__x_)2____,
aˆ _____y___b_x______ .
通过求Q=_(_y_1_-b_x_1_-_a_)_2+__(y_2_-_b_x_2_-a_)_2_+_…_+_(_y_n_-_b_x_n_-a_)_2_的最小 值而得出回归直线的方法,即使得样本数据的点到回归直线 的距离的平方和最小,这一方法叫做最小二乘法.
题型二 求回归直线方程 例2:每立方米混凝土的水泥用量(单位:kg)与28天后混凝土 的抗压强度(单位:kg/cm2)之间的关系有如下数据:
x 150 160 170 180 190 200 210 220 230 240 250 26 0
y 56.9 58.3 61.6 64.6 68.1 71.3 74.1 77.4 80.2 82. 86. 89 6 4 .7
(1)画出散点图如图: 由图可见是线性相关的.
(2)借助计算器列表:
i
1
2
3
4
5
6
7
xi
15
20
25
30
35
40
45
yi
330 345 365 405 445 450 455
xiyi 4950 6900 9125 12150 15575 18000 20475
计算得 : b 87175 7 30 399.3 4.75, 7000 7 302
(3)最小二乘法 设与n个观测点(xi,yi)(i=1,2,…,n)最接近的直线方程为 yˆ bx a
(注意它与表示一次函数的习惯y=ax+b不同 ; y ˆ表示y的估算值).其中
a,b是待定系数. 用Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2来刻画n个点与回归直线在 整体上的偏差.上式展开后,是一个关于a,b的二次多项式,运用配方法, 可求出使Q取得最小值时a,b的值(即上述公式①中的a,b值).
变量之间的相关关系 两个变量的线性相关
1.掌握两个变量间的相关关系及正相关、负相关、不具相关关 系的判定.
2.通过收集实际生活中两个变量的有关数据作出散点图. 3.利用散点图直观地认识变量间的相关关系. 4.正确理解回归直线方程、最小二乘法的概念. 5.能够根据散点图得到回归直线. 6.掌握利用最小二乘法求回归直线方程的方法.
制表:
i
1
2
3
4
5
6
xi
150
160
ቤተ መጻሕፍቲ ባይዱ
170
180
190
200
yi
56.9 58.3 61.6 64.6 68.1 71.3
xiyi
8535
9328 10472 11628 12939 14260i
i
7
8
9
10
11
12
xi
210
220
230
240
250
260
yi
74.1 77.4 80.2 82.6 86.4 89.7
利用散点图可以判断变量之间有无相关关系.
3.回归直线方程 (1)回归直线 观察散点图的特征,发现各点大致分布在一条直线的附近,就 称这两个变量之间具有线性相关的关系,这条直线叫做回归 直线.
(2)回归直线方程
设x与y具有相关关系的两个变量,且相应于n组观测值的n个
点大致分布在一条直线的附近,则由
a 399.3 4.75 30 257. 即得回归直线方程yˆ 257 4.75x.
(3)施化肥50 kg时,可以估计水稻产量约为495kg.
规律技巧:(1)回归分析是寻找相关关系中非确定性关系的某 种确定性;(2)求回归直线方程,关键在于正确地求出系数a,b, 由于a,b的计算量大,计算时要仔细,避免计算失误.
1.变量之间的相关关系 (1)相关关系 自变量取值一定时,因变量的取值带有一定随机性的两个变 量之间的关系叫相关关系. (2)相关关系与函数关系的异同点 相同点:两者均是指两个变量的关系;
不同点:①函数关系是一种确定的关系.如匀速直线运动中时 间t与路程s的关系;相关关系是一种非确定的关系.如一块农 田的水稻产量与施肥量之间的关系.事实上,函数关系是两个 非随机变量的关系,而相关关系是非随机变量与随机变量的 关系.
图中心的一条直线附近,称两个变量之间具有_线__性___相__关__关__ 系 , 这条直线叫__回__归___直线 _.
4.假设我们已经得到两个具有线性相关关系的变量的一组数
据(x1,y1),(x2,y2),…,(xn,yn).且所求回归方程是 yˆ bˆx aˆ,
其中b是回归方程的___斜__率___, aˆ 是___截__距___,则有
n
n
(xi x )( yi y)
xi yi nx y
bˆ i1 n
aˆ
y
( xi
i 1
bˆx
x)2
i 1 n
xi2
2
nx
i 1
其中,b是回归方程的斜率,a是截距. 所得到的方程 yˆ bx a 叫作回归直线方程,相应的直线叫作 回归直线,而对两个变量所进行的统计分析叫作线性回归分 析.
上述求回归直线的方法,是使得样本数据的点到它的距离的 平方和最小.由于平方又叫二乘方,所以这种使“偏差平方和 为最小”的方法,叫做最小二乘法.
题型一 相关关系的判断 例1:下表是某地的年降雨量与年平均气温,两者是相关关系吗? 求回归直线方程有意义吗?
年平均 12.51 12.84 12.84 13.69 13.33 12.74 13.05 气温(℃)
施化肥 15 20 25 30 35 40 45 量x
水稻产 330 345 365 405 445 450 455 量y
(1)画出散点图; (2)求水稻产量y与施化肥量x之间的回归直线方程; (3)当施化肥50 kg时,对水稻的产量予以估计. 分析:解答本题应先画散点图,判断其是否线性相关,再利用 最小二乘法求其回归方程.
3.如下图所示,有5组(x,y)数据,去掉( 数据的线性相关系数最大.( )
aˆ y bˆx 72.6 0.304 205 10.28, 于是所求的线性回归方程是yˆ 0.304x 10.28.
规律技巧:用公式求回归直线方程的一般步骤:
(1)列表xi,yi,xiyi.
n
n
(2)计算 x, y, x i2, x i yi.
i 1
i 1
(3)代入公式求 bˆ ? aˆ 的值.
xiyi 15561 17028 18446 19824 21600 23322
12
x 205, y 72.6, x i2 518600, i 1
12
12
y i2 64572.94, x i yi 182943
i 1
i 1
bˆ 182943 12 205 72.6 4347 0.304. 518600 12 2052 14300
(1)画出散点图; (2)如果散点图中的各点大致分布在一条直线的附近,求y与x 之间的回归直线方程.
分析:(1)将表中的各对数据在平面直角坐标系中描点,便 得到具有相关关系的两个变量的一组数据的图形,即得散 点图;(2)按照求回归直线方程的步骤和公式,写出回归直 线方程.
解:(1)如下图.
(2)由散点图知,x与y之间具有线性相关关系,下面求回归直 线方程.
1.相关关系与函数关系不同,相关关系是一种_不__确___定__性关
系. 2.从散点图上看,点散布在从左下角到右上角的区域内,两个
变量的这种相关关系称为__正__相___关_,点散布在从左上角到右 下角的区域内,两个变量的这种相关关系称为_负__相___关__.
3.从散点图上看,如果这些点从整体上看大致分布在通过散点
变式训练3:改革开放以来,我国高等教育事业有了迅速发展, 这里我们得到了某省从1990年到2000年18岁到20岁的青年 人每年考入大学的百分比.我们把农村,县镇和城市分开统计. 为了便于计算,把1990年编号为0,1991年编号为1,…,2000年 编号为10.如果把每年考入大学的百分比作为因变量,把年份 从0到10作为自变量,进行回归分析,可得到下面三条回归直线:
(3)正相关、负相关 如果从散点图看到点散布的位置是左下角到右上角的区域. 这种相关称为正相关.反之,如果两个变量的散点图中,点散布 的位置是从左上角到右下角的区域.即一个变量的值由小变 大时,另一个变量的值由大变小,这种相关称为负相关. 如果关于两个变量统计数据的散点图呈现如图的形状,则这 两个变量之间不具有相关关系.例如,学生的身高与学生的数 学成绩没有相关关系.
(4)写出回归直线方程.
变式训练2:求变式训练1中的回归直线方程.
解:列表: i xi yi
xiyi
x
2 i
1 80 70 5600 6400
2 75 66 4950 5625
3 70 68 4760 4900
4 65 64 4160 4225
5
x 70, y 66, x i yi 23190 i 1
5 60 62 3720 3600
5
b
xi yi 5x y
i 1
5
xi2
2
5x
9 25
0.36,
i 1
a y bx 40.8.
所求回归直线方程为yˆ 0.36x 40.8.
题型三 利用回归直线方程对总体进行估计 例3:在7块并排、形状大小相同的实验田上进行施化肥量对水
稻产量影响的试验,得数据列表(单位:kg):
②函数关系是一种因果关系,而相关关系不一定是因果关系, 也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小 与阅读能力有很强的相关关系,然而学会新词并不能使脚变 大,而是涉及到第三个因素——年龄,当儿童长大一些,他的 阅读能力会提高,而且由于长大,脚也变大.
(3)相关关系的分析方向 由于相关关系的不确定性,在寻找变量间相关关系的过程中, 统计发挥非常重要的作用.我们可以通过收集大量的数据,在 对数据进行统计分析的基础上,发现其中的规律,对它们的关 系作出判断.
2.两个变量的线性相关 (1)回归分析 对具有相关关系的两个变量进行统计分析的方法叫回归分析. 通俗地讲, 回归分析是寻找相关关系中非确定性关系的某种确定性. (2)散点图 将n个数据点(xi,yi),(i=1,2,…,n)描在平面直角坐标系中,以表示 具有相关关系的两个变量的一组数据的图形叫做散点图. 散点图形象地反映了各对数据的密切程度.
城市: yˆ 9.50 2.84x;
县镇: yˆ 6.76 2.32x; 农村: yˆ 1.80 0.42x.
(1)在同一坐标系中作出这三条回归直线; (2)对于农村青年来讲,系数等于0.42意味着什么? (3)在这一阶段哪一组的大学入学率年增长最快?
解:(1)图象如下:
(2)对于农村青年来讲,0.42意味着考入大学的百分比平均以 每年0.42的速度递增,由此可以看出农村经济条件及教育现 状与城镇的差别. (3)城市组的大学入学率年增长最快.
分析:利用散点图进行判别.
解:以x轴为年平均气温,y轴为年降雨量,可得相应的散点图 如下图所示:
因为图中各点并不在一条直线的附近,所以两者不具有相关关系,没必要 用回归直线进行拟合,如果用公式求得回归直线也是没有意义的. 规律技巧:用回归直线进行拟合两变量关系的一般步骤为: (1)作出散点图,判断散点是否在一条直线附近; (2)如果散点在一条直线附近,用公式求出a,b并写出线性回归方程.
变式训练1:5个学生的数学和物理成绩如下表:
学生
A
B
C
D
E
学科
数学 80
75
70
65
60
物理 70
66
68
64
62
画出散点图,并判断它们是否有相关关系.
分析:解答本题可以以数学成绩为自变量,考察因变量物理成绩的变化趋 势,从而作出判断. 解:以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如图所示: 由散点图可见,图中的点大致在一条直线附近,故两者之间具有相关关系.
基础强化 1.下列两个变量具有相关关系且不是函数关系的是( ) A.正方形的边长与面积 B.匀速行驶的车辆的行驶距离与时间 C.人的身高与体重 D.人的身高与视力 解析:A、B都是函数关系,C是相关关系,D中人的视力与身高 没有关系. 答案:C
2.下列关系是函数关系的是( ) A.产生样本与生产数量 B.球的表面积与体积 C.家庭的支出与收入 D.人的年龄与学习成绩 解析:球的表面积与体积存在函数关系,应选B. 答案:B
n
xi yi nx y
i 1
n
(xi x )( yi y)
bˆ
__i_n1_x_i2 __nx_2__
,
i 1
n
____i1_(_xi__x_)2____,
aˆ _____y___b_x______ .
通过求Q=_(_y_1_-b_x_1_-_a_)_2+__(y_2_-_b_x_2_-a_)_2_+_…_+_(_y_n_-_b_x_n_-a_)_2_的最小 值而得出回归直线的方法,即使得样本数据的点到回归直线 的距离的平方和最小,这一方法叫做最小二乘法.
题型二 求回归直线方程 例2:每立方米混凝土的水泥用量(单位:kg)与28天后混凝土 的抗压强度(单位:kg/cm2)之间的关系有如下数据:
x 150 160 170 180 190 200 210 220 230 240 250 26 0
y 56.9 58.3 61.6 64.6 68.1 71.3 74.1 77.4 80.2 82. 86. 89 6 4 .7
(1)画出散点图如图: 由图可见是线性相关的.
(2)借助计算器列表:
i
1
2
3
4
5
6
7
xi
15
20
25
30
35
40
45
yi
330 345 365 405 445 450 455
xiyi 4950 6900 9125 12150 15575 18000 20475
计算得 : b 87175 7 30 399.3 4.75, 7000 7 302
(3)最小二乘法 设与n个观测点(xi,yi)(i=1,2,…,n)最接近的直线方程为 yˆ bx a
(注意它与表示一次函数的习惯y=ax+b不同 ; y ˆ表示y的估算值).其中
a,b是待定系数. 用Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2来刻画n个点与回归直线在 整体上的偏差.上式展开后,是一个关于a,b的二次多项式,运用配方法, 可求出使Q取得最小值时a,b的值(即上述公式①中的a,b值).
变量之间的相关关系 两个变量的线性相关
1.掌握两个变量间的相关关系及正相关、负相关、不具相关关 系的判定.
2.通过收集实际生活中两个变量的有关数据作出散点图. 3.利用散点图直观地认识变量间的相关关系. 4.正确理解回归直线方程、最小二乘法的概念. 5.能够根据散点图得到回归直线. 6.掌握利用最小二乘法求回归直线方程的方法.
制表:
i
1
2
3
4
5
6
xi
150
160
ቤተ መጻሕፍቲ ባይዱ
170
180
190
200
yi
56.9 58.3 61.6 64.6 68.1 71.3
xiyi
8535
9328 10472 11628 12939 14260i
i
7
8
9
10
11
12
xi
210
220
230
240
250
260
yi
74.1 77.4 80.2 82.6 86.4 89.7
利用散点图可以判断变量之间有无相关关系.
3.回归直线方程 (1)回归直线 观察散点图的特征,发现各点大致分布在一条直线的附近,就 称这两个变量之间具有线性相关的关系,这条直线叫做回归 直线.
(2)回归直线方程
设x与y具有相关关系的两个变量,且相应于n组观测值的n个
点大致分布在一条直线的附近,则由
a 399.3 4.75 30 257. 即得回归直线方程yˆ 257 4.75x.
(3)施化肥50 kg时,可以估计水稻产量约为495kg.
规律技巧:(1)回归分析是寻找相关关系中非确定性关系的某 种确定性;(2)求回归直线方程,关键在于正确地求出系数a,b, 由于a,b的计算量大,计算时要仔细,避免计算失误.
1.变量之间的相关关系 (1)相关关系 自变量取值一定时,因变量的取值带有一定随机性的两个变 量之间的关系叫相关关系. (2)相关关系与函数关系的异同点 相同点:两者均是指两个变量的关系;
不同点:①函数关系是一种确定的关系.如匀速直线运动中时 间t与路程s的关系;相关关系是一种非确定的关系.如一块农 田的水稻产量与施肥量之间的关系.事实上,函数关系是两个 非随机变量的关系,而相关关系是非随机变量与随机变量的 关系.
图中心的一条直线附近,称两个变量之间具有_线__性___相__关__关__ 系 , 这条直线叫__回__归___直线 _.
4.假设我们已经得到两个具有线性相关关系的变量的一组数
据(x1,y1),(x2,y2),…,(xn,yn).且所求回归方程是 yˆ bˆx aˆ,
其中b是回归方程的___斜__率___, aˆ 是___截__距___,则有
n
n
(xi x )( yi y)
xi yi nx y
bˆ i1 n
aˆ
y
( xi
i 1
bˆx
x)2
i 1 n
xi2
2
nx
i 1
其中,b是回归方程的斜率,a是截距. 所得到的方程 yˆ bx a 叫作回归直线方程,相应的直线叫作 回归直线,而对两个变量所进行的统计分析叫作线性回归分 析.
上述求回归直线的方法,是使得样本数据的点到它的距离的 平方和最小.由于平方又叫二乘方,所以这种使“偏差平方和 为最小”的方法,叫做最小二乘法.
题型一 相关关系的判断 例1:下表是某地的年降雨量与年平均气温,两者是相关关系吗? 求回归直线方程有意义吗?
年平均 12.51 12.84 12.84 13.69 13.33 12.74 13.05 气温(℃)
施化肥 15 20 25 30 35 40 45 量x
水稻产 330 345 365 405 445 450 455 量y
(1)画出散点图; (2)求水稻产量y与施化肥量x之间的回归直线方程; (3)当施化肥50 kg时,对水稻的产量予以估计. 分析:解答本题应先画散点图,判断其是否线性相关,再利用 最小二乘法求其回归方程.
3.如下图所示,有5组(x,y)数据,去掉( 数据的线性相关系数最大.( )
aˆ y bˆx 72.6 0.304 205 10.28, 于是所求的线性回归方程是yˆ 0.304x 10.28.
规律技巧:用公式求回归直线方程的一般步骤:
(1)列表xi,yi,xiyi.
n
n
(2)计算 x, y, x i2, x i yi.
i 1
i 1
(3)代入公式求 bˆ ? aˆ 的值.
xiyi 15561 17028 18446 19824 21600 23322
12
x 205, y 72.6, x i2 518600, i 1
12
12
y i2 64572.94, x i yi 182943
i 1
i 1
bˆ 182943 12 205 72.6 4347 0.304. 518600 12 2052 14300
(1)画出散点图; (2)如果散点图中的各点大致分布在一条直线的附近,求y与x 之间的回归直线方程.
分析:(1)将表中的各对数据在平面直角坐标系中描点,便 得到具有相关关系的两个变量的一组数据的图形,即得散 点图;(2)按照求回归直线方程的步骤和公式,写出回归直 线方程.
解:(1)如下图.
(2)由散点图知,x与y之间具有线性相关关系,下面求回归直 线方程.
1.相关关系与函数关系不同,相关关系是一种_不__确___定__性关
系. 2.从散点图上看,点散布在从左下角到右上角的区域内,两个
变量的这种相关关系称为__正__相___关_,点散布在从左上角到右 下角的区域内,两个变量的这种相关关系称为_负__相___关__.
3.从散点图上看,如果这些点从整体上看大致分布在通过散点
变式训练3:改革开放以来,我国高等教育事业有了迅速发展, 这里我们得到了某省从1990年到2000年18岁到20岁的青年 人每年考入大学的百分比.我们把农村,县镇和城市分开统计. 为了便于计算,把1990年编号为0,1991年编号为1,…,2000年 编号为10.如果把每年考入大学的百分比作为因变量,把年份 从0到10作为自变量,进行回归分析,可得到下面三条回归直线:
(3)正相关、负相关 如果从散点图看到点散布的位置是左下角到右上角的区域. 这种相关称为正相关.反之,如果两个变量的散点图中,点散布 的位置是从左上角到右下角的区域.即一个变量的值由小变 大时,另一个变量的值由大变小,这种相关称为负相关. 如果关于两个变量统计数据的散点图呈现如图的形状,则这 两个变量之间不具有相关关系.例如,学生的身高与学生的数 学成绩没有相关关系.
(4)写出回归直线方程.
变式训练2:求变式训练1中的回归直线方程.
解:列表: i xi yi
xiyi
x
2 i
1 80 70 5600 6400
2 75 66 4950 5625
3 70 68 4760 4900
4 65 64 4160 4225
5
x 70, y 66, x i yi 23190 i 1
5 60 62 3720 3600
5
b
xi yi 5x y
i 1
5
xi2
2
5x
9 25
0.36,
i 1
a y bx 40.8.
所求回归直线方程为yˆ 0.36x 40.8.
题型三 利用回归直线方程对总体进行估计 例3:在7块并排、形状大小相同的实验田上进行施化肥量对水
稻产量影响的试验,得数据列表(单位:kg):
②函数关系是一种因果关系,而相关关系不一定是因果关系, 也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小 与阅读能力有很强的相关关系,然而学会新词并不能使脚变 大,而是涉及到第三个因素——年龄,当儿童长大一些,他的 阅读能力会提高,而且由于长大,脚也变大.
(3)相关关系的分析方向 由于相关关系的不确定性,在寻找变量间相关关系的过程中, 统计发挥非常重要的作用.我们可以通过收集大量的数据,在 对数据进行统计分析的基础上,发现其中的规律,对它们的关 系作出判断.
2.两个变量的线性相关 (1)回归分析 对具有相关关系的两个变量进行统计分析的方法叫回归分析. 通俗地讲, 回归分析是寻找相关关系中非确定性关系的某种确定性. (2)散点图 将n个数据点(xi,yi),(i=1,2,…,n)描在平面直角坐标系中,以表示 具有相关关系的两个变量的一组数据的图形叫做散点图. 散点图形象地反映了各对数据的密切程度.
城市: yˆ 9.50 2.84x;
县镇: yˆ 6.76 2.32x; 农村: yˆ 1.80 0.42x.
(1)在同一坐标系中作出这三条回归直线; (2)对于农村青年来讲,系数等于0.42意味着什么? (3)在这一阶段哪一组的大学入学率年增长最快?
解:(1)图象如下:
(2)对于农村青年来讲,0.42意味着考入大学的百分比平均以 每年0.42的速度递增,由此可以看出农村经济条件及教育现 状与城镇的差别. (3)城市组的大学入学率年增长最快.