知识讲解_变量间的相关关系_提高
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
变量的相关性
【学习目标】
1.明确两个变量具有相关关系的意义;
2.知道回归分析的意义;
3.知道回归直线、回归直线方程、线性回归分析的意义;
4.掌握对两个变量进行线性回归的方法和步骤,并能借助科学计算器确定实际问题中两个变量间的回归直线方程;
【要点梳理】
【高清课堂:变量的相关关系 400458 知识讲解1】
要点一、变量之间的相关关系
变量与变量之间存在着两种关系:一种是函数关系,另一种是相关关系。
1.函数关系
函数关系是一种确定性关系,如y=kx+b,变量x取的每一个值,y都有唯一确定的值和它相对应。
2.相关关系
变量间确定存在关系,但又不具备函数关系所要求的确定性
相关关系分为两种:
正相关和负相关
要点诠释:
对相关关系的理解应当注意以下几点:
(1)相关关系与函数关系不同.因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系.
(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄.当儿童长大一些,他们的阅读能力会提高而且由于长大脚也变大.
(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化.例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性.而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计.
3.散点图
将收集到的两个变量的统计数据分别作为横、纵坐标,在直角坐标系中描点,这样的图叫做散点图。
通过散点图可初步判断两个变量之间是否具有相关关系,她反映了各数据的密切程度。
要点二、正相关、负相关
(1)正相关:在统计数据中的两个变量,一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关。
如:家庭年收入越高,年饮食支出越高。
反映在散点图上它们散布在从左下角到右上角的区域,按表中所列数据制作散点图如图
(2)负相关:如果两个变量中,一个变量的值由小到大变化时,另一个变量的值由大到小变化,那么这种相关称为负相关。
在散点图中,对应数据的位置为从左上角到右下角的区域。
按表中所列数据制作的散点图如图。
(3)无相关关系:如果关于两个变量统计数据的散点图如下图所示,那么这两个变量之间不具有相关关系。
例如,学生的身高与学生的学习成绩没有相关关系。
要点诠释:
利用散点图可以大致判断两个变量之间有无相关关系。
【高清课堂:变量的相关关系 400458 知识讲解2】 要点三、线性回归方程 1.回归直线方程
(1)回归直线:观察散点图的特征,发现各个大致分布在通过散点图中心的一条直线附近。
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。
求出的回归直线方程简称回归方程。
2.回归直线方程的求法
设与n 个观测点(,i i x y )()1,2,,i n =⋅⋅⋅最接近的直线方程为,y b x a =+,其中a 、b 是待定系数. 则,(1,2,
,)i i y b x a i n =+= .于是得到各个偏差
(),(1,2,
,)i i i i y y y b x a i n -=-+=.
显见,偏差i i y y -的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n 个偏差的平方和.
2
2
2
22
11)
()
()
(a bx
y a bx
y a bx y Q n
n --++--+--=
表示n 个点与相应直线在整体上的接近程度.
记21()n
i i i Q y b x a ==
--∑.
上述式子展开后,是一个关于a 、b 的二次多项式,应用配方法,可求出使Q 为最小值时的a 、b 的值.即
1
1
22
2
1
1
()()()n
n
i i i i i i n
n
i i i i x x y y x y n x y b x x x n x
a y
b x
====⎧
---⎪
⎪==⎪⎨
--⎪
⎪=-⎪⎩∑∑
∑∑
, ∑
==
n
i i x n
x 1
1,∑
==
n
i i y n
y 1
1
相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析
上述求回归直线的方法是使得样本数据的点到回归直线的距离的平方和最小的方法,叫做最小二乘法。
要点诠释:
1.对回归直线方程只要求会运用它进行具体计算a 、b ,求出回归直线方程即可.不要求掌握回归直线方程的推导过程.
2.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义.否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.
3.求回归直线方程,关键在于正确地求出系数a 、b ,由于求a 、b 的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误.
4.回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识.
【典型例题】
类型一:变量间的相关关系与函数关系
例1.下列两个变量之间的关系中,不是函数关系的是( ) A .角度和它的余弦值 B .正方形的边长和面积 C .正n 边形的边数和其内角度数之和 D .人的年龄和身高 【答案】D
【解析】 函数关系是一种确定的关系。
而相关关系是非确定性关系。
选项A 、B 、C 都是函数关系,可
以写出它们的函数表达式:()c o s f x θ=,2
()g a a =,()2h n n ππ=-,选项D 不是函数关系,在相同年龄的人群中,仍可以有不同身高的人,故选D .
【总结升华】 本题考查非数据型两个变量的相关性判断.要根据两个变量之间是否具有确定性关系及因素关系进行判断.
举一反三:
【变式1】下列图形中具有相关关系的两个变量是( )
【答案】 C
【解析】A、B中显然任给一个x都有唯一确定的y值和它对应,是函数关系;C中从散点图可看出所有点看上去都在某条直线附近波动,具有相关关系,因此变量间是不相关的。
【变式2】下列关系是相关关系的是________(填序号).
①人的年龄与他拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与其学号之间的关系.【答案】①③④
例2.某小卖部为了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶杯数与当天气温的对比表。
请画出散点图,并判断它们是否有相关关系。
【解析】散点图如下图:
从图中发现气温与杯数之间具有相关关系,当气温的值由小到大变化时杯数值由大变小,所以气温和杯数成负相关。
【总结升华】画出散点图可帮助分析变量间是否具有相关关系,但不是唯一的判断途径。
举一反三:
【变式1】下表是某地的年降雨量与年平均气温,判断两者是相关关系吗?求回归直线方程有意义吗?
因为图中各点并不在一条直线的附近,所以两者不具有相关关系,求回归直线方程是没有意义的。
【总结升华】用回归直线进行拟合两变量关系的一般步骤为:
①作出散点图,判断各点是否散布在一条直线附近。
②如果各点散布在一条直线附近,那么可用公式求出线性回归方程;如果各点不在一条直线附近,那么求出的回归直线方程没有意义。
类型二:回归直线方程的求解 例
(1)画出散点图;
(2)求成本y 与产量x 之间的线性回归方程;
(3)当成本为15万元时,试估计产量为多少件?(保留两位小数)
(12
2
1
n
i i i n
i i x y n x y
b x n x
==-=
-∑
∑
,a y b x =-)
【思路点拨】(1)在坐标系中描出相应的点,即可得到所要的三点图
(2)求线性回归直线方程要先求出均值,再由公式求a 、b 的值,写出回归直线方程; (3)令y =15,求出x 即可. 【解析】 (1)散点图如图
(2)4x =,9y =,b =1.10
9 1.104 4.60a y b x =-=-⨯=
∴回归方程为y =1.10x +4.60;
(3)y =15时,y =1.10x +4.60=15, ∴x ≈9.45
举一反三:
根据上表可得回归方程ˆ
ˆˆy b x a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为
A .63.6万元
B .65.
5万元 C .67.7万元 D .72.0万元 【答案】选B
【解析】4235
49263954
3.5,424
4
x y ++++++=
==
=
429.4 3.59.1a y b x ∴=-=-⨯=,∴回归方程为9.49.1y x =+,
∴
当6x =时,9.469.1y =⨯+=65.5,故选B .
求两变量间的回归方程. 【答案】y x =
计算得:0x =,0y =。
10
2
1
110i i x ==∑
,10
1
110i i i x y ==∑。
∴10
12
10
2
1
101101001110100
10i i i x iy i x y
b x x
==--⨯=
=
=-⨯-∑
∑。
000a y b x b =-=-⋅=。
∴所求回归直线方程为y x =。
类型三:利用回归直线对总体进行估计
【高清课堂:变量的相关关系 400458 例2】 例4.给出了随机抽取的10位男性的收缩血压.
(1)画出散点图;
(2)求出收缩压与年龄之间的回归直线;
(3)利用所求回归直线分别预测20岁、45岁的人的收缩压是多少? (4)就(3)所得预测结果,比较其预测的精确性。
【解析】(1)散点图为:
12
2
1
669681047.6137.8ˆ 1.5763235301047.647.6
n
i i i n
i i x y n x y
b
x n x
==--⨯⨯==
=-⨯⨯-∑
∑
ˆˆ62.766a
y b x =-= 所以y 对x 的回归直线方程为:
62.766 1.5763y x =+
(3)根据所求的回归直线方程可以预测20岁的收缩压为
ˆ62.766 1.57632094.293y
=+⨯= 45岁的收缩压为:ˆ62.766 1.576345133.7y
=+⨯=毫米汞柱 (4)预测20岁的结果时,20是外推的,所以不是很精确;而45是内插值,所以精确性比20的预测结果要好。
【总结升华】只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测
结果也是不可信的.
举一反三: 【变式1】(2015春 成都龙泉驿区期中)已知x ,y 的一组数据如下表
则由表中的数据算得的线性回归方程可能是( ) A .y =2x +2 B .y =2x -1 C .3122
y x =-+ D .825
5
y x =
-
【答案】D
【解析】由题意,1(23456)45
x =
++++=,1(34689)65
y =
++++=,
代入线性回归方程,可得D 满足. 故选:D
【变式2】下表是某地搜集到的新房屋的销售价格y ,(单位:万元)和房屋的面积x (单位:m 。
)的数据:
(1 (2)求回归方程;
(3)根据(2)的结果估计当房屋面积为150 m 2时的销售价格.
【解析】据已知样本数据得到回归直线方程后,即得到两个变量之间相关关系的一个规律,因此可将给定的x 值代入回归直线方程预测y 值. (1)散点图如下图所示.
(2)由散点图可以看出,这些点大致分布在一条直线的附近,可求回归方程.由表中的数据,用计算
器计算得109x =,43.2y =,5
2
1
60975i i x ==∑,5
1
23852i i i x y ==∑.
则5
15
2
2
2
1
523852510943.23080.196609755109
1570
5i i i i i x y x y
b x x
==--⨯⨯=
=
=
≈-⨯-∑
∑
,
43.20.19610921.836a y b x =-=-⨯=.故所求回归方程为0.19621.836y x ==.
(3)根据上面求得的回归方程,当房屋面积为1500时,销售价格的估计值为0.196×150+21.836=51.236(万元).。