考点42 变量间的相关关系-高考全攻略之数学(文)考点一遍过
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
微信公众号:678高中初中资料库
变量的相关性
(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系. (2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 回归分析
了解回归分析的基本思想、方法及其简单应用.
1.相关关系
当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫做相关关系.即相关关系是一种非确定性关系.
当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正相关; 当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负相关. 【注意】相关关系与函数关系的异同点: 共同点:二者都是指两个变量间的关系.
不同点:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系. 2.散点图
将样本中的n 个数据点()(1,)2i i x y i n ,,,描在平面直角坐标系中,所得图形叫做散点图.
从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在从左上角到右下角的区域内,两个变量的相关关系为负相关.
具有正相关关系的两个变量的散点图如图1,具有负相关关系的两个变量的散点图如图2. 3.回归分析
如果散点图中点的分布从整体上看大致在一条直线附近,则这两个变量之间具有线性相关关系,这条直线叫做回归直线.学&
回归直线对应的方程叫做回归直线方程(简称回归方程). 4.回归方程的求解
(1)求回归方程的方法是最小二乘法,即使得样本数据的点到回归直线的距离的平方和最小.
若变量x 与y 具有线性相关关系,有n 个样本数据()(1,)2i i x y i n =,,,,则回归方程ˆˆˆy bx a =+中
1
1
2
2
2
1
1
()()()
ˆn n
i
i
i i
i i n
n
i
i
i i x x y y x y nx y
b
x x x
nx ====---==
--∑∑∑∑,ˆˆa y bx
=-. 其中1211,n
n
i i x x x x n n
x =+++==
∑211
1n
n
i i y y n n
y y y =+++==∑,
(,)x y 称为样本点的中心.
(2)线性回归模型y bx a e =++,其中e 称为随机误差,自变量x 称为解释变量,因变量y 称为预报变量.
【注意】①回归直线ˆˆˆy bx a =+必过样本点的中心(,)x y ,这个结论既是检验所求回归直线方程是否准
确的依据,也是求参数的一个依据.
②利用回归直线方程不但可以预测在x 取某一个值时,y 的估计值,同时也能知道x 每增加1个单位,ˆy
的变化量.
③在回归直线方程中,ˆb既表示直线的斜率,又表示自变量x的取值每增加一个单位时,函数y的改变
量.
5.相关系数
(1)样本相关系数r的计算公式
我们可以利用相关系数来定量地衡量两个变量之间的线性相关关系,计算公式
为
n
x y
r=.
(2)样本相关系数r的性质
①||1
r≤;
②当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;
③|r|越接近于1,表明两个变量的线性相关性越强;
④|r|越接近于0,表明两个变量的线性相关性越弱.
6.非线性回归分析
对某些特殊的非线性关系,可以通过变量转换,把非线性回归问题转化成线性回归问题,然后用线性回归的方法进行研究.@网
在大量的实际问题中,所研究的两个变量不一定都呈线性相关关系,当两变量y与x不具有线性相关关系时,要借助散点图,与已学过的函数(如指数函数、对数函数、幂函数等)的图象相比较,找到合适的函数模型,利用变量代换转化为线性函数关系,从而使问题得以解决.
7.刻画回归效果的方式
残差图
ˆ
i
e称为相应于点(,)
i i
x y的
残差,ˆ
i
e=ˆ
i i
y y
-
残差点比较均匀地落在水平的带状区域中,
说明选用的模型比较合适,其中这样的带状
区域的宽度越窄,说明模型拟合精确度越高
.
残差平方和2
1
ˆ
()
n
i i
i
y y
=
-
∑残差平方和越小,模型的拟合效果越好
考向一相关关系的判断
判定两个变量正、负相关性的方法:
(1)画散点图:若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关;
(2)相关系数:r>0时,正相关;r<0时,负相关;
(3)线性回归方程中:ˆ0
b>时,正相关;ˆ0
b<时,负相关.
典例1给出下列有关线性回归分析的四个命题:
①线性回归直线未必过样本数据点的中心(,)
x y;
②回归直线就是散点图中经过样本数据点最多的那条直线;
③当相关系数0
r>时,两个变量正相关;
④如果两个变量的相关性越强,则相关系数r就越接近于1.
其中真命题的个数为
A.1B.2
C.3D.4
【答案】A