10.4 变量间的相关关系__统计案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四节
变量间的相关关系__
统计案例
1.变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是________;与函数关系不同,________是一种非确定性关系.
(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为________.
2.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有________________,这条直线叫做________.
(2)回归方程为y ^=b ^x +a ^,其中b ^
=
∑i =1
n
x i y i -n x - y
-
∑i =1
n x 2i -n x -
2
, a ^=y --b ^x -. (3)通过求Q =∑i =1
n
y i -bx i -a 2
的最小值而得到回归直线的方法,即使得样本数据的点
到回归直线的距离的平方和最小,这一方法叫做最小二乘法.
(4)相关系数:
当r >0时,表明两个变量________; 当r <0时,表明两个变量________.
r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.
3.独立性检验
假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为:
K 2
=n ad -bc 2
a +
b a +
c b +
d c +d
(其中n =a +b +c +d 为样本容量).
[小题体验]
1.(教材习题改编)已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ^,则a ^
=________.
2.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.
根据表中数据,得到K 2
的观测值k =50× 13×20-10×7 2
23×27×20×30
≈4.844.则认为选修文科
与性别有关系出错的可能性为________.
1.易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
2.回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(x -,y -
)点,可能所有的样本数据点都不在直线上.
3.利用回归方程分析问题时,所得的数据易误认为是准确值,而实质上是预测值(期望值).
[小题纠偏]
1.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组
样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^
=0.85x -85.71,则下列结论中不正确的是( )
A .y 与x 具有正的线性相关关系
B .回归直线过样本点的中心(x ,y )
C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg
D .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg
2.为了考察两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2,已知两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,那么下列说法正确的是( )
A .l 1和l 2必定平行
B .l 1与l 2必定重合
C .l 1和l 2一定有公共点(s ,t )
D .l 1与l 2相交,但交点不一定是(s ,t )
考点一 相关关系的判断 基础送分型考点——自主练透
[题组练透]
1.(2015·湖北高考)已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )
A .x 与y 正相关,x 与z 负相关
B .x 与y 正相关,x 与z 正相关
C .x 与y 负相关,x 与z 负相关
D .x 与y 负相关,x 与z 正相关 故x 与z 负相关.
2.某公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x 对产量y 影响的试验,得到如下表所示的一组数据(单位:kg):
(1)画出散点图.
(2)判断是否具有相关关系.
[谨记通法]
判断相关关系的2种方法
(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关.
(2)相关系数法:利用相关系数判定,当|r|越趋近于1相关性越强.
考点二回归分析 重点保分型考点——师生共研
[典例引领]
1.(2016·全国丙卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
[由题悟法]
1.回归直线方程中系数的2种求法
(1)利用公式,求出回归系数b,a.
(2)待定系数法:利用回归直线过样本点中心求系数.