10.4 变量间的相关关系__统计案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四节

变量间的相关关系__

统计案例

1.变量间的相关关系

(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是________;与函数关系不同,________是一种非确定性关系.

(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为________.

2.两个变量的线性相关

(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有________________,这条直线叫做________.

(2)回归方程为y ^=b ^x +a ^,其中b ^

∑i =1

n

x i y i -n x - y

∑i =1

n x 2i -n x -

2

, a ^=y --b ^x -. (3)通过求Q =∑i =1

n

y i -bx i -a 2

的最小值而得到回归直线的方法,即使得样本数据的点

到回归直线的距离的平方和最小,这一方法叫做最小二乘法.

(4)相关系数:

当r >0时,表明两个变量________; 当r <0时,表明两个变量________.

r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.

3.独立性检验

假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为:

K 2

=n ad -bc 2

a +

b a +

c b +

d c +d

(其中n =a +b +c +d 为样本容量).

[小题体验]

1.(教材习题改编)已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ^,则a ^

=________.

2.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:

已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.

根据表中数据,得到K 2

的观测值k =50× 13×20-10×7 2

23×27×20×30

≈4.844.则认为选修文科

与性别有关系出错的可能性为________.

1.易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.

2.回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(x -,y -

)点,可能所有的样本数据点都不在直线上.

3.利用回归方程分析问题时,所得的数据易误认为是准确值,而实质上是预测值(期望值).

[小题纠偏]

1.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组

样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^

=0.85x -85.71,则下列结论中不正确的是( )

A .y 与x 具有正的线性相关关系

B .回归直线过样本点的中心(x ,y )

C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg

D .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg

2.为了考察两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2,已知两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,那么下列说法正确的是( )

A .l 1和l 2必定平行

B .l 1与l 2必定重合

C .l 1和l 2一定有公共点(s ,t )

D .l 1与l 2相交,但交点不一定是(s ,t )

考点一 相关关系的判断 基础送分型考点——自主练透

[题组练透]

1.(2015·湖北高考)已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )

A .x 与y 正相关,x 与z 负相关

B .x 与y 正相关,x 与z 正相关

C .x 与y 负相关,x 与z 负相关

D .x 与y 负相关,x 与z 正相关 故x 与z 负相关.

2.某公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x 对产量y 影响的试验,得到如下表所示的一组数据(单位:kg):

(1)画出散点图.

(2)判断是否具有相关关系.

[谨记通法]

判断相关关系的2种方法

(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关.

(2)相关系数法:利用相关系数判定,当|r|越趋近于1相关性越强.

考点二回归分析 重点保分型考点——师生共研

[典例引领]

1.(2016·全国丙卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.

(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;

(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.

[由题悟法]

1.回归直线方程中系数的2种求法

(1)利用公式,求出回归系数b,a.

(2)待定系数法:利用回归直线过样本点中心求系数.

相关文档
最新文档