3 第3讲 变量间的相关关系、统计案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第3讲 变量间的相关关系、统计案例

1.变量间的相关关系

常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系. 2.两个变量的线性相关

(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.

(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.

(3)回归方程为y ^=b ^x +a ^,其中b ^

=,a ^=y --b ^x -.

(4)相关系数

当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.

r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r |大于0.75时,认为两个变量有很强的线性相关性. 3.独立性检验

(1)2×2列联表:假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称2×2列联表)为:

y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计

a +c

b +d

a +

b +

c +d

(2)K 2K 2=

n (ad -bc )2

(a +b )(c +d )(a +c )(b +d )

(其中n =a +b +c +d 为样本容量).

判断正误(正确的打“√”,错误的打“×”)

(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( ) (2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.( )

(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( ) (4)事件X ,Y 的关系越密切,由观测数据计算得到的K 2的观测值越大.( ) (5)通过回归方程y ^=b ^x +a ^

可以估计和观测变量的取值和变化趋势.( ) 答案:(1)× (2)√ (3)√ (4)√ (5)√

某商品销售量y (件)与销售价格x (元/件)负相关,则其回归直线方程可能是( ) A.y ^

=-10x +200 B.y ^

=10x +200 C.y ^

=-10x -200

D.y ^

=10x -200

解析:选A.因为商品销售量y (件)与销售价格x (元/件)负相关,所以b ^

<0,排除B ,D. 又因为x =0时,y >0,所以应选A.

某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K 2=7.069,则所得到的统计学结论是:有多少的把握认为“学生性别与支持该活动有关系”.( ) 附:

P (K 2≥k 0)

0.100 0.050 0.025 0.010 0.001 k 0

2.706

3.841

5.024

6.635 10.828

A.0.1%

B .1%

C .99%

D .99.9%

解析:选C.因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”. 下面是一个2×2列联表

y 1 y 2 总计 x 1 a 21 73 x 2 2 25 27 总计

b

46

则表中a 、b 处的值分别为解析:因为a +21=73,所以a =52. 又因为a +2=b ,所以b =54. 答案:52、54

已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ^

,则a ^

=________.

x 0 1 3 4 y

2.2

4.3

4.8

6.7

解析:由已知得x -=2,y -=4.5,因为回归方程经过点(x -,y -),所以a ^

=4.5-0.95×2=2.6. 答案:2.6

相关关系的判断

[典例引领]

已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( ) A .x 与y 正相关,x 与z 负相关 B .x 与y 正相关,x 与z 正相关 C .x 与y 负相关,x 与z 负相关 D .x 与y 负相关,x 与z 正相关

【解析】 因为y =-0.1x +1的斜率小于0,故x 与y 负相关.因为y 与z 正相关,可设z =b ^y +a ^,b ^>0,则z =b ^y +a ^=-0.1b ^x +b ^+a ^

,故x 与z 负相关. 【答案】 C

判定两个变量正、负相关性的方法

(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.

(2)相关系数:r >0时,正相关;r <0时,负相关.

(3)线性回归方程中:b ^>0时,正相关;b ^

<0时,负相关.

[通关练习]

1.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图如图①,对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图如图②.由这两个散点图可以判断( )

A .变量x 与y 正相关,u 与v 正相关

B .变量x 与y 正相关,u 与v 负相关

C .变量x 与y 负相关,u 与v 正相关

D .变量x 与y 负相关,u 与v 负相关

解析:选C.由散点图可得两组数据均线性相关,且图①的线性回归方程斜率为负,图②的

相关文档
最新文档