变量间的相关关系与统计案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

变量间的相关关系与统计案例

[考纲传真] 1.会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归系数公式不要求记忆).3.了解回归分析的基本思想、方法及其简单应用.4.了解独立性检验(只要求2×2列联表)的思想、方法及其初步应用.

【知识通关】

1.两个变量的线性相关 (1)正相关

在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)负相关

在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.

(3)线性相关关系、回归直线

如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.回归方程

(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.

(2)回归方程:方程y ^=b ^x +a ^

是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^

是待定参数.

⎩⎪⎨⎪⎧

b ^=

∑n i =1

(x i -x )(y i -y )∑n

i =1

(x i

-x )2

∑n

i =1x i y i -n x -y

∑n

i =1

x 2i -n x

2

a ^=y -

b ^x

3.回归分析

(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.

(2)样本点的中心

对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x -,y -

)称为样本点的中心. (3)相关系数

当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.

r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性. 4.独立性检验

(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.

(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为 2×2列联表

构造一个随机变量K 2=

n (ad -bc )(a +b )(a +c )(b +d )(c +d )

,其中n =a +b +c +d 为样本容

量. [常用结论]

1.回归直线必过样本点的中心(x ,y ).

2.当两个变量的相关系数|r |=1时,两个变量呈函数关系.

【基础自测】

1.判断下列结论的正误.(正确的打“√”,错误的打“×”)

(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( )

(2)通过回归直线方程y ^=b ^x +a ^

可以估计预报变量的取值和变化趋势.( )

(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.()

(4)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.() [答案](1)√(2)√(3)×(4)√

2.在两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的是()

A.模型1的相关指数R2为0.98

B.模型2的相关指数R2为0.80

C.模型3的相关指数R3为0.50

D.模型4的相关指数R2为0.25

A

3.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),若自变量的值为10,则因变量的值约为()

A.16.3B.17.3

C.12.38 D.2.03

C

4.下面是一个2×2列联表

52,54

5.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:

根据表中数据,得到K2的观测值k=50×(13×20-10×7)2

23×27×20×30

≈4.844.则认为选修

文科与性别有关系出错的可能性为________.5%

【题型突破】

相关关系的判断

1.已知变量x 和y 近似满足关系式y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )

A .x 与y 正相关,x 与z 负相关

B .x 与y 正相关,x 与z 正相关

C .x 与y 负相关,x 与z 负相关

D .x 与y 负相关,x 与z 正相关 C

2.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )

A .r 2<r 4<0<r 3<r 1

B .r 4<r 2<0<r 1<r 3

C .r 4<r 2<0<r 3<r 1

D .r 2<r 4<0<r 1<r 3 A

3.x 和y 的散点图如图所示,则下列说法中所有正确命题的序号为________.

①x ,y 是负相关关系;

②在该相关关系中,若用y =c 1e c 2x 拟合时的相关指数为

R 21,用y ^=b ^x +a ^

拟合时

的相关指数为R 22,则R 21>R 22;

相关文档
最新文档