变量间的相关关系与线性回归方程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11. 3变量间的相关关系与线性回归方程
1. 变量间的相关关系
常见的两变量之间的关系有两类:一类是确定性的函数关系,另一类是________ ;与函数关系不同,相关关系是
一种_________ 关系,带有随机性.
2. 两个变量的线性相关
(1) 如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有______________ ,这条直线叫_________ .
(2) 从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为___________ ;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为________ .
n
(x -x)(y -y)
⑶相关系数r =------ i- -------------------------- ,当r > 0时,表示两个变量正相关;当r v 0时,表示两个变量负相关.r
巨(x—x)2送(y j -y)2
I i i j 1
的绝对值越接近_________ ,表示两个变量的线性相关性越强;r的绝对值越接近_________ ,表示两个变量的线性
相关性越弱.通常当r的绝对值大于0.75时,认为两个变量具有很强的线性相关关系.
3. 回归直线方程
n
(1) 通过求Q( a 3 =送(y i - B x -G)2的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的
i经
距离的平方和最小的方法叫做___________ •该式取最小值时的 a 3的值即分别为, b?.
⑵两个具有线性相关关系的变量的一组数据:(x i, y i) , (X2, y2),…,(x n, y n),其回归方程为? = |?x a?,则
" n n
Z (x -x)(y^y) Z X j y i —nxv
R=____________ = _______
n 一n
Z (% _x)2Z x2 -nx2
i¥iT:
a? -ibx.
自查自纠
1. 相关关系非确定性
2. (1)线性相关关系回归直线(2)正相关负相关(3)1 0
3. 最小二乘法
❶某公司2012〜20,17年的年利润x(单位:百万元”)与年广告支出y(单位:百万元)的统计资料如下表所示:
根据统计资料,则()
□ (2016 •西八所重点中学联考)为了解某商品的销售量 y (件)与销售价格x (元/件)的关系,统计了(x , y )的10
组
值,并画成如图所示的散点图,则其回归方程可能是
( )
A. y =— 10x — 198 cf = 10x + 198
解:由图象可知回归直线方
程的斜率小于零,截距大于零. 故选B.
⑥ 已知数组(X 1, y 1), (X 2,
y 2),…,(X 10,
y 10)满足线性回归方程y = bx + a ,
则“
(x o ,
y °)满足线性回归方程
,=bx
X 1 + x 2 + …+ x 10 丫
1+ y 2+…+ y
10” + a 是 x 0= A .充分不必要条件 B .必要不充分条件 C .充要条件
D .既不充分也不必要条件
解:x o , y o 为这10组数据的平均值,又因为线性回归方程 y = bx + a 必过样本中心(x , y ),因此(x , y )一定满足线
性回归方程,但满足线性回归方程的除了 (x , y )外,可能还有其他样本点. 故选B.
◎下列命题:
① 线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法; ② 利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示; ③ 通过回归直线y =bx + a ,可以估计和预测变量的取值和变化趋势. 其中正确命题的序号是 __________ . 解:易知①②③均正确,故填①②③.
(2017 •东)为了研究某班学生的脚长 x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生, A A 10 10 根据测量数据的散点图可以看出 y 与x 之间有线性相关关系,设其回归直线方程为y = bx + .已知x i =225 , y i
i =1
i W
=1600, b = 4.该班某学生的脚长为 24,据此估计其身高为 ______________ 厘米.
解:由已知得 x = 22.5, y = 160,则=160 — 4X 22.5 = 70,当 x = 24 时,y = 4X 24+ 70= 166,故填 166.
类型一相关关系的判断
EE 1 (2015石家庄调研)下列结论正确的是(
)
C . 利润中位数是 利润中位数是 利润中位数是 16, 17,
D •利润中位数是
解:利润中位数是
17, 18, 16+ 18
2 x 与y 有正线性相关关系 x 与y 有正线性相关关系 x 与y 有负线性相关关系 x 与y 有负线性相关关系 17,随着x 增大y 增大,x 与y 正线性相关,故选B.
,y o
=
10
10
触类旁通
B. D.
芳类解折
①函数关系是一种确定性关系;
②相关关系是一种非确定性关系;
③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;
④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
A .①②B.①②③
C.①②④
D.①②③④
解:由回归分析的方法及概念判断①②④正确.故选C.
【点拨】要注意函数关系与相关关系的区别:函数关系是确定性关系,而相关关系是随机的、不确定的•回归分析是对具有
相关关系的两个变量进行统计分析的一种常用方法.
①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;
②平均日学习时间和平均学习成绩;
③某人每日吸烟量和身体健康情况;
④圆的半径与面积;
⑤电瓶车的重量和行驶每千米的耗电量.
其中两个变量成正相关的是()
A .①③
B .②④
C.②⑤ D .④⑤
解:①③为负相关,④为确定的函数关系,并非相关关系. 故选C.
类型二线性回归方程的有关概念
GE)为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l i, I2,已知两人得到的试验数据中,变量x的平均值都等于s,变量y的平均值都等于t,那么下列说法正确的是()
A .直线l i和12一定有公共点(S, t)
B .直线11和12相交,但交点不- -定是(s, t)
C.必有直线11 // 12
D .直线11和12必定重合
解:线性回归直线方程为y= a+bx,而a= y— b x,即a = t—bs.t= a +bs.所以(s, t)在回归直线上,即直线11和12必有公共点(s, t).故选A.
【点拨】回归方程一定通过样本点的中心(x, y);中心相同的样本点的回归方程不一定相同.
由一组样本数据(X1, y1),(x2, y2),…,(X n, y n)得到回归直线方程y = bx+ a,那么下面说法错
误.的是()
A .直线y=bx+ a必经过点(x, y)
B .直线y= bx+ a至少经过点(X1, y” ,(X2, y2),…,(X n, y n)中的一个点