最新高考数学总复习——第9章 第3节 变量间的相关关系与统计案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

i=1
yyii--y^yi22=1-94×118=1-18=78=0.875,
所以“污水净化量的差异”有87.5%是由年份引起的,这说明
回归方程预报的效果是良好的.
在线性回归分析中,只需利用公式求出回归直线方程 并利用其进行预测即可(注意回归直线过样本点的中心( x , y )),利 用回归方程进行预测,常把线性回归方程看作一次函数,求函数 值.
i=1
ti-
t
2∑ i=1
yi- y 2
线性回归方程y^=^a+b^t,
n
∑ b^=i=1
ti-
n
t
yi-
y
,^a=
y
-b^
t


i=1
ti- t 2
n
∑ 反映回归效果的公式为:R2=1-i=n1
yi-y^i2 ,

i=1
yi- y 2
其中R2越接近于1,表示回归的效果越好.
[解](1)由折线图中的数据得,
高考数学总复习
9.3 变量间的相关关 系与统计案例
1.两个变量的线性相关 (1)正相关 在散点图中,点散布在从 左下角 到 右上角 的区域,对于两个 变量的这种相关关系,我们将它称为正相关. (2)负相关 在散点图中,点散布在从 左上角 到 右下角 的区域,两个变量 的这种相关关系称为负相关.
(3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在 一条直线
4.某同学家里开了一个小卖部,为了研究气温对某种冷饮销售
量的影响,他收集了一段时间内这种冷饮每天的销售量 y(杯)与当天
最高气温 x(℃)的有关数据,通过描绘散点图,发现 y 和 x 呈线性相
关关系,并求得其回归方程^y=2x+60.如果气象预报某天的最高气温
为 34 ℃,则可以预测该天这种饮料的销售量为
2.对四组数据进行统计,获得如图所示的散点图,关于其相关 系数的比较,正确的是( )
A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3 C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3
A [由相关系数的定义以及散点图可知r2<r4<0<r3<r1.]
3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,
相关关系的直观判断方法就是作出散点图,若散点图 呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线 型也是有相关性,若呈图形区域且分布较乱则不具有相关性.
考点2 回归分析 线性回归分析
求线性回归直线方程的步骤 (1)用散点图或进行相关性检验判断两个变量是否具有线性相关 关系;
n
n
∑ (2)利用公式b^=i=1
x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=
1,2,…,n)都在直线y=-3x+1上,则这组样本数据的样本相关系
数为( )
A.-3
B.0
C.-1
D.1
C [在一组样本数据的散点图中,所有样本点(xi,yi)(i=
1,2,…,n)都在直线y=-3x+1上,所以b=-3<0,即这组样本数
ti- t 2
y
=2218=34,
所以^a= y -b^ t =54-34×4=51,
所以y关于t的线性回归方程为y^=b^t+^a=34t+51.
将2021年对应的t=10代入得y^=34×10+51=58.5,
所以预测2021年该企业污水净化量约为58.5吨.
7
∑ (3)因为R2=1-i=71
1.(2017·山东高考)为了研究某班学生的脚长x(单位:厘
米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测
量数据的散点图可以看出y与x之间有线性相关关系.设其回归直线
方程为y^=b^x+^a.已知∑i1=01xi=225,i∑1=01yi=1 600,b^=4.该班某学生的脚 长为24,据此估计其身高为( )
1.已知变量x和y近似满足关系式y=-0.1x+1,变量y 与z正相关.下列结论中正确的是( )
A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关
C [由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又 y与z正相关,所以z随y的增大而增大,减小而减小,所以z随x的增大 而减小,x与z负相关.]
xi-
n
x
yi-
y
=∑ i=1nxiyi-n
x
y


i=1
xi- x 2
∑ i=1x2i -n x 2
^a= y -b^ x 求得回归系数;
(3)写出回归直线方程.
如图是某企业2012年至2018年的污水净化量(单位:吨) 的折线图.
注:年份代码1~7分别对应年份2012~2018.
(1)由折线图看出,可用线性回归模型拟合y和t的关系,请用相 关系数加以说明;
理科 文科 男 13 10 女 7 20 已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.
根据表中数据,得到K2的观测值k=
50×13×20-10×72 23×27×20×30
≈4.844.则认为选修文科与性别有关系出错的可能性约为

5% [K2的观测值k≈4.844,这表明小概率事件发生.根据假设 检验的基本原理,应该断定“是否选修文科与性别之间有关系”成 立,并且这种判断出错的可能性约为5%.]
越大.
()
[答案](1)√ (2)√ (3)× (4)√
二、教材改编 1.在两个变量y与x的回归模型中,分别选择了4个不同模型, 它们的相关指数R2如下,其中拟合效果最好的是( ) A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.80 C.模型3的相关指数R2为0.50 D.模型4的相关指数R2为0.25 A [R2越接近于1,其拟合效果越好.]
解得m=39.故选D.]
非线性回归方程 非线性回归方程的求法 (1)根据原始数据作出散点图. (2)根据散点图,选择恰当的拟合函数. (3)作恰当变换,将其转化成线性函数,求线性回归方程. (4)在(3)的基础上通过相应变换,即可得非线性回归方程.
某公司为确定下一年度投入某种产品的宣传费,需了 解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千 元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据 作了初步处理,得到下面的散点图及一些统计量的值.
①年宣传费x=49时,年销售量及年利润的预报值是多少? ②年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直 线 v^ = α^ + β^ u的斜率和截距的最小二乘估计分别为 β^ =
一、思考辨析(正确的打“√”,错误的打“×”)
(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成
正相关关系.
()
(2)通过回归直线方程
可以估计预报变量的取值和变化趋
势.
()
(3)因为由任何一组观测值都可以求得一个线性回归方程,所以
没有必要进行相关性检验.
()
(4)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值
表中wi= xi,w]=18∑8 i=1wi.
(1)根据散点图判断,y=a+bx与y=c+d x哪一个适宜作为年销 售量y关于年宣传费x的回归方程类型;(给出判断即可,不必说明理 由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程; (3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的 结果回答下列问题:
(2)建立y关于t的回归方程,预测2021年该企业的污水净化量; (3)请用数据说明回归方程预报的效果.
7
参考数据: y =54,∑ i=1
(ti- t )(yi- y )=21,
7
14≈3.74,∑ i=1
(yi-y^i)2=94.
参考公式:相关系数r=
n

i=1
ti- t yi- y
n
n


据的两个变量负相关,且相关系数为-1.故选C.]
4.x和y的散点图如图所示,则下列说法中所有正确命题的序号


①x,y是负相关关系; ②在该相关关系中,若用y=c1ec2x拟合时的相关系数为r1,用 y^ =b^x+^a拟合时的相关指数为r2,则|r1|>|r2|; ③x,y之间不能建立线性回归方程. ①② [在散点图中,点散布在从左上角到右下角的区域,因此 x,y是负相关关系,故①正确;由散点图知用y=c1ec2x拟合比用 y^ = b^x+^a拟合效果要好,则|r1|>|r2|,故②正确;x,y之间可以建立线性 回归方程,但拟合效果不好,故③错误.]
2×2列联表
y1 y2
总计
x1 a b
a+b
x2 c d
c+d
总计 a+c b+d a+b+c+d
构造一个随机变量K2=
nad-bc2
_a_+_b_+__c_+_d____为样本容量. a+ba+cb+dc+d
,其中n=
[常用结论] 1.回归直线必过样本点的中心( x , y ). 2.当两个变量的相关系数|r|=1时,两个变量呈函数关系.
r的绝对值越接近于1,表明两个变量的线性相关性越强 .r的绝
对值越接近于0,表明两个变量之间 几乎不存在线性相关关系
.通
常|r|大于 0.75 时,认为两个变量有很强的线性相关性.
4.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的不同类别 ,像 这类变量称为分类变量. (2)列联表:列出两个分类变量的 频数表 ,称为列联表.假设有 两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其 样本频数列联表(称为2×2列联表)为
7
7
t =4,∑ i=1
(ti-
t
)2=28,∑ i=1
(yi- y )2=18,
所以r= 282×1 18≈0.935.
因为y与t的相关系数近似为0.935,说明y与t的线性相关程度相
当大,所以可以用线性回归模型拟合y与t的关系.
7
∑ (2)因为 y =54,b^=i=1
ti- t yi-
7

i=1
2.下面是2×2列联表:
y1 y2 总计
x1 a 21 73 x2 22 25 47 总计 b 46 120
则表中a,b的值分别为( )
A.94,72
B.52,50
C.52,74
D.74,52
C [∵a+21=73,∴a=52.又a+22=b,∴b=74.]
3.为了判断高中三年级学生是否选修文科与性别的关系,现随 机抽取50名学生,得到如下2×2列联表:
附近,就
称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
2.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的 ___距__离_的__平_方__和__最_小_______的方法叫做最小二乘法. (2)回归方程:方程 y^ = b^ x+ ^a 是两个具有线性相关关系的变量的 一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中 ^a , b^ 是 待定参数.
A.160
B.163
C.166
D.170
C
10
[∵i∑=1xi=225,∴
x
=110∑ i1=01xi=22.5.
10
∵∑ i=1yi=1
600,∴
y
=110i∑1=01yi=160.
又b^=4,∴^a= y -b^ x =160-4×22.5=70.
∴回归直线方程为y^=4x+70.
将x=24代入上式得y^=4×24+70=166.故选C.]
杯.
128 [由题意 x=34 时,该小卖部大约能卖出热饮的杯数^y=
2×34+60=128 杯.]
考点1 相关关系的判断 判定两个变量正、负相关的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关; 点的分布从左上角到右下角,两个变量负相关.
(2)相关系数:r>0时,正相关;r<0时,负相关. (3)线性回归直线方程中:b^>0时,正相关;b^<0时,负相关.
3.回归分析 (1)定义:对具有 相关关系
的两个变量进行统计分析的一种常
用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn, yn),其中 (-x ,-y ) 称为样本点的中心.
(3)相关系数
当r>0时,表明两个变量 正相关 ;
当r<0时,表明两个变量 负相关 .
2.某产品的广告费用x万元与销售额y万元的统计数据如表:
广告费用x(万元) 2 3 4 5
销售额y(万元) 26 m 49 54
根据上表可得回归方程y^=9x+10.5,则m的值为( )
A.36
B.37
C.38
D.39
D [由回归方程的性质,线性回归方程过样本点的中心,则 26+m+4 49+54=2+3+4 4+5×9+10.5,
相关文档
最新文档