2020高考数学 总复习 10.4 变量间的相关关系、统计案例
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A.0.01
B.0.025
C.0.10 D.0.05
知识梳理 考点自测
K2=502×7(×1283××1254-8××296)2
-12-
-13-
知识梳理 考点自测
5.(2018辽宁葫芦岛二模,15改编)下列说法:
①线性回归方程^������ = ^bx+^������必过点(������, ������);
-1-
知识梳理 考点自测
1.变量间的相关关系
(1)定义:常见的两变量之间的关系有两类:一类是函数关系,另一
类是 相关关系
.当自变量取值一定时,因变量的取值带
有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不
同,相关关系是一种 非确定性关系
.
(2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做
^
������
=
∑ (������������
������=1
-������)(������������-������)
������
∑
(������������-������)2
������=1
=
������∑=1������������������������-������������ ������ ������∑=������1���������2��� -������������2
.
������=∑������1(������������-������)2������=∑������1(������������-������)2
当r>0时,表明两个变量正相关; 当r<0时,表明两个变量负相关. r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对 值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常 当|r|大于0.75时,认为两个变量有很强的线性相关性.
-20-
考点1
考点2
考点3
对点训练1(1)(2018河北张家口模拟,4)已知x,y是两个变量,下列 四个散点图中,x,y呈正相关趋势的是 ( A )
-21-
考点1
考点2
考点3
(2)(2018湖南长沙模拟,11)某市国庆节7天假期的楼房认购量(单 位:套)与成交量(单位:套)的折线图如图所示,小明同学根据折线图
对这7天的认购量与成交量作出如下判断:①日成交量的中位数是 16;②日成交量超过日平均成交量的有2天;③认购量与日期正相关; ④10月7日认购量的增量大于10月7日成交量的增量.上述判断中错
误的个数为( C )
A.1 B.2 C.3 D.4
考点1
考点2
考点3
-22-
解析: (1)x,y呈正相关趋势时,散点图应该是从左下到右上趋势, 由题图可知选项A中的散点图是从左下到右上趋势,描述了y随着x 的增加而增加的变化趋势,故选A.
②在线性回归模型中,相关指数R2表示解释变量x对于预报变量y
的贡献率,R2越接近于1,表示回归效果越好;
预③④报相在变关 回量系 归^������平数直均r线越减方小少程,表0^���.5���明=个-两0单.个5位x变+;2量中相,当关解性释越变弱量; x每增加一个单位时,
⑤在一个2×2列联表中,由计算得K2=8.079,则在犯错误的概率不
2
附:K2=(������+������)(������������+(������������������)-(���������������+���)������)(������+������)
P(K2>k0) 0.15 0.10 0.05 0.025 0.01 0.001
k0
2.072 2.706 3.841 5.024 6.635 10.828
A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3 C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3
-17-
考点1
考点2
考点3
(2)(2018福建宁德5月质检,3)右图是具有相关关系的两个变量的 一组数据的散点图和回归直线,若去掉一个点使得余下的5个点所 对应的数据的相关系数最大,则应当去掉的点是( B )
A.D B.E C.F D.A
考点1
考点2
考点3
-18-
解析: (1)题中图1和图3是正相关,相关系数大于0;图2和图4是负 相关,相关系数小于0;图1和图2的点相对更加集中,所以相关性要强, 所以r1接近于1,r2接近于-1,由此可得r2<r4<r3<r1,故选A.
(2)因为相关系数的绝对值越大,越接近于1,则说明两个变量的相 关性越强.因为点E到直线的距离最远,所以去掉点E,余下的5个点 所对应的数据的相关系数最大,故选B.
万元,故选 B.
-11-
知识梳理 考点自测
4.(2018山西大同、阳泉二模,4)某班主任对全班50名学生进行了作 业量的调查,数据如表:
认为作业量大 认为作业量不大 合计
男生 18
9
27
女生 8
15
23
合计 26
24
50
若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的
概率不超过( B )
超过0.01的前提下认为这两个变量之间有关系;
⑥对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有
关系”的把握程度越大.
其中正确的说法是
.(把你认为正确的结论都写在横
线上)
知识梳理 考点自测
-14-
本题可参考独立性检验临界值表:
P(K2≥k) 0.100 0.050 0.025
k
2.706 3.841 5.024
中心的一条直线附近,称两个变量之间具有线性相关关系,这条直
线叫做
回归直线
.
(2)回归方程^������ = ^bx+^������是两个具有线性相关关系的变量的一组
数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中^������ ,
^
������ 是待定系数.
������
������
(2)2×2列联表:假设有两个分类变量X和Y,它们的值域分别为 {x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:
y1
y2
合计
x1
a
b
a+b
x2cdc Nhomakorabead总计 a+c b+d a+b+c+d
K2=(������+������)(������������+(������������������)-(���������������+���)2������)(������+������)(其中 n=a+b+c+d 为样本容量).
表示回归效果越好,故②正确;相关系数 r 绝对值越小,表明两个变量
相关性越弱,故③错误;在回归直线方程^������=-0.5x+2 中,当解释变量 x 每增加一个单位时,预报变量^������平均减少 0.5 个单位是正确的,因为回
归方程并不是样本点都落在方程上,故只能是估计值,所以说是平均
增长,故④正确;在一个 2×2 列联表中,由计算得 K2=8.079,在犯错误 的概率不超过 0.01 的前提下认为这两个变量之间有关系,故⑤正确;
费时,销售额的预报值为( B ) A.75万元 B.85万元 C.99万元 D.105万元
知识梳理 考点自测
-10-
解析:由题意得������ = 15(2+4+5+6+8)=5,������ = 15(30+40+50+60+70)
=50,∴样本点的中心为(5,50).∵回归直线^������=7x+^a 过样本点的中心 (5,50),∴50=7×5+^������,解得^������ =15,∴回归直线方程为^������=7x+15.当 x=10 时,^������=7×10+15=85,故当投入 10 万元广告费时,销售额的预报值为 85
考点1
考点2
考点3
-19-
思考如何判断两个变量有无相关关系? 解题心得判断相关关系的两种方法 (1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变 量之间就有相关关系.如果所有的样本点都落在某一直线附近,变 量之间就有线性相关关系. (2)相关系数法:利用相关系数判定,当|r|越趋近于1相关性就越强.
知识梳理 考点自测
-5-
(5)回归分析模型拟合效果的判断
R2=1-���������=∑������=∑���������11((���������������������-���-^���������������)���)22,R2 越接近于 1,表示回归效果越好.
-6-
知识梳理 考点自测
3.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类 变量称为分类变量.
-9-
知识梳理 考点自测
3.(2018辽宁丹东二模,5)已知某种商品的广告费支出x(单位:万元) 与销售额y(单位:万元)之间有如下对应数据:
x2 4 5 6 8 y 30 40 50 60 70
根据上表可得回归方程^������ = ^bx+^������,计算得^������=7,则当投入 10 万元广告
2.(2018黑龙江仿真模拟七,3)为了规定工时定额,需要确定加工零 件所花费的时间,为此进行了5次试验,得到5组数据:(x1,y1),(x2,y2),
(最x3小,y3二),(乘x4法,y4求),(得x5,回y5)归.根直据线收方集程到为的^������数=据0.可67知x+x514+.9x,2则+xy3+1+xy4+2+xy5=3+1y540+,y由5
知识梳理 考点自测
-2-
(4)非线性相关:若散点图上所有点看上去都在 某条曲线 附 近波动,则称此相关为非线性相关.此时,可以用 一条曲线 来 拟合.
(5)不相关:如果所有的点在散点图中 没有显示任何关系 , 那么称变量间是不相关的.
-3-
知识梳理 考点自测
2.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图
散点图,它可直观地判断两个变量的关系是否可以用线性关系表示.
若这些散点分布在从左下角到右上角的区域,则称两个变量正相关;
若这些散点分布在从左上角到右下角的区域,则称两个变量负相关.
(3)线性相关关系、回归直线:如果散点图中点的分布从整体上看
大致在
一条直线附近
,就称这两个变量之间具有线
性相关关系,这条直线叫做回归直线.
,
^������
=
^
������-������
������.
-4-
知识梳理 考点自测
������
(3)通过求 Q= ∑ (yi-bxi-a)2 的最小值而得到回归直线的方法,即
������=1
使得样本数据的点到回归直线的距离的平方和最小的方法叫做最
小二乘法.
������
(4)相关系数 r= ������=∑1(������������-������)(������������-������)
的值为( C )
A.75 B.155.4
C.375 D.466.2 解析:由题意可得������ = ������1+������2+���5���3+������4+������5=30,线性回归方程过样本
点的中心,则������=0.67×������+54.9=75,据此可知:y1+y2+y3+y4+y5=5������=375, 故选 C.
系表示. ( √ ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.
(√ ) (4)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越
大. ( √ ) (5)通过回归方程
^������
=
^bx+^������
可以估计和观测变量的取值和变化
趋势. ( √ )
知识梳理 考点自测
-8-
对分类变量 X 与 Y 的随机变量 K2 的观测值 k 来说,k 越小,“X 与 Y 有
关系”的把握程度越小,故⑥错误.综上,答案为①②④⑤.
-16-
考点1
考点2
考点3
相关关系的判断
例1(1)(2018北京八中乌兰察布分校期末,10)对四组数据进行统 计,获得以下散点图,关于其相关系数的比较,正确的是( A )
答案:①②④⑤
0.010 6.635
0.001 10.828
-15-
知识梳理 考点自测
解析:线性回归方程^������ = ^������x+^������必过样本点的中心(������, ������),故①正确;相
关指数 R2 表示解释变量 x 对于预报变量 y 的贡献率,R2 越接近于 1,
(3)用K2的大小可以决定是否拒绝原来的统计假设H0,若K2值较大, 就拒绝H0,即拒绝事件A与B无关.
-7-
知识梳理 考点自测
1.判断下列结论是否正确,正确的画“√”,错误的画“×”.
(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关
系. ( × )
(2)利用散点图可以直观判断两个变量的关系是否可以用线性关