2022年新高考数学总复习:变量间的相关关系、统计案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2022年新高考数学总复习:变量间的相关关系、统计案例
知识点一 回归分析
(1)相关关系:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种__非确定性关系__.
(2)散点图:表示具有__相关__关系的两个变量的一组数据的图形叫做散点图,它可直观地判断两变量的关系是否可以用线性关系表示.若这些散点有y 随x 增大而增大的趋势,则称两个变量__正相关__;若这些散点有y 随x 增大而减小的趋势,则称两个变量__负相关__.
(3)回归方程:y ^=b ^
x +a ^
,其中b ^

∑n
i =1
x i y i -n x -y -
∑n
i =1x 2i -n x 2
,a ^=__y --b ^
x ,它主要用来估计和
预测取值,从而获得对这两个变量之间整体关系的了解.
(4)相关系数:r =
∑n
i =1
x i y i -n x -y -
(∑n
i =1x 2i -n x 2)(∑n
i =1
y 2i -n y 2
)
它主要用于相关量的显著性检验,以衡量它们之间的线性相关程度.当r >0时表示两个变量正相关,当r <0时表示两个变量负相关.|r |越接近1,表明两个变量的线性相关性__越强__;当|r |接近0时,表明两个变量间几乎不存在相关关系,相关性__越弱__.
知识点二 独立性检验 (1)2×2列联表
设X ,Y 为两个分类变量,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)如下:
(2)独立性检验
利用随机变量K 2(也可表示为X 2)=
n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d 为样本容量)来判断“两个变量有关系”
的方法称为独立性检验.
(3)独立性检验的一般步骤
①根据样本数据列出2×2列联表;
②计算随机变量K 2的观测值k ,查表确定临界值k 0:
③如果k ≥k 0,就推断“X 与Y 有关系\”,这种推断犯错误的概率不超过P (K 2≥k 0);否则,就认为在犯错误的概率不超过P (K 2≥k 0)的前提下不能推断“X 与Y 有关\”.
归纳拓展
1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性分布时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
2.独立性检验是对两个变量的关系的可信程度的判断,而不是对其是否有关系的判断.根据K 2的值可以判断两个分类变量有关的可信程度,并用来指导科研和实际生活.
双基自测
题组一 走出误区
1.判断下列结论是否正确(请在括号中打“√”或“×”)
(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √ ) (2)两个随机变量的线性相关性越强,相关系数的绝对值越接近于0.( × ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( √ )
(4)某同学研究卖出的热饮杯数y 与气温x (℃)之间的关系,得回归方程y ^
=-2.352x +147.767,则气温为2 ℃时,一定可卖出143杯热饮.( × )
(5)事件x ,y 关系越密切,则由观测数据计算得到的K 2的观测值越大.( √ ) (6)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( × )
题组二 走进教材
2.(P 97T2)为调查中学生近视情况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力( C )
A .回归分析
B .均值与方差
C .独立性检验
D .概率
[解析] “近视”与“性别”是两类变量,其是否有关,应用独立性检验判断. 3.(P 81例1)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^
=0.67x +54.9.
现发现表中有一个数据看不清,请你推断出该数据的值为__68__.
[解析] 由x -=30,得y -
=0.67×30+54.9=75. 设表中的“模糊数字”为a ,
则62+a +75+81+89=75×5,∴a =68. 题组三 走向高考
4.(2017·山东高考)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关
系,设其回归直线方程为y ^=b ^x +a ^
,已知∑10i =1x i =225,∑10i =1
y i =1 600,b ^
=4.该班某学生的脚长为24,据此估计其身高为( C )
A .160
B .163
C .166
D .170
[解析] 由题意知y ^=4x +a ^
又x =22.5,y =160,因此160=22.5×4+a ^,∴a ^=70,因此y ^
=4x +70,当x =24时,y ^
=4×24+70=166,故选C .
5.(2019·高考全国Ⅰ卷)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K 2=
n (ad -bc )2
(a +b )(c +d )(a +c )(b +d ).
[解析] (1)由调查数据,男顾客中对该商场服务满意的比率为40
50=0.8,
因此男顾客对该商场服务满意的概率的估计值为0.8. 女顾客中对该商场服务满意的比率为30
50=0.6,
因此女顾客对该商场服务满意的概率的估计值为0.6. (2)由题可得
K 2=
100×(40×20-30×10)2
50×50×70×30
≈4.762.
由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.
考点突破·互动探究
考点一相关关系的判断——自主练透
例1 (1)(2021·四川资阳模拟)在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是(B)
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%
B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%
C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%
D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%
(2)对四组数据进行统计,获得以下关于其相关系数的比较,正确的是(A)
A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3
[解析](1)观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%,故选B.
(2)由相关系数的定义及散点图所表达的含义,可知r2<r4<0<r3<r1.故选A.
名师点拨
判断两个变量正、负相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)相关系数:r >0时,正相关;r <0时,负相关.
(3)线性回归直线方程中:b ^
>0时,正相关;b ^
<0时负相关. 考点二 线性回归分析——师生共研
例2 (1)(2021·湖湘名校教育联合体联考)2020年3月15日,某市物价部门对5
家商场的某商品一天的销售量及其价格进行调查,5家商场的售价x (元)和销售量y (件)之间的一组数据如表所示:
价格x 9 9.5 10 10.5 11 按公式计算,y 与x 的回归直线方程是:y =-3.2x +a ,相关系数|r |=0.986,则下列说法不正确...
的是( D ) A .变量x ,y 线性负相关且相关性较强 B .a ^
=40
C .当x =8.5时,y 的估计值为12.8
D .相应于点(10.5,6)的残差约为0.4
[解析] (1)对A ,由表可知y 随x 增大而减少,可认为变量x ,y 线性负相关,且相关性强,故A 正确.对B ,价格平均x -=15(9+9.5+10+10.5+11)=10,销售量y -=1
5(11+10+
8+6+5)=8.故回归直线恒过定点(10,8),故8=-3.2×10+a ^⇒a ^
=40,故B 正确.对C ,当x =8.5时,y ^=-3.2×8.5+40=12.8,故C 正确.对D ,相应于点(10,8)的残差约为e ^
=6-(-3.2×10.5+40)=-0.4,故D 不正确.故选D .
名师点拨
线性回归分析问题的类型及解题方法
(1)求线性回归方程:
①利用公式,求出回归系数b ^
,a ^

②待定系数法:利用回归直线过样本点中心求系数. (2)利用回归方程进行预测:
把回归直线方程看作一次函数,求函数值.
(3)利用回归直线判断正、负相关:决定正相关还是负相关的是系数b ^
. 〔变式训练1〕
(2021·安徽六校教育研究会素质测试)某商场近5个月的销售额和利润额如表所示:
(1)画出散点图,观察散点图,说明两个变量有怎样的相关关系; (2)求出利润额y 关于销售额x 的回归直线方程;
(3)当销售额为4千万元时,利用(2)的结论估计该商场的利润额(百万元).
b ^

∑i =1n
x i y i -n x -y -

i =1
n
x 2i -n (x -)2=
∑i =1
n
(x i -x -)(y i -y -
)
∑i =1
n
(x i -x -
)2
,a ^=y --b x -.
[解析] (1)散点图如图所示:
两个变量正相关,且具有线性相关关系. (2)易求x -=6,y -
=3.2, 由公式有 b ^

3×2.2+1×0.2+0+1×0.8+3×1.832+12+12+32
=13
20=0.65, 且a ^
=3.2-0.65×6=-0.7, 则线性回归方程为y ^
=0.65x -0.7,
(3)当x =4时,由(1)可求得y ^
=1.9,即利润额约为1.9百万元. 考点三,独立性检验——师生共研
例3 (1)(2020·新高考Ⅰ,19)为加强环境保护,治理空气污染,环境监测部门对
某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO 2浓度(单位:μg/m 3),得下表:
SO
①估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
②根据所给数据,完成下面的2×2列联表:
SO2浓度有关.
附:K2=n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)

(2)
某校推迟2020年的春季线下开学,并采取了“停课不停学”的线上授课措施.为了解学生对线上课程的满意程度,随机抽取了该校的100名学生(男生与女生的人数之比为3∶2)对线上课程进行评价打分,若评分不低于80分视为满意,其得分情况的频率分布直方图如图所示,若根据频率分布直方图得到的评分不低于70分的频率为0.85.
①估计100名学生对线上课程评分的平均值;(每组数据用该组的区间中点值为代表)
②结合频率分布直方图,请完成以下2×2列联表,并回答能否有99%的把握认为对“线上教学是否满意与性别有关”;
K2=n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
,其中
n =a +b +c +d .
[解析] (1)①根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO 2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150的概率的估计值为64
100
=0.64.
②根据抽查数据,可得2×2列联表:
K 2=
100×(64×10-16×10)2
80×20×74×26
≈7.484.
由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO 2浓度有关. (2)①由已知得(0.015+b +0.03)×10=0.85, 解得b =0.04,
又(0.005+a )×10=1-0.85,解得a =0.01, 评分的平均值为
55×0.05+65×0.1+75×0.3+85×0.4+95×0.15=80. ②完成2×2列联表如下表:
K 2=100×(10×25-35×30)55×45×60×40
≈10.774>6.635,
∴有99%的把握认为对“线上教学是否满意与性别有关”.
名师点拨
解独立性检验的应用问题的关注点
(1)两个明确:
①明确两类主体.②明确研究的两个问题.
(2)两个关键:
①准确列出2×2列联表:②准确理解K2.
注意:查表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的k值与求得的K2相比较.另外,表中第一行数据表示两个变量没有关联的可能性p,所以其有关联的可能性为1-p.
〔变式训练2〕
(2021·广西钦州、崇左质检)某出租汽车公司决定更换一批新的小汽车以代替原来的报废的出租车,现有A,B两款车型,根据以往这两种出租车车型的数据,得到两款出租车型使用寿命频数表如下:
(1)填写下表,并判断是否有99%的把握认为出租车的使用寿命年数与汽车车型有关?
(2)司机师傅小李准备在一辆开了3年的A型车和一辆开了3年的B型车中选择,为了尽最大可能实现3年内(含3年)不换车,试通过计算说明,他应如何选择.
参加公式:K2=
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)

其中n=a+b+c+d.
参考数据:
[解析](1)根据题目所给数据得到如下2×2的列联考:
K 2
=200×(30×50-70×50)2
100×100×80×120
≈8.33>6.635,
所以有99%的把握认为出租车的使用寿命年数与汽车车型有关;
(2)记事件A 1,A 2分别表示小李选择A 型出租车和B 型出租车时,3年内(含3年)换车, 由表知P (A 1)=10+20+45100=0.75,
P (A 2)=15+35+40
100
=0.9,
因为P (A 1)<P (A 2),所以小李应选择A 型出租车.。

相关文档
最新文档