高考数学复习知识点专题提升训练51 变量间的相关关系、统计案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高考数学复习知识点专题提升训练
专题51 变量间的相关关系、统计案例
基础巩固组
1.相关变量的样本数据如下表,
经回归分析可得y 与x 线性相关,并由最小二乘法求得回归直线方程为y ^
=0.5x+2.3,下列说法正确的是( )
A.x 增加1时,y 一定增加2.3
B.变量x 与y 负相关
C.当y 为6.3时,x 一定是8
D.a=5.2
2.(多选)(2020海南中学高三月考)下列说法正确的是( )
A.在回归方程y ^=-0.85x+2.3中,当解释变量x 每增加1个单位时,预报变量y ^
平均减少2.3个单位
B.两个具有线性相关关系的变量,R 2的值越接近于0,则这两个变量的相关性就越强
C.若两个变量的R 2=0.88,则说明预报变量的差异有88%是由解释变量引起的
D.在回归方程y ^
=-0.85x+2.3中,样本点(1,1.2)的残差为-0.25
3.(多选)(2020吉林东北师大附中高三月考)某机构在研究性别与是否爱好拳击运动的关系中,通过收集数据得到如下2×2列联表:
经计算得
k=100×(35×28-15×22)2
50×50×57×43≈6.895.之后又对被研究者的身高进行了统计,得到男、
女身高分别近似服从正态分布N (175,16)和N (164,9),则下列选项中正确的是( )
A.在犯错误的概率不超过1%的前提下,认为“爱好拳击运动与性别有关”
B.在100个男生中,至少有一个人爱好打拳击
C.男生身高的平均数为175,男生身高的标准差为16
D.女生身高的平均数为164,女生身高的标准差为3
综合提升组
4.已知具有线性相关的变量x ,y ,设其样本点为A i (x i ,y i )(i=1,2,…,8),回归直线方
程为y ^
=1
2x+a ^,若OA 1⃗⃗⃗⃗⃗⃗⃗⃗ +OA 2⃗⃗⃗⃗⃗⃗⃗⃗ +…+OA 8⃗⃗⃗⃗⃗⃗⃗⃗ =(6,2)(O 为原点),则a ^
=( )
A.1
8
B.-1
8
C.1
4
D.-1
4
5.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x+a ^
.已知∑i=1
10x i =225,∑i=1
10
y i =1 600,b ^
=4.该班某学生的脚长为24厘米,据
此估计其身高为 厘米.
6.改革开放以来,我国经济持续高速增长.如图给出了我国2003年至2012年第二产业增加值与第一产业增加值的差值(以下简称为:产业差值)的折线图,记产业差值为
y (单位:万亿元).
注:年份代码1—10分别对应年份2003—2012
(1)求出y 关于年份代码t 的线性回归方程;
(2)利用(1)中的回归方程,分析2003年至2012年我国产业差值的变化情况,并预测我国产业差值在哪一年约为34万亿元;
(3)结合折线图,试求出除去2007年产业差值后剩余的9年产业差值的平均值及方差(结果精确到0.1).
附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^
=
∑i=1
n
(t i -t )(y i -y )
∑i=1
n
(t i -t )
2
,a ^
=y −b ^
t .
样本方差公式:s
2
=1n ∑i=1
n
(y i -y )2. 参考数据:y =
110∑i=110y i =10.8,∑i=110(t i -t )(y i -y )=132,∑i=1
10(y i -y )2
=211.6.
创新应用组
7.某研究机构在对具有线性相关的两个变量x 和y 进行统计分析时,得到如下数据.
由表中数据求得y 关于x 的回归方程为y ^=0.8x+a ^
,则在这些样本点中任取一点,该点落在回归直线上方的概率为( )
A.1
4 B.1
2 C.3
4 D.4
5
参考答案
1.D 由题设x 增加1时,y 可能增加0.5,当y 为6.3时,x 可能为8,变量x 与y 正相关,x =
1+2+3+4+5+6+7
7
=4,y =
2.9+
3.3+3.6+
4.4+4.8+a+
5.9
7
=
24.9+a 7,4×0.5+2.3=24.9+a
7
,解得a=5.2,故选D .
2.CD 对于A,根据回归方程,当解释变量x 每增加1个单位时,预报变量y ^
平均减少0.85个单位,故A 错误;
对于B,R 2的值越接近于1,两个变量的相关性就越强,故B 错误;
对于C,由R 2的意义可知C 正确;
对于D,当解释变量x=1时,预报变量y ^
=1.45,则样本点(1,1.2)的残差为-0.25,故D 正确.故选CD .
3.AD k ≈6.895>6.635,故A 正确;显然B 错误;
男生身高的标准差为4,故C 错误;显然D 正确.故选AD.
4.B 因为OA 1⃗⃗⃗⃗⃗⃗⃗⃗ +OA 2⃗⃗⃗⃗⃗⃗⃗⃗ +…+OA ⃗⃗⃗⃗⃗ 8=(x 1+x 2+…+x 8,y 1+y 2+…+y 8)=(8x ,8y )=(6,2),所以
8x =6,8y =2,解得x =34,y =14,因此14=12×3
4+a ^,即a ^
=-1
8,故选B .
5.166 由∑i=1
10
x i =225,∑i=1
10
y i =1 600,利用平均值公式求得x =22.5,y =160,
∵b ^
=4,∴a ^
=160-4×22.5=70,
∴当x=24时,y ^
=4×24+70=166,故答案为166. 6.解 (1)t =
110(1+2+3+…+9+10)=5.5,∑i=1
n (t i -t )2=(t 1-t )2
+…+(t 10-t )2
=2×(4.52
+3.52
+2.52
+1.52
+0.52
)=82.5.
b ^
=
132
82.5
=1.6,a ^=y −b ^t =10.8-1.6×5.5=2,故回归方程是y ^=1.6t+2.
(2)由(1)知,b ^
=1.6>0,故2003年至2012年我国产业差值逐年增加, 平均每年增加1.6万亿元.
令1.6t+2=34,解得t=20,故预测在2022年我国产业差值为34万亿元.
(3)结合折线图,2007年产业差值为10.8万亿元,除去2007年(t=5时)产业差值外的9年的产业差值平均值为1
9×(10×10.8-10.8)=10.8.
又因为∑i=110
(y i -y )2=211.6,故除去2007年(t=5时)产业差值外的9年的产业差值的方
差为1
9×[211.6-(10.8-10.8)2]≈23.5.
7.B ∵x =
1+2+3+4
4
=
52
,y =12+32+2+3
4
=7
4
,
∴7
=0.8×5
+a ^,∴a ^
=-1
,
因此点(4,3),(2,3
2)在回归直线y ^
=0.8x-0.25上方,概率为24=1
2,故选B .。

相关文档
最新文档