深圳华侨城中学选修三第三单元《成对数据的统计分析》检测(答案解析)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、选择题
1.给出下列结论:在回归分析中
(1)可用相关指数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好; (2)可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)可用相关系数r 的值判断模型的拟合效果,r 越大,模型的拟合效果越好; (4)可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,不.正确的是( ) A .(1)(3) B .(2)(3)
C .(1)(4)
D .(3)(4)
2.已知变量x ,y 之间具有较强的线性相关性,测得它们的四组数据如表所示:
现已求得变量x ,y 之间的回归方程为2y ax =+,请根据给出的条件,预测9x =时,y 的值约为( ) A .45
-
B .52
-
C .
45
D .
52
3.广告投入对商品的销售额有较大影响,某电商对连续5个年度的广告费x 和销售额y 进行统计,得到统计数据如表(单位:万元):
由上表可得回归方程为10.2y x a =+,又已知生产该商品的成本(不含广告费)为
2325
x x
+(单位:万元),据此模型预测最大的纯利润为( ) A .30.15万元
B .21.00万元
C .19.00万元
D .10.50万元
4.已知()
()()()()2
2n ad bc K a b c d a c b d -=++++,n a b c d =+++.
在“数学文化大讲堂”活动中,某老师对“学生性别和喜欢数学文化是否有关”作了一次调查,其中被调查的女生人数是男生人数的1
2,男生喜欢数学文化的人数占男生人数的16
,女生喜欢数学文化的人数占女生人数2
3
,若有99%的把握认为是否喜欢数学文化和性别有关,则男生至少有( ) A .24人
B .22人
C .20人
D .18人
5.已知某产品的销售额y 与广告费用x 之间的关系如下表:
若求得其线性回归方程为 6.5ˆˆy
x a =+,其中ˆˆa y bx =-,则预计当广告费用为6万元时的销售额是() A .42万元
B .45万元
C .48万元
D .51万元
6.广告投入对商品的销售额有较大影响,某电商对连续5个年度的广告费x 和销售额y 进行统计,得到统计数据如下表(单位:万元) 广告费x 2 3 4 5 6 销售额y
29
41
50
59
71
由上表可得回归方程为,据此模型, 预测广告费为10万元时销售额约为( ) A .118.2万元
B .111.2万元
C .108.8万元
D .101.2万元
7.下列有关统计知识的四个命题正确的是( )
A .衡量两变量之间线性相关关系的相关系数r 越接近1,说明两变量间线性关系越密切
B .在回归分析中,可以用卡方2x 来刻画回归的效果,2x 越大,模型的拟合效果越差
C .线性回归方程对应的直线ˆˆˆy bx a =+至少经过其样本数据点中的一个点
D .线性回归方程0.51y x =+中,变量x 每增加一个单位时,变量y 平均增加1个单位 8.下列说法错误的是
A .对分类变量X 与Y ,随机变量K 2的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小
B .在回归直线方程y =0.2x+0.8中,当解释变量x 每增加1个单位时,预报变量y 平均增加0.2个单位
C .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
D .回归直线过样本点的中心(x ,y )
9.研究表明某地的山高()y km 与该山的年平均气温()x
C 具有相关关系,根据所采集的
数据得到线性回归方程ˆ260y x =-+,则下列说法错误..
的是( ) A .年平均气温为0时该山高估计为60km
B .该山高为72km 处的年平均气温估计为60C
C .该地的山高y 与该山的年平均气温x 的正负相关性与回归直线的斜率的估计值有关
D .该地的山高y 与该山的年平均气温x 成负相关关系
10.某次测量发现一组数据(,)i i x y 具有较强的相关性,并计算得 1.5y x ∧
=+,其中数据
1(1,)y 因书写不清楚,只记得1y 是[0,3]上的一个值,则该数据对应的残差(残差=真实值-预测值)的绝对位不大于0.5的概率为( ) A .
16
B .
56
C .
13
D .
23
11.下列四个命题:①在回归模型中,预报变量y 的值不能由解释变量x 唯一确定;②若变量x ,y 满足关系0.11y x =-+,且变量y 与z 正相关,则x 与z 也正相关;③在残差
图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;④以模型kx
y ce
=去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程
0.34z x =+,则4c e =,0.3k =.
其中真命题的个数为( ) A .1个
B .2个
C .3个
D .4个
12.以下四个命题中: ①函数关系是一种确定性关系;
②回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法; ③独立性检验中的统计假设就是假设相关事件A 、B 相互独立; ④某项测量结果ξ服从正态分布(
)2
1,N σ,且(5)0.81P ξ≤=,则(31)0.31P ξ-≤<=.
以上命题中,真命题的个数为( ) A .1个
B .2个
C .3个
D .4个
13.设两个变量x 和y 之间具有线性相关关系,它们的相关系数为r ,y 关于x 的回归直线方程为
y kx b =+,则( )
A .k 与r 的符号相同
B .b 与r 的符号相同
C .k 与r 的符号相反
D .b 与r 的符号相反
二、解答题
14.新冠肺炎疫情期间,各地均响应“停课不停学,停课不停教”的号召开展网课学习.为检验网课学习效果,某机构对2000名学生进行了网上调查,发现有些学生上网课时有家长在旁督促,而有些没有网课结束后进行考试,根据考试结果将这2000名学生分成“成绩上升”和“成绩没有上 升”两类,对应的人数如下表所示:
没有家长督促的学生 500
没有家长督促的学生
2000
(1)完成以上列联表,并通过计算(结果精确到0.001)说明,是否有90%的把握认为家长督促学生上网课与学生的成绩上升有关联
(2)从有家长督促的800名学生中按成绩是否上升,采用分层抽样的方法抽出8人,再从
8人中 随机抽取 3人做进一步调查,记抽到3名成绩上升的学生得1分,抽到1名成绩没有上升的学生得1-分,抽到3名生的总得分用X 表示,求X 的分布列和数学期望.
附:()()()()()
2
2
,n ad bc K n a b c d a b c d a c b d -=
=+++++++ ()20P K k ≥ 0.100 0.050 0.010 0.001
0k
2.706
3.841 6.835 10.828
15.某学校共有1000名学生,其中男生400人,为了解该校学生在学校的月消费情况,采取分层抽样随机抽取了100名学生进行调查,月消费金额分布在450~950之间.根据调查的结果绘制的学生在校月消费金额的频率分布直方图如图所示:
将月消费金额不低于750元的学生称为“高消费群”.
(1)求a 的值,并估计该校学生月消费金额的平均数(同一组中的数据用该组区间的中点值作代表);
(2)现采用分层抽样的方式从月消费金额落在[550,650),[750,850)内的两组学生中抽取10人,再从这10人中随机抽取3人,记被抽取的3名学生中属于“高消费群”的学生人数为随机变量X ,求X 的分布列及数学期望;
(3)若样本中属于“高消费群”的女生有10人,完成下列22⨯列联表,并判断是否有
97.5%的把握认为该校学生属于“高消费群”与“性别”有关?
属于“高消费群”不属于“高消费群”合计男
女
合计
(参考公式:
2
2
()
()()()()
n ad bc
K
a b c d a c b d
-
=
++++
,其中)
n a b c d
=+++
2
()
P K k0.150.100.050.0250.0100.0050.001
k 2.072 2.706 3.841 5.024 6.6357.87910.828
16.某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).
(1)根据以上数据完成下列22
⨯列联表:
主食蔬菜主食肉类总计
50岁以下
50岁以上
总计
(2)能否有99%的把握认为其亲属的饮食习惯与年龄有关?并写出简要分析.
参考公式和数据:
2
2
()
()()()()
n ad bc
K
a b c d a c b d
-
=
++++
,n a b c d
=+++.
()
2
P K k0.150.100.050.0250.0100.0050.001 0
k 2.072 2.706 3.841 5.024 6.6357.87910.828
17.忽如一夜春风来,翘首以盼的5G 时代,已然在全球“多点开花”,一个万物互联的新时代,即将呈现在我们的面前.为更好的满足消费者对流量的需求,中国电信在某地区推出六款不同价位的流量套餐,每款套餐的月资费x (单位:元)与购买人数y (单位:万人)的数据如表:
对数据作初步的处理,相关统计量的值如表:
其中ln i i v x =,ln i i y ω=,且绘图发现,散点(),i i v ω(6l i ≤≤)集中在一条直线附近. (1)根据所给数据,求y 关于x 的回归方程;
(2)按照某项指标测定,当购买人数y 与月资费x 的比在区间,97e e ⎛⎫
⎪⎝⎭
内,该流量套餐受大
众的欢迎程度更高,被指定为“主打套餐”,现有一家三口从这六款套餐中,购买不同的三款各自使用.记三人中使用“主打套餐”的人数为X ,求随机变量X 的分布列和期望. 附:对于一组数据()11,v ω,()22,v ω,…,()33,v ω,其回归直线bv a ω=+的斜率和截
距的最小二乘估计值分别为12
21
n
i i
i n
i
i v nv b v
nv
ω
ω
==-=
-∑∑,a bv ω=-.
18.双十一购物狂欢节,是指每年11月11日的网络促销日,源于淘宝商城(天猫)2009年11月11日举办的网络促销活动,已成为中国电子商务行业的年度盛事.某生产商为了了解其生产的产品在不同电商平台的销售情况,统计了A B 、两个电商平台各十个网络销售店铺的销售数据:
B 电商平台 60 80 97 77 96 87 76 83 94 96
(1)作出A B 、两个电商平台销售数据的茎叶图,根据茎叶图判断哪个电商平台的销售更好,并说明理由;
(2)填写下面关于店铺个数的22⨯列联表,并根据列联表判断是否有95%的把握认为销售量与电商平台有关;
销售量80> 销售量80≤ 总计
A 电商平台
B 电商平台
总计
(3)生产商要从这20个网络销售店铺销售量前五名的店铺中,随机抽取三个店铺进行销售返利,则其中恰好有两个店铺的销售量在95以上的概率是多少?
附:22
()()()()()
n ad bc K a b c d a c b d -=++++,n a b c d =+++.
()2P K k
0.050 0.010 0.001 k 3.841
6.635
10.828
19.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了
100个网箱,测量各箱水产品的产量(单位:kg ),其频率分布直方图如下:
(1)网箱产量不低于40kg 为“理想网箱”,填写下面列联表,并根据列联表判断是否有
99.9%的把握认为“理想网箱”的数目与养殖方法有关:
(2)已知旧养殖法100个网箱需要成本50000元,新养殖法100个网箱需要增加成本
15750元,该水产品的市场价格为x 元/()15kg x ≥,根据箱产量的频率分布直方图(说
明:同一组中的数据用该组区间的中间值作代表),采用哪种养殖法,请给养殖户一个较好的建议,并说明理由. 附参考公式及参考数据:
()
()()()()
2
0n ad bc k a b c d a c b d -=++++
20.为了解某地区足球特色学校的发展状况,某调查机构得到如下统计数据:
(1)根据上表数据,计算y 与x 的相关系数r ,并说明y 与x 的线性相关性强弱(已知:
0.751r ≤≤,则认为y 与x 线性相关性很强;0.30.75x ≤≤,则认为y 与x 线性相关性
一般,0.25r ≤,则认为y 与x 线性相关性较弱)
(2)求y 与x 的线性回归方程,并预测该地区2019年足球特色学校的个数(精确到个位) 参考公式:
()()
n
i
i
x x y y r --
=
∑()()2
2
1
1
,10, 3.6056n
n
i i i i x x y y ==-=-=≈∑∑;
()()
()
1
2
1
,n
i
i
i n
i
i x x y
y b a y bx x x ==--=
=--∑∑
21.近期,某学校举行了一次体育知识竞赛,并对竞赛成绩进行分组:成绩不低于80分的学生为甲组,成绩低于80分的学生为乙组.为了分析竞赛成绩与性别是否有关,现随机抽取了60名学生的成绩进行分析,数据如下图所示的22⨯列联表.
(1)将22⨯列联表补充完整,判断是否有90%的把握认为学生按成绩分组与性别有关? (2)如果用分层抽样的方法从甲组和乙组中抽取6人,再从这6人中随机抽取2人,求至少有1人在甲组的概率.
附:()()()()()
2
2
n ad bc K a b c d a c b d -=++++,n a b c d =+
++.
参考数据及公式:
22
.这次新冠肺炎疫情,是新中国成立以来在我国发生的传播速度最快、感染范围最广、防控难度最大的一次重大突发公共卫生事件.中华民族历史上经历过很多磨难,但从来没有被压垮过,而是愈挫愈勇,不断在磨难中成长,从磨难中奋起.在这次疫情中,全国人民展现出既有责任担当之勇、又有科学防控之智.某校高三学生也展开了对这次疫情的研究,一名同学在数据统计中发现,从2020年2月1日至2月7日期间,日期x 和全国累计报告确诊病例数量y (单位:万人)之间的关系如下表:
(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合y 与x 的关系?
(2)求出y 关于x 的线性回归方程y bx a =+(系数精确到0.01).并预测2月10日全国累计报告确诊病例数. 参考数据:
7
1
16.9
i
i y
==∑,7
1
77.5i i i x y ==∑ 1.88= 2.65≈.
参考公式:相关系数()()
n
i
i
x x y y r --=
∑
回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:
()()
1
n
i
i
i n
x x y y b =--=
∑,a y bx =-.
23.一只药用昆虫的产卵数y 与一定范围内的温度x 有关,现收集了该种药用昆虫的6组观测数据如下表:
经计算得:
61
()()557i
i
i x x y y =--=∑,6
2
1
()
84i
i x x =-=∑,6
21
()3930i i y y =-=∑线性回归模型的残差
平方和
6
2
1
()
236.64i
i
i y y =-=∑,8.06053167e ≈,
其中,i i x y 分别为观测数据中的温度和产卵数,1,2,3,4,5,6i =
(1)若用线性回归模型,求y 关于x 的回归方程ˆˆˆy
bx a =+(精确到0.1); (2)若用非线性回归模型求得y 关于x 的回归方程为0.2303ˆ0.06x y
e =,且相关指数20.9522R =.
①试与1中的回归模型相比,用2R 说明哪种模型的拟合效果更好.
②用拟合效果好的模型预测温度为35℃时该用哪种药用昆虫的产卵数(结果取整数)
附:一组数据1122(,),(,)
(,)n n x y x y x y 其回归直线ˆˆˆy bx a =+的斜率和截距的最小二乘估
计为1
2
1
()()
ˆ()
n
i
i
i n
i
i x x y
y b
x x ==--=-∑∑,ˆˆa
y bx =-;相关指数2
2
1
2
1
ˆ()1()
n
i
i
i n
i
i y y
R y y ==-=--∑∑.
24.某班主任对全班50名学生学习积极性和对待工作的态度进行了调查,统计数据如下所
示:
(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?
(2)试运用独立性检验的思想方法分析:有多大把握认为学生的学习积极性与对班级工作的态度有关系?并说明理由. 本题参考数据:
25.假设关于某设备的使用年限x (年)和所支出的维修费用y 万元有如下的统计资料:
(1)画出散点图并判断是否线性相关; (2)如果线性相关,求线性回归方程; (3)估计使用年限为10年时,维修费用是多少?
附注:①参考公式:回归方程y bx a =+中斜率和截距的最小二乘估计分别为
(
)() (
)
11
222
11
ˆˆ
ˆ,
n n
i i i i
i i
n n
i i
i i
x x y y x y nxy
b a y bx
x x x nx
==
==
---
===-
--
∑∑
∑∑
;
②参考数据:
5555
2
1111
20,25,90,112.3
i i i i i
i i i i
x y x x y
====
====
∑∑∑∑
26.司机在开机动车时使用手机是违法行为,会存在严重的安全隐患,危及自己和他人的生命.为了研究司机开车时使用手机的情况,交警部门调查了100名机动车司机,得到以下统计:在55名男性司机中,开车时使用手机的有40人,开车时不使用手机的有15
人;在45名女性司机中,开车时使用手机的有20人,开车时不使用手机的有25人.(1)完成下面的2×2列联表,并判断是否有99.5%的把握认为开车时使用手机与司机的性别有关;
(2)以上述的样本数据来估计总体,现交警部门从道路上行驶的大量机动车中随机抽检3辆,记这3辆车中司机为男性且开车时使用手机的车辆数为X,若每次抽检的结果都相互独立,求X的分布列和数学期望E(X).
参考公式与数据:()()()()
2
2
()
n ad bc
K
a b c d a c b d
-
=
++++
,其中n=a+b+c+d.
【参考答案】***试卷处理标记,请不要删除
一、选择题
1.B
解析:B
【分析】
由2
R越大,模型的拟合效果越好,2R越大,模型的拟合效果越好,相关系数r越大,模型的拟合效果越好,带状区域的宽度越窄,说明模型的拟合精度越高,作出判断即可.
【详解】
用相关指数2
R的值判断模型的拟合效果,2R越大,模型的拟合效果越好,故(1)正确;用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故(2)不正
确;
可用相关系数r 的值判断模型的拟合效果,r 越大,模型的拟合效果越好,故(3)不正确;
用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高,故(4)正确; 故选:B 【点睛】
本题主要考查了相关系数和相关指数的性质,属于中档题.
2.B
解析:B 【分析】
由已知求得x ,y ,代入2y ax =+求得a 值,则线性回归方程可求,取9x =求得y 值即可. 【详解】
1234
2.54
x +++=
=,1892130.7545105104y ⎛⎫=+++== ⎪⎝⎭,
0.752
0.52.5
a -∴=
=-,则线性回归方程为0.52y x =-+, 取9x =,得50.5922
y =-⨯+=-. 故选:B . 【点睛】
本题考查线性回归方程,明确线性回归方程恒过样本点的中心是关键,是基础题.
3.C
解析:C 【分析】
首先计算ˆa
,然后根据条件写出纯利润的函数()223214
10.29.29.2555x x x x x x ⎛⎫++-+=-++ ⎪⎝⎭
,再求其最大值.
【详解】
2345645x ++++=
=,2941505971505
y ++++==,
ˆ5010.24a
∴=⨯+,解得:ˆ9.2a =, ∴回归方程为ˆ10.29.2y x =+, 纯利润为()()222
3214110.29.29.27195555x x x x x x x ⎛⎫++-+=-++=--+ ⎪⎝⎭
, 当且仅当7x =时,纯利润取得最大值19.
故选:C 【点睛】
本题考查回归直线方程,数学建模,二次函数求最值,重点考查理解题意,并能抽象概括出函数,属于基础题型.
4.D
解析:D 【分析】
设男生至少有x 人,根据条件,列出22⨯联表,计算出2K ,令2K 6.635,即可求出.
【详解】
设男生至少有x 人,根据题意,可列出如下22⨯联表:
则2
3111532
6636118
22
x x x x x K x x x x x , 若有99%的把握认为是否喜欢数学文化和性别有关, 则2 6.635K >,即3
6.6358
x , 解得17.693x ,
由于表中人数都为整数,所以18x =, 即男生至少有18人. 故选:D. 【点睛】
本题考查独立性检验,属于基础题.
5.C
解析:C 【分析】
由已知求得样本点的中心的坐标,代入线性回归方程求得ˆa ,则线性回归方程可求,取6x =求得y 值即可.
【详解】
()10123425x =
++++=,()1
1015203035225
y =++++=, 样本点的中心的坐标为()2,22,
代入ˆ
ˆ
a y
b x =-,得22 6.529a =-⨯=.
y ∴关于x 得线性回归方程为 6.59y x =+.
取6x =,可得
6.56948(y =⨯+=万元). 故选:C . 【点睛】
本题考查线性回归方程的求法,考查计算能力,是基础题.
6.B
解析:B 【解析】
分析:平均数公式可求出x 与y 的值,从而可得样本中心点的坐标,代入回归方程求出a ,再将10x =代入回归方程得出结论. 详解:由表格中数据可得,4,50x y ==,
50410.2ˆa
∴=⨯+,解得9.2a =, ∴回归方程为10.2.2ˆ9y
x =+, ∴当10x =时,10.2109.21ˆ11.2y
=⨯+=, 即预测广告费为10万元时销售额约为111.2,故选B.
点睛:本题考查了线性回归方程的性质与数值估计,属于基础题. 回归直线过样本点中心
(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化
趋势.
7.A
解析:A 【解析】
分析:利用“卡方”的意义、相关指数的意义及回归分析的适用范围,逐一分析四个答案的真假,可得答案.
详解:A. 衡量两变量之间线性相关关系的相关系数r 越接近1,说明两变量间线性关系越密切,正确;
B. 在回归分析中,可以用卡方2x 来刻画回归的效果,2x 越大,模型的拟合效果越差,错误
对分类变量X 与Y 的随机变量的2x 观测值来说, 2x 越大,“X 与Y 有关系”可信程度越大; 故B 错误;
C. 线性回归方程对应的直线y bx a =+至少经过其样本数据点中的一个点,错误,回归直线y bx a =+可能不经过其样本数据点中的任何一个点;
D. 线性回归方程0.51y x =+中,变量x 每增加一个单位时,变量y 平均增加1个单位,错
误,由回归方程可知变量x 每增加一个单位时,变量y 平均增加0.5个单位. 故选A.
点睛:本题考查回归分析的意义以及注意的问题.是对回归分析的思想、方法小结.要结合实例进行掌握.
8.A
解析:A 【解析】
A .对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越大,“X 与Y 有关系”可信程度越大,因此不正确;
B .在线性回归方程ˆy
=0.2x+0.8中,当x 每增加1个单位时,预报量平均增加0.2个单位,正确;
C .两个随机变量相关性越强,则相关系数的绝对值越接近1,因此正确;
D .回归直线过样本点的中心(x ,y ),正确. 综上可知:只有A 不正确. 故选A .
9.B
解析:B 【分析】
由已知线性回归直线方程ˆ260y
x =-+,可估计平均气温为60C 时该地的山高,即可得到答案. 【详解】
线性回归直线方程为ˆ260y
x =-+,当0x = 时ˆ60y =即年平均气温为0时该山高估计为60km ,故A 正确;当ˆ72y
=时解得6x =-即山高为72km 处的年平均气温估计为6C -,故B 错误;该地的山高y 与该山的年平均气温x 的正负相关性与回归直线的斜率
的估计值有关,故C 正确;
由20-<,该地的山高y 与该山的年平均气温x 成负相关关系,故D 正确.故选B 【点睛】
本题考查线性回归直线方程的应用,考查相关的意义,判断能力,属于基础题.
10.C
解析:C 【分析】
求得估计值,用真实值减去估计值求得残差,根据已知残差的绝对位不大于0.5列不等式,解不等式求得1y 的取值范围,根据几何概型概率计算公式计算出所求概率. 【详解】
依题意可知,估计值为1 1.5 2.5+=,残差为1 2.5y -,依题意得1 2.50.5y -≤,解得
123y ≤≤,根据几何概型概率计算公式可得所求概率为
321
33
-=,故选C.
本小题主要考查残差的概念及计算,考查几何概型的计算,属于基础题.
11.C
解析:C 【分析】
直接利用回归直线的方程的应用,相关的变量关系的应用,残差图的应用分析结果. 【详解】 下列四个命题:
①在回归模型中,预报变量y 的值不能由解释变量x 唯一确定;根据回归模型中的变量关系,正确.
②若变量x ,y 满足关系0.11y x =-+,且变量y 与z 正相关,则x 与z 也正相关;应该是负相关.故错误.
③在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;即越接近于回归直线的距离越小,故正确.
④以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则4c e =,0.3k =.故正确. 故选:C . 【点睛】
此题考查回归分析和相关概念辨析,涉及非线性回归模型的处理方法以及对残差图的理解认识.
12.D
解析:D 【分析】
对四个命题一个一个进行判断. 【详解】
①函数关系是一种确定性关系,所以①是正确的;
②回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法, 所以②是正确的;
③独立性检验中的统计假设就是假设相关事件A 、B 相互独立,所以③是正确的; ④某项测量结果ξ服从正态分布(
)2
1,N σ,由正态分布定义可知它的图像是关于1x =对
称,
因为(5)0.81P ξ≤=,则(5)(3)10.810.19P P ξξ>=<-=-=, 所以()11
(31)(35)120.190.3122
P P ξξ-≤<=-≤≤=-⨯=,所以④是正确的; 故选:D 【点睛】
本题考查了对相关关系概念的理解、正态分布的对称性,属于一般题.
13.A
【分析】
根据相关系数知相关系数的性质:r 1≤,且r 越接近1,相关程度越大;且r 越接近0,相关程度越小.r 为正,表示正相关,回归直线方程上升,选出正确结果. 【详解】
相关系数r 为正,表示正相关,回归直线方程上升, r 为负,表示负相关,回归直线方程下降,
k ∴与r 的符号相同. 故选A . 【点睛】
本题考查用相关系数来衡量两个变量之间相关关系的方法,当相关系数为正时,表示两个变量正相关,当相关系数大于0.75时,表示两个变量有很强的线性相关关系.
二、解答题
14.(1)列联表见解析,有90%的把握认为家长督促学生上网课与学生的成绩上升有关联;(2)分布列见解析,数学期望为34
. 【分析】
(1)根据已知数据计算2K 的值,看是否大于190%10%-=的临界值,即可做出判定结论;
(2)利用超几何分布公式求出分布列,并利用期望的定义计算期望值. 【详解】 (1)
()22000500500300700125 3.472 2.7068001200120080036
K ⨯-⨯==≈>⨯⨯⨯
∴有90%的把握认为家长督促学生上网课与学生的成绩上升有关联.
(2)从有家长督促的800名学生中按成绩是否上升,采用分层抽样的方法抽出8人,其中成绩上升的有5人,成绩没有上升的有3人,再从8人中随机抽取3人,随机变量X 所有
可能的取值为3,1,1,3--
()0353381
356C C P X C ⋅=-==
()12533
815
156C C P X C ⋅=-== ()21533
815
128C C P X C ⋅=== ()30533
85
328
C C P X C ⋅=== X ∴的分布列如下:
()3113565656564
E X =-⨯
-⨯+⨯+⨯= 【点睛】
方法点睛:本题考查了独立性检验,考查了超几何分布,考查了离散型随机变量分布列和数学期望的计算,求解离散型随机变量分布列的步骤是: 首先确定随机变量X 的所有可能取值;
计算X 取得每一个值的概率,可通过所有概率和为1来检验是否正确; 进行列表,画出分布列的表格;
最后扣题,根据题意求数学期望或者其它.
15.(1)0.0035a =,平均数为670元;(2)分布列答案见解析,数学期望:
9
10
;(3)22⨯列联表答案见解析,有97.5%的把握认为该校学生属于“高消费群”与性别有关. 【分析】
(1)由频率分布直方图中频率和为1可求得a ,每组数据用该组区间的中点值乘以频率相加得均值;
(2)由频率分布直方图知从[550,650)中抽取7人,从[750,850)中抽取3人,随机变量X 的所有可能取值有0,1,2,3,求出各概率得分布列,然后由期望公式得期望; (3)样本中男生40人,女生60人属于“高消费群”的25人,其中女生10人,由频率分布直方图求出高消费群人数,可得高消费群中男生人数,从而可填写列联表,并计算出2K 后可得结论. 【详解】
(1)由题意知100(0.00150.00250.00150.001)1a ⨯++++=,解得0.0035a =,
样本平均数为5000.156000.357000.258000.159000.10670x =⨯+⨯+⨯+⨯+⨯=元. (2)由题意,从[550,650)中抽取7人,从[750,850)中抽取3人, 随机变量X 的所有可能取值有0,1,2,3.
337
3
10
()(0k k
C C P X k k C -===,1,2,3)所以随机变量X 的分布列为:
随机变量X 的数学期望()2312012012010
E X =
+⨯+⨯=. (3)由题可知,样本中男生40人,女生60人,属于“高消费群”的25人,其中女生10人;得出以下22⨯列联表:
2
()100(10251550)50
5.024()()()()257540609
n ad bc K a b c d a c b d -⨯-⨯===≈++++⨯⨯⨯,
所以有97.5%的把握认为该校学生属于“高消费群”与性别有关. 【点睛】
本题考查频率分布直方图,考查分层抽样,随机变量的概率分布列和数学期望,考查独立性检验.旨在考查学生的数据处理能力,运算求解能力. 16.(1)列联表见解析;(2)有,详见解析 【分析】
(1)根据表格所给数据填写22⨯列联表.(2)计算210 6.635K =>,由此判断有99%的把握认为其亲属的饮食习惯与年龄有关. 【详解】
(1)22⨯列联表如下:。